色综合图-色综合图片-色综合图片二区150p-色综合图区-玖玖国产精品视频-玖玖香蕉视频

您的位置:首頁(yè)技術(shù)文章
文章詳情頁(yè)

python 爬取知乎回答下的微信8.0狀態(tài)視頻

瀏覽:124日期:2022-06-24 11:32:19

微信 8.0 版本更新后,可以設(shè)置個(gè)人狀態(tài),狀態(tài)里面可以添加火錄制視頻,很快狀態(tài)視頻就火了,可以看下知乎熱榜有沒有微信8.0狀態(tài)沙雕又可愛的視頻或圖片?[1]。比如我也設(shè)置了一個(gè):

于是我就想把這些視頻下載下來,也玩一玩。本文講述如何使用 Python 一鍵下載知乎某個(gè)回答下的所有視頻。

思路:分析知乎回答頁(yè)面 -> 定位視頻 -> 尋找視頻播放的 url -> 下載。其實(shí)就兩步:找到 url,然后下載。

尋找 url

一個(gè)回答下面可能有多個(gè)視頻,先分析一個(gè)視頻,打開谷歌瀏覽器的開發(fā)者工具窗口,找到 network,勾選 preserve log、disable cache,選擇 xhr,刷新,很容易找到如下圖所示的接口:

python 爬取知乎回答下的微信8.0狀態(tài)視頻

從上圖接口返回的數(shù)據(jù)就可以獲取視頻播放的 url、標(biāo)題、格式等信息,這就夠了,復(fù)制 play_url,放在瀏覽器上看一下,發(fā)現(xiàn)可以直接下載,說明那么這個(gè) url 就是我們需要的。

python 爬取知乎回答下的微信8.0狀態(tài)視頻

接下來,寫代碼,獲取接口返回的數(shù)據(jù):

def get(url: str) -> list: ''' 獲取知乎視頻的 url 返回格式 [{’url’:’’, ’title’,’format’:’’,},{}] ''' data = [] headers = { 'user-agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 11_1_0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.88 Safari/537.36', } with requests.get(url, headers=headers, timeout=10) as rep: if rep.status_code == 200: ids = re.findall(r'www.zhihu.com/zvideo/(d{1,})', rep.text) ids = list(set(ids)) # 去掉重復(fù)元素 else: print(f'網(wǎng)絡(luò)連接失敗,狀態(tài)碼 { rep.status_code }') return [] if not ids: print('視頻獲取失敗,可能是這個(gè)頁(yè)面沒有視頻') return [] for id in ids: print(id) with requests.get( f'https://www.zhihu.com/api/v4/zvideos/{id}/card', headers=headers, timeout=10, ) as rep: if rep.status_code == 200:ret_data = rep.json()playlist = ret_data['video']['playlist']title = ret_data.get('title')temp = playlist.get('ld') or playlist.get('sd')if temp: sigle_video = {} sigle_video['url'] = temp.get('play_url') sigle_video['title'] = title sigle_video['format'] = temp.get('format') data.append(sigle_video) else:print(f'網(wǎng)絡(luò)連接失敗,狀態(tài)碼 { rep.status_code }')return [] return data下載視頻

這個(gè)比較簡(jiǎn)單了,直接請(qǐng)求視頻播放的 url,將流式的內(nèi)容保存到文件中,最多再加個(gè)進(jìn)度條的展示。部分視頻獲取的 title 為空,這時(shí)就使用時(shí)間戳來命名文件。

請(qǐng)看代碼:

def download( file_url, file_name=None, file_type=None, save_path='download', headers=None, timeout=15,): ''' :param file_url: 下載資源鏈接 :param file_name: 保存文件名,默認(rèn)為當(dāng)前日期時(shí)間 :param file_type: 文件類型(擴(kuò)展名) :param save_path: 保存路徑,默認(rèn)為download,后面不要'/' :param headers: http請(qǐng)求頭 ''' if file_name is None or file_name == '': file_name = str(datetime.now()) if file_type is None: if '.' in file_url: file_type = file_url.split('.')[-1] else: file_type = 'uknown' file_name = file_name + '.' + file_type if headers is None: headers = { 'User-Agent': 'Mozilla/5.0 (iPhone; CPU iPhone OS 9_1 like Mac OS X) AppleWebKit/601.1.46 (KHTML, like Gecko) Version/9.0 Mobile/13B137 Safari/601.1' } if os.path.exists(save_path): pass else: os.mkdir(save_path) # 下載提示 if os.path.exists(f'{save_path}/{file_name}'): print(f'033[33m{file_name}已存在,不再下載!033[0m') return True print(f'Downloading {file_name}') try: with requests.get( file_url, headers=headers, stream=True, timeout=timeout ) as rep: file_size = int(rep.headers['Content-Length']) if rep.status_code != 200:print('033[31m下載失敗033[0m')return False label = '{:.2f}MB'.format(file_size / (1024 * 1024)) with click.progressbar(length=file_size, label=label) as progressbar:with open(f'{save_path}/{file_name}', 'wb') as f: for chunk in rep.iter_content(chunk_size=1024): if chunk: f.write(chunk) progressbar.update(1024) print(f'033[32m{file_name}下載成功033[0m') except Exception as e: print('下載失敗: ', e) return True執(zhí)行代碼下載:

import os, sysimport reimport clickimport requestsfrom datetime import datetimedef get(url: str) -> list: #見上文 ...def download( file_url, file_name=None, file_type=None, save_path='download', headers=None, timeout=15,): #見上文 ...if __name__ == '__main__': videos = get(sys.argv[1]) for video in videos: download(file_url = video[’url’],file_name= video[’title’] ,file_type= video[’format’],save_path=’./download’)

執(zhí)行結(jié)果如下圖所示:

最后的話

網(wǎng)站可能會(huì)發(fā)生變更,因此本文的代碼可能隨著時(shí)間變化而無法使用,請(qǐng)自行調(diào)節(jié)一些正則表達(dá)式和參數(shù)。爬取的思路是通用的,無非就是找到視頻的流式數(shù)據(jù),進(jìn)行保存。思路有了,編寫代碼就是體力活了。

此外,如果你只是想要一些酷炫、搞笑、可愛的視頻資源,玩一下微信 8.0 的狀態(tài),請(qǐng)?jiān)诠娞?hào)「Python七號(hào)」回復(fù)「視頻」,即可獲取微信 8.0 的狀態(tài)視頻合集的下載鏈接:

python 爬取知乎回答下的微信8.0狀態(tài)視頻

回答來源

有沒有微信8.0狀態(tài)沙雕又可愛的視頻或圖片?: https://www.zhihu.com/question/441253090

以上就是python 爬取知乎回答下的微信8.0狀態(tài)視頻的詳細(xì)內(nèi)容,更多關(guān)于python 爬取知乎視頻的資料請(qǐng)關(guān)注好吧啦網(wǎng)其它相關(guān)文章!

標(biāo)簽: 微信 Python
相關(guān)文章:
主站蜘蛛池模板: 亚洲欧美一区二区三区在线播放 | 成人午夜大片免费看爽爽爽 | 亚洲美女中文字幕 | 国产看片一区二区三区 | 手机免费看毛片 | 五月久久亚洲七七综合中文网 | 视频在线观看一区 | 亚洲人成一区二区三区 | 九九九九精品视频在线播放 | 中文字幕 亚洲 一区二区三区 | m男亚洲一区中文字幕 | 手机在线色 | 玖草资源在线 | 国产精品亚洲视频 | 国产成人黄色 | 视频在线一区二区 | 亚洲精品国产拍拍拍拍拍 | 亚洲国产影院 | 亚洲精品视频观看 | 日韩一区二区天海翼 | 亚洲精品成人一区二区www | 看美女毛片 | 欧美成人精品欧美一级乱黄 | 欧美一级淫片a免费播放口aaa | 伊人五月天婷婷琪琪综合 | 亚洲网在线观看 | 视频一区精品 | 欧美一级视频在线 | 欧美人与zoxxxx另类9 | 看全黄男人和女人视频 | 麻豆md国产在线观看 | 日本一级级特黄特色大片 | 男女牲高爱潮免费视频男女 | 亚州中文字幕 | 免费一级毛片在播放视频 | 国产福利久久 | 久久日本精品一区二区免费 | 一级毛片免费不卡在线视频 | 亚洲一级黄色毛片 | 成年女人免费视频 | 久久久一本精品99久久精品66 |