色综合图-色综合图片-色综合图片二区150p-色综合图区-玖玖国产精品视频-玖玖香蕉视频

您的位置:首頁技術文章
文章詳情頁

如何用Python一次性下載抖音上音樂

瀏覽:12日期:2022-06-19 15:37:34
目錄Python 鏈接抖音爬蟲實現分析熱歌榜內容網頁解析巧用eval代碼實現Python 鏈接抖音

python下載抖音內容的帖子網上有一些,但都比較麻煩,需要通過adb連接安卓手機后,模擬操作。我這么懶,這種事兒玩不來…那么,該如何獲取抖音內容呢?網上搜了下大概有兩種方式,一個是瀏覽器插件快抖,另外一個是我今天要說的抖音網頁版。其實這兩者差別不是很大,都是先將抖音內容下載至服務器后,通過開發簡單網站配置域名后,讓大家訪問。讓我們來看看抖音網頁版:

如何用Python一次性下載抖音上音樂

爬蟲實現分析熱歌榜內容

如何用Python一次性下載抖音上音樂

大家先開看看這個抖音熱歌榜歌曲,每頁20首歌曲,一個55頁。但細不細心大家都能發現,很多歌曲存在重復的問題。所以,等下爬蟲的時候,我們需要先準備一個music_list,用來識別這首歌曲是否已經下載過了…

網頁解析

如何用Python一次性下載抖音上音樂

網頁比較簡單,一個div中包裹了一個ul>li*20,我們是不是該這樣獲取:

soup.find(’div’,{'class':'pull-left'}).find(’ul’).findAll(’a’)

如果你說是,那么一定沒有好好看我前天整理的文章通過哪吒豆瓣影評,帶你分析python爬蟲快速入門:https://www.jianshu.com/p/ae38f7607902,我在文章中專門提到了一個小技巧,通過使用attr的屬性進行快速解析,那么最快速的獲取方式是:

soup.findAll(’a’, attrs={’onclick’: True})

我們只需要獲取所有的a標簽,切這些標簽中包含onclick這個屬性即可。

巧用eval

我們解析到的內容通過attr[‘onclick’],可以得到他的屬性open1(‘夜’,’http://p9-dy.byteimg.com/obj/61a20007a98954b0831d),如何能快速獲取歌曲名字和url呢?這里我們需要用到一個eval的小技巧:

index = 'open1(’夜’,’http://p9-dy.byteimg.com/obj/61a20007a98954b0831d’,’’)'index[5:]'(’夜’,’http://p9-dy.byteimg.com/obj/61a20007a98954b0831d’,’’)'index_tuple = eval(index[5:])print(index_tuple, type(index_tuple))(’夜’, ’http://p9-dy.byteimg.com/obj/61a20007a98954b0831d’, ’’) <class ’tuple’>index_tuple[0]’夜’index_tuple[1]’http://p9-dy.byteimg.com/obj/61a20007a98954b0831d’

ps:今天一個朋友說我寫代碼沒注釋,我這是現身說法的告訴你,如何能寫出讓別人壓根看不懂的代碼,就是不寫注釋啊,哈哈!其實,代碼我都在文章中一點一點的講解了,所以沒有寫,但秉承著害怕大佬們取關的心態,我還是把注釋加上吧…

代碼實現

總體來說實現比較簡單,全部代碼如下:

import osimport requestsfrom bs4 import BeautifulSoupimport threadingimport timeclass DouYinMusic: def __init__(self):self.music_list = []self.path = self.download_path() @staticmethod def download_path():'''獲取代碼執行目錄,并在目錄下創建Music文件夾:return Music文件夾全路徑'''base_dir = os.path.dirname(os.path.abspath(__file__))_path = os.path.join(base_dir, 'Music')if not os.path.exists(_path): os.mkdir(_path)return _path def get_request(self, url):'''封裝requests.get方法如果為網頁請求,返回網頁內容否則,解析音樂地址,并返回音樂二進制文件:param url: 請求url(分網頁、音樂兩類):return: 網頁內容 & 音樂二進制文件'''r = requests.get(url, timeout=5)if url.endswith(’html’): return r.textelse: return r.content def analysis_html(self, html):'''根據獲取的網頁內容,解析音樂名稱、下載地址調用音樂下載方法:param html: 網頁內容'''soup = BeautifulSoup(html, ’lxml’)# 根據關鍵字onclick查找每個下載地址for tag_a in soup.findAll(’a’, attrs={’onclick’: True}): # 下載格式’('name','link','')’,通過eval將str轉化為tuple類型 link_list = eval(tag_a[’onclick’][5:]) music_name, music_link = link_list[:2] # 因為存在部分重復音樂,故設置判斷下載過的音樂跳過 if music_name in self.music_list:continue self.music_list.append(music_name) t = threading.Thread(target=self.download_music, args=(music_name, music_link)) time.sleep(0.5) t.start() def download_music(self, music_name, music_link):'''解析音樂文件,完成音樂下載:param music_name: 音樂名稱:param music_link: 下載地址'''_full_name = os.path.join(self.path, music_name)with open(_full_name + ’.mp3’, ’wb’) as f: f.write(self.get_request(music_link))print('抖音音樂:{} 下載完成'.format(music_name)) def run(self):'''主方法,用于批量生成url'''for page in range(1,55): url = 'http://douyin.bm8.com.cn/t_{}.html'.format(page) html = self.get_request(url) self.analysis_html(html)if __name__ == ’__main__’: main = DouYinMusic() main.run()

來讓我們看看效果吧:

如何用Python一次性下載抖音上音樂

網站是通過nginx負載均衡搭建的,有一些鏈接已經失效了。最終下載了不重復的592首抖音音樂。

如何用Python一次性下載抖音上音樂

同樣的,大家喜歡可以按照這種方法,嘗試下載一下網站的抖音視頻。

以上就是如何用Python一次性下載抖音上音樂的詳細內容,更多關于Python一次性下載抖音上音樂的資料請關注好吧啦網其它相關文章!

標簽: 抖音 Python
相關文章:
主站蜘蛛池模板: 久久久久久国产精品免费免 | 在线视频99 | 成人国产精品免费视频 | 一级黄色片aaa | 一级成人a免费视频 | 大尺度福利视频在线观看网址 | 国产大乳孕妇喷奶水在线观看 | 欧美成人性色大片在线观看 | 免费一级大毛片a一观看不卡 | 成人男女视频 | 成年女人免费毛片视频永久 | 国产一级一级毛片 | 亚洲人成综合网站在线 | 暴操美女 | xxxxx性欧美 xxxx肥婆性bbbb欧美 | 亚洲欧美日韩精品久久亚洲区 | 中文字幕在线视频网站 | www.黄色大片 | 二区在线观看 | 黄色作爱 | 华人色| 在线观看免费av网站 | 国产美女一区二区三区 | 国产精品女上位在线观看 | 免费a级毛片大学生免费观看 | 欧美性色生活片免费播放 | 分享一个无毒不卡免费国产 | 日本在线免费观看视频 | 亚洲天堂国产 | 国产成人精品亚洲一区 | 深夜爽爽爽gif福利免费 | 91久久亚洲精品一区二区 | 日本黄网站高清色大全 | 成年人免费视频观看 | 国产性生交xxxxx免费 | 国内精品小视频福利网址 | 欧美高清一区二区 | 免费观看成为人视频 | 国内精品一区二区三区最新 | 中文国产成人精品久久一区 | 一级做性色a爰片久久毛片 一级做性色a爰片久久毛片免费 |