亚洲免费在线视频-亚洲啊v-久久免费精品视频-国产精品va-看片地址-成人在线视频网

您的位置:首頁技術(shù)文章
文章詳情頁

Python爬蟲防封ip的一些技巧

瀏覽:94日期:2022-07-14 18:18:34

在編寫爬蟲爬取數(shù)據(jù)的時候,因?yàn)楹芏嗑W(wǎng)站都有反爬蟲措施,所以很容易被封IP,就不能繼續(xù)爬了。在爬取大數(shù)據(jù)量的數(shù)據(jù)時更是瑟瑟發(fā)抖,時刻擔(dān)心著下一秒IP可能就被封了。

本文就如何解決這個問題總結(jié)出一些應(yīng)對措施,這些措施可以單獨(dú)使用,也可以同時使用,效果更好。

偽造User-Agent

在請求頭中把User-Agent設(shè)置成瀏覽器中的User-Agent,來偽造瀏覽器訪問。比如:

headers ={’User-Agent’:’Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/52.0.2743.116 Safari/537.36’} resp = requests.get(url,headers = headers)

還可以先收集多種瀏覽器的User-Agent,每次發(fā)起請求時隨機(jī)從中選一個使用,可以進(jìn)一步提高安全性:

Python爬蟲防封ip的一些技巧

把上面隨機(jī)選擇一個User-Agent的代碼封裝成一個函數(shù):

Python爬蟲防封ip的一些技巧

在每次重復(fù)爬取之間設(shè)置一個隨機(jī)時間間隔

比如:

time.sleep(random.randint(0,3)) # 暫停0~3秒的整數(shù)秒,時間區(qū)間:[0,3]

或:

time.sleep(random.random()) # 暫停0~1秒,時間區(qū)間:[0,1)

偽造cookies

若從瀏覽器中可以正常訪問一個頁面,則可以將瀏覽器中的cookies復(fù)制過來使用,比如:

Python爬蟲防封ip的一些技巧

注:用瀏覽器cookies發(fā)起請求后,如果請求頻率過于頻繁仍會被封IP,這時可以在瀏覽器上進(jìn)行相應(yīng)的手工驗(yàn)證(比如點(diǎn)擊驗(yàn)證圖片等),然后就可以繼續(xù)正常使用該cookies發(fā)起請求。

使用代理

可以換著用多個代理IP來進(jìn)行訪問,防止同一個IP發(fā)起過多請求而被封IP,比如:

附:GitHub上的一個'反反爬蟲'項(xiàng)目

道高一尺魔高一丈,你有反爬蟲措施,那我也有各種'反反爬蟲'的措施,GitHub上就有一位大神專門整理了一個這樣的項(xiàng)目:Anti-Anti-Spider,鏈接地址為:github.com/luyishisi/An可以研究一下。

以上就是Python爬蟲防封ip的一些技巧的詳細(xì)內(nèi)容,更多關(guān)于Python爬蟲防封ip的資料請關(guān)注好吧啦網(wǎng)其它相關(guān)文章!

標(biāo)簽: Python 編程
相關(guān)文章:
主站蜘蛛池模板: 亚洲国产欧美视频 | 中文字幕免费在线视频 | 国产欧美在线不卡 | 欧美日韩成人在线视频 | 国产特黄一级一片免费 | 久久精品免费在线观看 | 一级女性全黄久久生活片 | 国产系列 视频二区 | 免费国产一区二区在免费观看 | 国产亚洲欧美一区二区 | 久久成人免费播放网站 | 欧美一区在线观看视频 | 久久综合丁香 | 久久久日韩精品国产成人 | 精品老司机在线视频香蕉 | 足恋玩丝袜脚视频免费网站 | 国产原创在线视频 | 色老汉丁香网 | 日韩亚洲欧美理论片 | 韩国毛片一级 | 高清波多野结衣一区二区三区 | 男女视频在线观看免费 | 免费国产成人午夜在线观看 | 亚洲国产精品激情在线观看 | 国内精品国语自产拍在线观看55 | 国产一区二区三区免费看 | 日韩免费视频播播 | 亚洲精品国产一区二区三 | 免费伦费一区二区三区四区 | 亚洲在线免费观看视频 | 伊大人香蕉久久网 | 日韩精品一级毛片 | 欧美日韩精彩视频 | 免费精品99久久国产综合精品 | 久久三级国产 | 国产成人麻豆精品 | 特级欧美视频aaaaaa | 午夜影院黄色 | 国产成人精品日本亚洲语音1 | 一级特黄一欧美俄罗斯毛片 | 成年人免费在线视频网站 |