色综合图-色综合图片-色综合图片二区150p-色综合图区-玖玖国产精品视频-玖玖香蕉视频

您的位置:首頁技術文章
文章詳情頁

python + selenium + chromedriver 如何實現無界面爬取

瀏覽:116日期:2022-07-14 16:59:35

問題描述

在使用selenium爬取12306的過程中,發現使用phantomjs無法爬取,使用chromedriver就可以,應該是phantomjs被網站檢測出來后封禁了,使用chromedriver又會顯示界面,爬取效率低。現在有兩點疑問,google了好久都沒找到有效的解決方法1.如何偽裝phantomjs,盡最大可能的偽裝2.如何設置chromedriver,使其不顯示界面,或者還有什么其他方法提高爬取效率

感謝!!!

問題解答

回答1:

通過PyVirtualDisplay可以實現你的需求,大概代碼就是這樣:

#!/usr/bin/env pythonfrom pyvirtualdisplay import Displayfrom selenium import webdriverdisplay = Display(visible=0, size=(800, 600))display.start()# now Firefox will run in a virtual display. # you will not see the browser.browser = webdriver.Chrome()browser.get(’http://www.baidu.com’)print browser.titlebrowser.quit()display.stop()

不知道你修改過phantomjs的頭信息沒有,可以通過

from selenium import webdriveroptions = webdriver.ChromeOptions()options.add_argument(’lang=zh_CN.UTF-8’)options.add_argument(’user-agent='Mozilla/5.0 (iPod; U; CPU iPhone OS 2_1 like Mac OS X; ja-jp) AppleWebKit/525.18.1 (KHTML, like Gecko) Version/3.1.1 Mobile/5F137 Safari/525.20'’)browser = webdriver.Chrome(chrome_options=options)url = 'https://baidu.com'browser.get(url)browser.quit()

這種方式修改phantomjs的頭部信息,這個也可以試試

回答2:

可以參考鄙人的文章在headless模式下運行selenium

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 男人把女人桶到喷白浆的视频 | 国产精品线在线精品 | 国产伦精品一区二区三区网站 | 亚洲天堂男人在线 | 亚洲一区欧美一区 | 一区二区三区四区视频在线 | 自拍理论片 | 国产黄毛片 | 中文字幕有码视频 | 久久99在线 | 美女双腿打开让男人桶爽网站 | 国产一区三区二区中文在线 | 欧美三级在线观看不卡视频 | 欧美精品aaa久久久影院 | 亚洲精品成人一区二区 | 亚洲免费区 | 亚洲久久久 | 丝袜足液精子免费视频 | 国产精品情侣久久婷婷文字 | 欧美成人午夜不卡在线视频 | 国产精品久久久久久久久岛 | freese×video性欧美丝袜 | yy毛片| 色拍拍在精品视频69影院在线 | 九九精品久久久久久噜噜 | 国产成人a视频在线观看 | 欧美一级棒 | 精品videosex性欧美 | 午夜精品网 | 亚洲第一页在线 | 国产精品美女视视频专区 | 高清一区二区三区四区五区 | 亚洲精品国产精品国自产网站 | 成人毛片在线观看 | 色资源二区在线视频 | 看一级毛片一区二区三区免费 | 亚洲欧美国产一区二区三区 | 午夜美女影院 | 日韩一级大片 | 国产精品黄在线观看免费软件 | 成人国产一区二区 |