色综合图-色综合图片-色综合图片二区150p-色综合图区-玖玖国产精品视频-玖玖香蕉视频

您的位置:首頁技術文章
文章詳情頁

selenium - 請教一下 Python 爬蟲工具

瀏覽:139日期:2022-06-27 16:46:59

問題描述

1)我要抓的是 Instagram 某明星的粉絲2)Instagram pc 站使用了大量的 js 渲染3)沒寫過爬蟲,老板明天就要數據

我目前使用的是BeautifulSoup, selenium 和phantomjs

代碼 demo 大概是

driver = webdriver.PhantomJS(self.browser)driver.get(self.url)driver.implicitly_wait(3)element = driver.find_element_by_class_name('_s53mj')element.click()html = driver.page_sourcesoup = BeautifulSoup(html)

問題是:1) 我不知道click 有沒有執行成功, click 的元素對不對, driver 好像沒有返回值給我參考2) 即使 click 成功了, 但是他是不是只調了 js里的 click() 方法,并沒有觸發 target 怎么辦3)我不知道是先渲染page_source, 還是 應該先 click, 假設執行成功了 click, 是不是也不會再 source 里返回了

啊, 謝各位爬蟲大佬了

問題解答

回答1:

說的是什么意思?百思不得其解啊。。。

selenium自動化,click能模仿用戶點擊,就跟你自己在頁面上點擊一樣,一切都在虛擬瀏覽器驅動中進行。

看你的業務邏輯啊。。。比如有些數據要點擊后才有,那就先click再獲取源代碼。

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 精品视频一区二区三区在线观看 | 欧美黄色成人 | 黑人边吃奶边扎下面激情视频 | 国产成人经典三级在线观看 | 亚洲国产精品成人精品软件 | 国产a级特黄的片子视频 | 亚洲成a人片 | 2级毛片| 久久一日本道色综合久 | 午夜黄色福利视频 | 日本美女黄网站 | 91视频天堂 | 国产大片在线看 | 一级欧美一级日韩毛片99 | 日本毛片在线观看 | 免费欧美在线视频 | 久久久久一 | 成人免费在线 | 高清在线亚洲精品国产二区 | 色综合久久久 | 91黑丝国产线观看免费 | 久久se精品一区精品二区 | 精品在线网站 | 亚洲天堂成人 | 国产婷婷一区二区在线观看 | 精品国产不卡一区二区三区 | 大狠狠大臿蕉香蕉大视频 | 亚洲精品中文字幕一区在线 | 精品视频一区二区三区四区 | 国产成人盗拍精品免费视频 | 色在线网站免费观看 | 97视频在线免费观看 | 久久日本三级韩国三级 | 久久久精品一区 | 国产免费一区二区三区 | 国产福利片在线 易阳 | www.热| 免费观看a毛片一区二区不卡 | 国产自线一二三四2021 | 久久久久一级片 | 激情欧美日韩一区二区 |