文章詳情頁

selenium - 請教一下 Python 爬蟲工具

瀏覽：139日期：2022-06-27 16:46:59

問題描述

1)我要抓的是 Instagram 某明星的粉絲2)Instagram pc 站使用了大量的 js 渲染3)沒寫過爬蟲,老板明天就要數據

我目前使用的是BeautifulSoup, selenium 和phantomjs

代碼 demo 大概是

driver = webdriver.PhantomJS(self.browser)driver.get(self.url)driver.implicitly_wait(3)element = driver.find_element_by_class_name('_s53mj')element.click()html = driver.page_sourcesoup = BeautifulSoup(html)

問題是:1) 我不知道click 有沒有執行成功, click 的元素對不對, driver 好像沒有返回值給我參考2) 即使 click 成功了, 但是他是不是只調了 js里的 click() 方法,并沒有觸發 target 怎么辦3)我不知道是先渲染page_source, 還是應該先 click, 假設執行成功了 click, 是不是也不會再 source 里返回了

啊, 謝各位爬蟲大佬了

問題解答

回答1：

說的是什么意思？百思不得其解啊。。。

selenium自動化，click能模仿用戶點擊，就跟你自己在頁面上點擊一樣，一切都在虛擬瀏覽器驅動中進行。

看你的業務邏輯啊。。。比如有些數據要點擊后才有，那就先click再獲取源代碼。

Python 編程

上一條：Python從URL中提取域名下一條：python - sklearn如何訓練大規模數據集

相關文章：

1. 如何用筆記本上的apache做微信開發的服務器2. 冒昧問一下，我這php代碼哪里出錯了？？？3. php - 淘寶訂單拆單表設計4. mysql優化 - MySQL如何為配置表建立索引？5. MySQL主鍵沖突時的更新操作和替換操作在功能上有什么差別(如圖)6. windows誤人子弟啊7. 實現bing搜索工具urlAPI提交8. 數據庫 - Mysql的存儲過程真的是個坑！求助下面的存儲過程哪里錯啦，實在是找不到哪里的問題了。9. 我在網址中輸入localhost/abc.php顯示的是not found是為什么呢？10. 關于mysql聯合查詢一對多的顯示結果問題

排行榜

					
					javascript - 用on方法,綁定ui,下面的li 事件,ui,li是由ajax生成的,新手求教
javascript - ajax請求nodejs后臺，開啟服務器后，localhost:3000/index.html頁面既沒有報錯，也沒有文字。。。
windows誤人子弟啊
html5和Flash對抗是什么情況？
android-studio - android studio 結巴了，有什么辦法可以治好它嗎？
javascript - Java selenium 中使用click()方法點擊超鏈接無效  用window.open() 也打不開頁面
冒昧問一下，我這php代碼哪里出錯了？？？
android - 安卓使用webview播放騰訊、優酷視頻的方法
javascript - jquery  ajax 用jsonp的方式跨域訪問，為什么報錯
angular.js - angular.ui：dropdown的下拉菜單關閉的偶爾失常問題
javascript - DOM中，獲取屬性
				

熱門標簽

色综合图-色综合图片-色综合图片二区150p-色综合图区-玖玖国产精品视频-玖玖香蕉视频

selenium - 請教一下 Python 爬蟲工具