文章詳情頁

python - scrapy抓取知網(wǎng)response的內(nèi)容重復

瀏覽：104日期：2022-06-27 08:47:44

問題描述

遍歷請求翻頁的url

for i in range(3): yield Request('http:xx/page/%s'%str(i),callback=self.parse_page)

結(jié)果response請求成功但是每次內(nèi)容都一樣的沒變化都是第一次請求時的內(nèi)容，但是用postman分別請求分頁的url就沒有這問題。= = 是被ban了嗎之前就不會這樣

問題解答

回答1：

那就要分析一下用postman或者瀏覽器訪問時請求的header頭和用scrapy請求頭有什么區(qū)別

回答2：

被反爬識別到了

回答3：

看下控制臺打印的log，看看是否正確抓取了下一頁2017-06-29 09:26:13 [scrapy] DEBUG: Scraped from <200 http:xx/page/x>,注意最后一個x(http:xx/page/x)是否是變化的

Python 編程

上一條：PC端訪問卻變成移動端地址問題#python#scrapy下一條：【python小白】問關于導入嵌套的包的問題

相關文章：

1. docker gitlab 如何git clone？2. docker鏡像push報錯3. angular.js使用$resource服務把數(shù)據(jù)存入mongodb的問題。4. docker-machine添加一個已有的docker主機問題5. 在windows下安裝docker Toolbox 啟動Docker Quickstart Terminal 失敗！6. 關于docker下的nginx壓力測試7. docker-compose中volumes的問題8. docker不顯示端口映射呢？9. angular.js - angularJs ngRoute怎么在路由傳遞空字符串及用ng-switch取得10. docker - 如何修改運行中容器的配置

排行榜

					
					docker gitlab 如何git clone？
關于docker下的nginx壓力測試
在windows下安裝docker  Toolbox 啟動Docker Quickstart Terminal 失敗！
docker-machine添加一個已有的docker主機問題
angular.js使用$resource服務把數(shù)據(jù)存入mongodb的問題。
docker鏡像push報錯
docker - 如何修改運行中容器的配置
docker不顯示端口映射呢？
docker-compose中volumes的問題
angular.js - angularJs ngRoute怎么在路由傳遞空字符串及用ng-switch取得
mysql - 用PHPEXCEL將excel文件導入數(shù)據(jù)庫數(shù)據(jù)5000+條，本地數(shù)據(jù)庫正常，線上只導入15條，沒有報錯，哪里的問題？
				

熱門標簽

色综合图-色综合图片-色综合图片二区150p-色综合图区-玖玖国产精品视频-玖玖香蕉视频

python - scrapy抓取知網(wǎng)response的內(nèi)容重復