色综合图-色综合图片-色综合图片二区150p-色综合图区-玖玖国产精品视频-玖玖香蕉视频

您的位置:首頁技術文章
文章詳情頁

python - 抓取一個代理ip網頁,使用cookie但是報錯

瀏覽:116日期:2022-08-10 14:36:44

問題描述

from urllib.request import *from http.cookiejar import *url = ’http://www.kuaidaili.com/proxylist/8/’cookies = MozillaCookieJar()hander = HTTPCookieProcessor(cookies)opener = build_opener(hander)install_opener(opener)html = urlopen(url).read()print(html)

這個網頁訪問是需要cookie的,我用上述方法訪問,顯示:httperror:521錯誤異常

問題解答

回答1:

這個網站的策略就是這樣,你的第一次訪問都是會返回512的,但是頁面還是有內容的

<html><body><script language='javascript'> window.onload=setTimeout('hv(233)', 200); function hv(OL) {var qo, mo='', no='', oo = [0xd9,0xa6,0x34,0xc9,0x42,0x3c,0xb1,0x27,0xf0,0x55,0x1b,0xb4,0x8a,0x64,0x48,0x5e,0x98,0x0e,0x03,0x58,0x2f,0x51,0x8a,0xf3,0x89,0x73,0xec,0xa2,0xda,0x63,0x19,0xe2,0x7c,0xf1,0xe6,0xaa,0xdf,0x55,0x7a,0x04,0x98,0x29,0x32,0x67,0xeb,0x70,0xd4,0x85,0x0f,0xda,0x94,0x0a,0x4e,0x92,0x0c,0x51,0xd4,0x5a,0x8f,0x15,0x9e,0xd3,0x28,0x8a,0x80,0x06,0x3b,0xdf,0x84,0x76,0x0c,0x70,0xe5,0x5a,0xee,0xe4,0x9a,0x5d,0xa1,0x16,0xcf,0xc1,0xe6,0x70,0xc0,0x41,0x76,0xea,0x5f,0xd8,0x59,0x43,0x87,0x1c,0xa1,0x3b,0x2d,0xe1,0xe3,0x48,0x79,0x2e,0xe2,0x67,0xab,0x69,0x1e,0x53,0xd7,0xec,0x8e,0x08,0x4e,0x77,0x20,0x56,0xde,0x58,0xf0,0xb4,0xa5,0x40,0xb8,0x7e,0x64,0x06,0x32,0xd6,0x5b,0x4d,0x05,0xad,0x36,0x09,0xfe,0xb3,0x08,0xa9,0x4e,0x83,0xaf,0xb4,0x15,0xa9,0xae,0x63,0xe7,0xb8,0x5a,0xb1,0xa9,0x14,0x25,0xca,0x37,0xa0,0x76,0x70,0x26,0x60,0x26,0x4a,0x3f,0x01,0x1b,0x93,0x49,0x83,0x6a,0xd3,0x89,0xc3,0xa9,0xe3,0xa5,0x9a,0x34,0x0a,0x04,0x15,0xba,0x63,0xa9,0x63,0xcb,0xf1,0xe6,0xbc,0x0e,0x6b,0x80,0x22,0x7a,0xb4,0x7a,0xe3,0x41,0x1b,0x73,0x35,0x9e,0x78,0x0e,0xfc,0x71,0x6b,0xe4,0xaa,0x13,0xd8,0xbd,0xa7,0x7d,0x17,0xd0,0x35,0x6f,0x6c,0x42,0x0c,0x00,0x66,0x40,0xd5,0x8d,0x06,0xff,0x75,0x3f,0xa7,0x69,0x1b,0x91,0x1c,0xc7,0x3b];qo = 'qo=234; do{oo[qo]=(-oo[qo])&0xff; oo[qo]=(((oo[qo]>>2)|((oo[qo]<<6)&0xff))-169)&0xff;} while(--qo>=2);'; eval(qo);qo = 233; do { oo[qo] = (oo[qo] - oo[qo - 1]) & 0xff; } while (-- qo >= 3 );qo = 1; for (;;) { if (qo > 233) break; oo[qo] = ((((((oo[qo] + 72) & 0xff) + 72) & 0xff) << 6) & 0xff) | (((((oo[qo] + 72) & 0xff) + 72) & 0xff) >> 2); qo++;}po = ''; for (qo = 1; qo < oo.length - 1; qo++) if (qo % 7) po += String.fromCharCode(oo[qo] ^ OL);eval('qo=eval;qo(po);');} </script> </body></html>

他把重要的key隱藏到js中,并通過eval函數進行轉換跳轉,起到一個混攪代碼的作用,使用selenium的話也許可以解決這個問題

話外: 代理網站本身自己就是爬蟲的代理提供者,在這反爬上面是做的很不錯的。我覺得一個爬蟲的重心應該是搞定主要內容,如果為了節約錢去爬取免費代理,這上面花的時間是很多的,效率未免太低了。我在公司里是直接用的kuaidaili的付費代理,基本沒有在代理獲取上想太多,只需要思考高并發條件下如何更好的利用代理就OK了~

標簽: Python 編程
主站蜘蛛池模板: 亚洲天堂成人在线观看 | 1024香蕉国产在线视频 | 久久在线国产 | 日本一级在线播放线观看视频 | 欧美高清视频手机在在线 | 女人张开腿让男人操 | 中文字幕一区二区三区久久网站 | 日本一级高清片免费 | 97在线视频免费观看 | 成人午夜性a一级毛片美女 成人午夜亚洲影视在线观看 | 美女黄频免费观看 | 日本三级2021最新理论在线观看 | 亚洲乱码国产一区网址 | 97精品国产综合久久久久久欧美 | 国产欧美日本 | 亚洲国产精品乱码在线观看97 | 手机黄色网址 | 国产精品欧美亚洲日本综合 | 日韩精品一区二区三区在线观看 | 久草在线视频网 | 亚洲国产一区二区a毛片 | a级国产乱理伦片在线观看99 | 欧美高清一区二区 | 宅男69免费永久网站 | 日本视频免费在线播放 | 深夜一级毛片 | 国产一精品一aⅴ一免费 | 99精品免费久久久久久久久日本 | 亚洲福利影视 | 国产亚洲一欧美一区二区三区 | 香港经典毛片a免费观看 | 久久性久久性久久久爽 | 久青草免费视频手机在线观看 | 在线观看国产欧美 | 亚洲精品一区二区三区国产 | 亚洲免费网站在线观看 | 男性吸女下身的视频 | 自拍视频第一页 | 综合91| 日韩美女网站 | 91九色国产porny |