色综合图-色综合图片-色综合图片二区150p-色综合图区-玖玖国产精品视频-玖玖香蕉视频

您的位置:首頁技術文章
文章詳情頁

javascript - node爬取微博

瀏覽:103日期:2022-06-24 14:18:08

問題描述

剛接觸node,想寫個爬蟲,爬取新浪微博評論,但是發現頁面是由JS動態生成的,用http模塊爬取不到,然后用phantomjs爬取,(聽說會比較慢,運行了近15分鐘,這也太慢了,不知是否寫錯),還是不行,問一下有什么辦法能夠爬取類似于新浪微博的網頁嗎?

let page=require('webpage').create();let url='http://weibo.com/1713926427/Etq2WnSiR?filter=hot&root_comment_id=0&type=comment';/*page.settings = { javascriptEnabled: true, loadImages: false, webSecurityEnabled: false, userAgent: ’Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/34.0.1847.137 Safari/537.36 LBBROWSER’};*/page.open(url,(status)=>{ console.log('Status:'+status); if(status=='success'){let val = page.evaluate(()=>{ var list_box=document.querySelector('.list_box'); console.log(list_box); return list_box});console.log(val) }else{console.log('failed') } phantom.exit();});

問題解答

回答1:

自己寫過微博的爬取,有兩種思路

仔細看一下應該是有接口去獲取相應數據的然后用正則去匹配

微博提供了開發者API接口的,雖然用著比較麻煩

標簽: 微博
相關文章:
主站蜘蛛池模板: 国产精品每日更新在线观看 | 成人免费观看一区二区 | 久久一区二区精品 | 欧美高清一级片 | 日本高清不卡中文字幕 | 国产成人精品免费视 | 精品国产免费观看 | 国产深夜福利视频网站在线观看 | 欧美精品做人一级爱免费 | 久久国产精品免费看 | 成人免费在线观看视频 | 免费视频久久久 | 欧美在线一级毛片观看 | 国产三香港三韩国三级不卡 | 特级淫片欧美高清视频蜜桃 | 亚洲精品第一国产综合野 | 草草视频在线观看最新 | 成人区精品一区二区毛片不卡 | 欧美一级毛片一级毛片 | 久久精品综合国产二区 | 美国一级毛片视频 | 免费一级网站 | 国产粉嫩高中生无套第一次 | 91九色视频无限观看免费 | 91国在线视频 | 夜间福利在线观看 | 国产成人精品高清免费 | 欧美67194| gay毛片| 免费一级欧美大片视频在线 | 成人软件网18免费视频 | 99久久精品免费看国产一区二区 | 在线毛片一区二区不卡视频 | 手机看片1024久久精品你懂的 | 国自产精品手机在线视频香蕉 | 国产高清美女一级毛片久久 | 亚洲一级毛片中文字幕 | 亚洲国产精品成人综合久久久 | 免费黄色成人 | 免费看成人毛片 | 亚洲黄色三级网站 |