色综合图-色综合图片-色综合图片二区150p-色综合图区-玖玖国产精品视频-玖玖香蕉视频

您的位置:首頁技術(shù)文章
文章詳情頁

node.js - 使用 superagent 抓取 UTF-8網(wǎng)站亂碼

瀏覽:139日期:2024-07-12 16:23:20

問題描述

我使用 superagent + cheerio 去抓取*東的商品 但是返回的中文亂碼 響應(yīng)頭如下 是經(jīng)過 gzip壓縮的 但是按道理 superagent好像會默認(rèn)解壓

node.js - 使用 superagent 抓取 UTF-8網(wǎng)站亂碼

*東商品地址https://item.jd.com/5025518.html

我取了商品標(biāo)題 結(jié)果如下node.js - 使用 superagent 抓取 UTF-8網(wǎng)站亂碼

核心代碼如下:

var url = ’https://list.jd.com/list.html?cat=670,671,672’ //京東電腦var totalData = [] // 存儲總數(shù)據(jù)superagent.get(url).end(function (err, res) { if (err) {return console.error(err) } var topicUrls = []; // 頁面里面的所有url var $ = cheerio.load(res.text) // 拿到頁面 $(’#plist .gl-item’).each(function (i, e) {$e = $(e)var href = ’https:’ + $e.find(’.p-img >a’).attr(’href’) // 拿到所有urltopicUrls.push(href) }) var ep = new eventproxy();// //異步調(diào)用結(jié)束后,執(zhí)行某些操作 ep.after(’topic_html’, topicUrls.length, function (topics) { //接收res.texttopics = topics.map(function (topicHtml) { var $ = cheerio.load(topicHtml, {decodeEntities: false}); return ({title: $(’.sku-name’).text().trim() });});totalData.push(topics)console.log(totalData); }) topicUrls.forEach(function (e) {superagent.get(e).end(function (err, res) { ep.emit(’topic_html’, res.text);}) })})

問題解答

回答1:

這并不是亂碼啊,如果是亂碼,所有的都亂了,應(yīng)該是你編碼的問題。

回答2:

我直接用postman去請求了你那個地址,并沒有出現(xiàn)你這種情況,所以我判斷是你IDE或者文本編輯器的問題,將格式設(shè)為 utf-8 。

相關(guān)文章:
主站蜘蛛池模板: 91久久亚洲精品国产一区二区 | 午夜一级毛片免费视频 | 乱码在线中文字幕加勒比 | 久久久国产一区二区三区 | 日韩在线视频线视频免费网站 | 免费在线成人 | 亚洲免费一级视频 | 日韩三级黄色 | 老司机精品影院一区二区三区 | 久久精品国产亚洲网址 | 日韩精品一区二区三区在线观看l | 精品视频99 | 精品久久久久久影院免费 | 中文国产成人精品久久无广告 | 午夜欧美成人香蕉剧场 | 国产孕妇孕交一级毛片 | 国内黄色一级精品 | 韩国精品一区二区三区四区五区 | 97超级碰碰碰免费公开在线观看 | 99re国产视频 | 无内丝袜透明在线播放 | www.91久久 | 久久免费香蕉视频 | 日本一区二区免费在线观看 | 午夜性刺激免费视频 | 欧美一级一级片 | 久久精品高清 | 久久精品视频在线 | 99免费在线播放99久久免费 | 久久综合久久88 | 欧美精品人爱a欧美精品 | 欧美成人免费午夜影视 | 欧美亚洲91 | 国产不卡a | 国产精品一区二区国产 | 日韩福利视频精品专区 | 国产精品久久久久久久久久日本 | 亚洲在线一区二区三区 | 亚洲毛片免费观看 | 日韩精品一区二区三区 在线观看 | 亚洲久久久久久久 |