色综合图-色综合图片-色综合图片二区150p-色综合图区-玖玖国产精品视频-玖玖香蕉视频

您的位置:首頁技術(shù)文章
文章詳情頁

python - 爬蟲獲取網(wǎng)站數(shù)據(jù),出現(xiàn)亂碼怎么解決。

瀏覽:99日期:2022-08-04 09:36:09

問題描述

#!/usr/bin/python# -*- coding: utf-8 -*-import urllib2import reimport HTMLParserclass WALLSTREET: def __init__(self, baseUrl):self.url = baseUrl def get_html_content(self):url = self.urlresponse = urllib2.urlopen(url)str = response.read()print strbaseUrl='https://wallstreetcn.com/live/global' #華爾街見文urlws = WALLSTREET(baseUrl)ws.get_html_content()

以上是代碼,寫的很簡單,但是print出來的是亂碼嘗試了 print str.decode(“utf-8“”)但是報(bào)錯(cuò)UnicodeDecodeError: ’utf8’ codec can’t decode byte 0x8b in position 1: invalid start byte

問題解答

回答1:

str = response.read()這句有兩個(gè)問題:1、str是內(nèi)置關(guān)鍵字必須更改為其他變量名2、查看網(wǎng)頁源代碼的編碼方式,如果為utf-8在read()后加.decode(’utf-8’),若為其他可以相應(yīng)解碼

小建議這種小程序?qū)憘€(gè)函數(shù)會比用類來更加方便,無論是使用還是實(shí)現(xiàn)

回答2:

推測用的是sublime text?參考這個(gè)

回答3:

這兒應(yīng)該是encode不是decode,而且你的變量名居然是跟內(nèi)置關(guān)鍵字名字一樣

回答4:

應(yīng)該是encode吧

標(biāo)簽: Python 編程
主站蜘蛛池模板: 美女黄网站人色视频免费国产 | 一级视频在线观看 | 国产精品久久精品视 | 91最新91精品91蝌蚪 | 欧美黄网站免费观看 | 国产香蕉成人综合精品视频 | 欧美一区二区三区在线观看 | 日本视频在线免费观看 | 欧美高清另类自拍视频在线看 | 国产性自拍 | 国产99网站 | 中文字幕日韩在线 | 国产在线观看成人免费视频 | 香港a毛片免费全部播放 | 一级毛片在播放免费 | 手机精品在线 | 午夜日韩视频 | 免费a网| 国产成人福利夜色影视 | 全高清特级毛片 | 欧美日韩精品一区二区三区视频播放 | 黄色网址在线免费看 | 日本高清专区一区二无线 | 中文字幕亚洲精品第一区 | 一级色黄| 欧美一区二区三区在线 | 亚洲视频在线免费观看 | 色手机在线 | 国产午夜a理论毛片在线影院 | 美女视频网站免费播放视 | 久99re视频9在线观看 | 久草青青视频 | 国产一级黄色 | 怡红院最新免费全部视频 | 亚洲精品久久99久久 | 自拍 第一页| 日本一级特黄在线播放 | 99在线视频免费 | 91久久青青草原线免费 | 亚洲爱视频 | 欧美日本在线一区二区三区 |