亚洲免费在线视频-亚洲啊v-久久免费精品视频-国产精品va-看片地址-成人在线视频网

<strike id="ig8y2"><menu id="ig8y2"></menu></strike>

<del id="ig8y2"></del><strike id="ig8y2"><menu id="ig8y2"></menu></strike>

文章詳情頁

網頁爬蟲 - 博客園博客中的圖片怎么用python爬取下來？

瀏覽：114日期：2022-07-25 17:42:22

問題描述

寫了一小段代碼，爬取博客園博客中的圖片，這段代碼對部分鏈接有效，還有一部分鏈接一爬就報錯，這是什么原因呢？

#coding=utf-8import urllibimport refrom lxml import etree#解析地址def getHtml(url): page = urllib.urlopen(url) html = page.read() return html#獲取地址并建樹url = 'http://www.cnblogs.com/fnng/archive/2013/05/20/3089816.html'html = getHtml(url)html = html.decode('utf-8')tree = etree.HTML(html)#保存圖片至本地reg = r’src='http://www.lshqa.cn/wenda/(.*?)' alt’imgre = re.compile(reg)imglist = re.findall(imgre, html)x = 0for imgurl in imglist: urllib.urlretrieve(imgurl, ’%s.jpg’ % x) x += 1

如圖，可以正確爬取圖片網頁爬蟲 - 博客園博客中的圖片怎么用python爬取下來？

若把url換為

url = 'http://www.cnblogs.com/baronzhang/p/6861258.html'

則立馬報錯

網頁爬蟲 - 博客園博客中的圖片怎么用python爬取下來？

求解決，謝謝！

問題解答

回答1：

錯誤提示已經很明顯了，你去看下網頁源代碼，匹配到的第一張圖片是一個GIF格式的，并且還是相對路徑，所以你是下載不到的，故提示IOerror，就算你下載到了，因為你指定了格式為JPG，你也打不開。因此你需要做的就是判斷和篩選

for imgurl in imglist: if 'gif' not in imgurl:urllib.urlretrieve(imgurl, ’%s.jpg’ % x)x += 1

看下我增加的地方，當然這只是最簡單的判斷，但可以保證你第二個程序不會報錯，也是給你一個思路！

Python 編程

上一條：Python鏈接加中午，輸出中文不在鏈接里下一條：python - 關于單例的線程安全問題

相關文章：

1. windows誤人子弟啊2. 冒昧問一下，我這php代碼哪里出錯了？？？3. MySQL主鍵沖突時的更新操作和替換操作在功能上有什么差別(如圖)4. python - linux怎么在每天的凌晨2點執行一次這個log.py文件5. 數據庫 - Mysql的存儲過程真的是個坑！求助下面的存儲過程哪里錯啦，實在是找不到哪里的問題了。6. 實現bing搜索工具urlAPI提交7. mysql優化 - MySQL如何為配置表建立索引？8. 如何用筆記本上的apache做微信開發的服務器9. 我在網址中輸入localhost/abc.php顯示的是not found是為什么呢？10. 關于mysql聯合查詢一對多的顯示結果問題

排行榜

					
					javascript - 用on方法,綁定ui,下面的li 事件,ui,li是由ajax生成的,新手求教
javascript - ajax請求nodejs后臺，開啟服務器后，localhost:3000/index.html頁面既沒有報錯，也沒有文字。。。
windows誤人子弟啊
html5和Flash對抗是什么情況？
android - 哪位大神知道java后臺的api接口的對象傳到前端后輸入日期報錯，是什么情況？求大神指點
android-studio - android studio 結巴了，有什么辦法可以治好它嗎？
javascript - Java selenium 中使用click()方法點擊超鏈接無效  用window.open() 也打不開頁面
冒昧問一下，我這php代碼哪里出錯了？？？
android - 安卓使用webview播放騰訊、優酷視頻的方法
javascript - DOM中，獲取屬性
javascript - webpack 使用babel轉es6的時候出現了問題，但是webpack沒有報錯！！急急急
				

熱門標簽

主站蜘蛛池模板：久久一本一区二区三区 | 国产一级aaa全黄毛片 | 黑人一级片 | 精品国产成人a区在线观看精品国产成人a在线观看 | 亚洲国产欧美日韩精品一区二区三区 | 国产1000部成人免费视频 | 一级毛片不卡片免费观看 | 搞黄网站在线观看 | 孕妇孕妇aaaaa级毛片视频 | 久久国产亚洲观看 | 99国产福利视频区 | 99精品久久久久久久 | 国产系列在线观看 | 精品欧美一区二区精品久久 | 久草成人在线视频 | 亚洲天堂免费在线视频 | 99九九精品国产高清自在线 | bt天堂国产亚洲欧美在线 | 久久久青青久久国产精品 | 精品无人区一区二区三区a 精品午夜国产在线观看不卡 | 精品日本一区二区三区在线观看 | 毛片免费在线观看 | 国产人成午夜免视频网站 | 亚洲高清国产品国语在线观看 | 欧美一级级a在线观看 | 色青五月天 | 日韩欧美视频在线一区二区 | 午夜宅男在线永久免费观看网 | 国产步兵社区视频在线观看 | 男性吸女下身的视频 | 日本视频在线免费看 | 欧美一级视频在线观看 | 亚洲欧美一区二区三区久本道 | 91久久在线 | 国产女人在线观看 | 国产年成美女网站视频免费看 | 国产欧美日韩综合一区二区三区 | 玖玖啪| 国产精品a区 | 俄罗斯aaaa一级毛片 | 久久精品免视看国产明星 |

<del id="cucgk"></del>

<fieldset id="cucgk"><menu id="cucgk"></menu></fieldset>

<strike id="cucgk"><menu id="cucgk"></menu></strike>