文章詳情頁

python - 要抓取的網頁內容在括號里，正則怎么寫？

瀏覽：116日期：2022-09-02 08:56:00

問題描述

<dt> <span class='gray6 '>名稱：</span> <a target='_blank'>安現</a> ( <a href='http://www.lshqa.cn/ho-a021551/' target='_blank'> 中間 </a><a href='http://www.lshqa.cn/ho-a011551-b03497/' target='_blank'> 草原牧場 #這是我要抓取的內容我把它放到組(.*?)里面。 </a> ) [ <a href='http://www.lshqa.cn/wenda/acchor'>圖文</a> ] </dt>

我就是想抓取第9行那里的中文內容，放到一個組里面。本來應該很簡單，但是試了好多次就是抓不到，報錯是沒有內容。估計和第5行，和11行的括號有關。請問怎么寫正則才能抓得到？我原來這樣寫

d = re.search(r’<a id='agatdesf_B02_10'.*?>s*(.*?)s*</a>’, s).group(1)

抓不到，誰幫我看下錯在哪里？

問題解答

回答1：

python3

html=’’’ <dt> <span class='gray6 '>名稱：</span> <a target='_blank'>安現</a> ( <a href='http://www.lshqa.cn/ho-a021551/' target='_blank'> 中間 </a><a href='http://www.lshqa.cn/ho-a011551-b03497/' target='_blank'> 草原牧場 #這是我要抓取的內容我把它放到組(.*?)里面。 </a> ) [ <a href='http://www.lshqa.cn/wenda/acchor'>圖文</a> ] </dt>’’’import rep=re.compile(r’<as+?[^>]*?id='agatdesf_B02_10'[^>]*>([^<]*)</a>’)print(p.findall(html)[0].strip())##草原牧場 #這是我要抓取的內容我把它放到組(.*?)里面。回答2：

推薦一本書精通正則表達式看看就都會了！

Python 編程

上一條：關于python list 寫進txt中的問題下一條：python - flask問題

排行榜

					
					pdo - mysql 簡單注入疑問
前端 - Web內部網頁登陸控制，怎么通過apache控制？還有其他的控制嗎？
nginx - 如何根據服務器配置設置web服務參數？
dockerfile - docker-compose啟動lnmp失敗?
angular.js - angular.ui：dropdown的下拉菜單關閉的偶爾失常問題
為什么學習PHP
node.js - win7下，npm 無法下載依賴包，淘寶鏡像也裝不上，求幫忙？？？
javascript - vue項目里的package.json
angular.js - ngview配置路由失敗
python - 關于爬取網站，下載圖片的時候碰到網址結構問題卡住
javascript - js輸入框限定字數問題
				

熱門標簽

亚洲免费在线视频-亚洲啊v-久久免费精品视频-国产精品va-看片地址-成人在线视频网

python - 要抓取的網頁內容在括號里，正則怎么寫？