文章詳情頁

python - 正則表達式匹配html的問題。

瀏覽：86日期：2022-09-05 14:29:29

問題描述

<dd class='gray6'> 中文 中文 中文內容 #需要抓取的內容</dd>用BeautifulSoup html.parser解析的網頁，現在用re模塊想抓取**第7行**的中文內容，放在一個組里面（.*?）。正則老是匹配不上，用換行符也匹配不上，不知道怎么寫了。。。

問題解答

回答1：

既然你都用bs4解析了，為什么不用它提取哪？bs4內有一個stripped_string的函數正好滿足你的需要。

回答2：

import repattern = re.compile(r’.*?(.*?)</dd>’, re.S)str = ’’’<dd class='gray6'> 中文 中文 中文內容 #需要抓取的內容</dd>’’’print(pattern.search(str).group(1))===> 中文內容 #需要抓取的內容回答3：

const re = /^(.*)</dd>$/

這樣可以不?

Python 編程

上一條：python - 這段函數如何改寫比較優雅?下一條：python - 如何在scrapy中帶cookie訪問？

相關文章：

1. php - 請問大批量數據處理，如何分割？2. html5和Flash對抗是什么情況？3. MySQL主鍵沖突時的更新操作和替換操作在功能上有什么差別(如圖)4. javascript - vue過渡效果 css過渡類名的先后順序5. css右浮動字的順序顛倒了6. 數據庫 - Mysql的存儲過程真的是個坑！求助下面的存儲過程哪里錯啦，實在是找不到哪里的問題了。7. ios - 類似微博首頁，一張圖的時候是如何確定圖大小的？8. javascript - vuejs+elementui 購物車價格計算，點擊加減號修改數量總價都不會改變，但是計算執行了9. javascript - 如何使用loadash對[object,object,object]形式的數組進行比較10. javascript - 我是做web前端的，公司最近有一個項目關于數據統計的！

排行榜

					
					javascript - vue過渡效果 css過渡 類名的先后順序
android - 有數據要處理的時候如何使用rxJava進行異步處理數據
javascript - 在ie下為什么會出現這種情況呢 《 無法獲取未定義或 null 引用的屬性“length”》 ？請大神指教。
docker容器呢SSH為什么連不通呢？
docker網絡端口映射，沒有方便點的操作方法么？
6. dockerfile - 為什么docker容器啟動不了？
docker不顯示端口映射呢？
dockerfile - 我用docker build的時候出現下邊問題  麻煩幫我看一下
html5和Flash對抗是什么情況？
android - 哪位大神知道java后臺的api接口的對象傳到前端后輸入日期報錯，是什么情況？求大神指點
				

熱門標簽

色综合图-色综合图片-色综合图片二区150p-色综合图区-玖玖国产精品视频-玖玖香蕉视频

python - 正則表達式匹配html的問題。

python - 正則表達式匹配html的問題。