色综合图-色综合图片-色综合图片二区150p-色综合图区-玖玖国产精品视频-玖玖香蕉视频

您的位置:首頁技術文章
文章詳情頁

python - 正則表達式匹配html的問題。

瀏覽:86日期:2022-09-05 14:29:29

問題描述

<dd class='gray6'> <span class='gray6'> 中文 <span class='padl27'></span> 中文 </span> 中文內容 #需要抓取的內容</dd>用BeautifulSoup html.parser解析的網頁,現在用re模塊想抓取**第7行**的中文內容,放在一個組里面(.*?)。正則老是匹配不上,用換行符也匹配不上,不知道怎么寫了。。。

問題解答

回答1:

既然你都用bs4解析了,為什么不用它提取哪?bs4內有一個stripped_string的函數正好滿足你的需要。

回答2:

import repattern = re.compile(r’</span>.*?</span>(.*?)</dd>’, re.S)str = ’’’<dd class='gray6'> <span class='gray6'> 中文 <span class='padl27'></span> 中文 </span> 中文內容 #需要抓取的內容</dd>’’’print(pattern.search(str).group(1))===> 中文內容 #需要抓取的內容回答3:

const re = /^</span>(.*)</dd>$/

這樣可以不?

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 91精品自在拍精选久久 | 欧美视频在线观 | 久久久久久精 | 一区二区三区久久精品 | 国产一区二区在线视频播放 | 日韩免费视频播播 | 97精品福利视频在线 | 香蕉成人在线视频 | 欧美一级特黄特黄做受 | 久久综合成人网 | 久久色视频在线观看 | 加勒比在线免费视频 | 成年男女的免费视频网站 | 亚洲精品理论 | 日韩久久网 | 99在线热视频只有精品免费 | 亚洲国产精品久久 | 久久久久久久免费视频 | 在线观看欧美一区 | 成人午夜在线观看 | 91原创在线| 美国一级欧美三级 | 成人网在线免费观看 | 99青青| 日韩一区二区三区精品 | 欧美在线观看a | 欧美手机在线视频 | 中文字幕在线一区二区三区 | 日本黄网在线观看 | 欧美精品18videos性欧美 | 午夜免费片在线观看不卡 | 偷拍精品视频一区二区三区 | 久久午夜影院 | 精品久久久久久 | 国产精品久久久久国产精品 | 国产高清晰在线播放 | 久爱www免费人成福利播放 | 一本色道久久综合亚洲精品加 | 日本国产一区二区三区 | 久草在线最新视频 | 欧美一级特黄特色大片免费 |