色综合图-色综合图片-色综合图片二区150p-色综合图区-玖玖国产精品视频-玖玖香蕉视频

您的位置:首頁技術文章
文章詳情頁

python - 網頁title中包含換行,如何用正則表達式提取出來?

瀏覽:119日期:2022-06-28 10:07:00

問題描述

在用python做CSDN的網頁爬蟲,在爬取網頁title時,我一直用的正則表達式(?<=<title>).+?(?=<)在CSDN中用不了了,去CSDN源碼一看,title換行顯示了python - 網頁title中包含換行,如何用正則表達式提取出來?

所以導致原來的正則表達式無法使用,那么,問題來了,像這樣網頁title中包含換行,如何用正則表達式提取出來呢?

PS:

不想用xpath或beautifulsoup的方法,只需要正則哦

CSDN本身有反爬蟲機制,我并不是因為這個反爬蟲而爬不到title的哦

謝謝大家

參照@caimaoy 的方法,我將正則表達式改為 (?<=<title>)(?:.|n)+?(?=<)后,title完美提取。再次感謝大家。

問題解答

回答1:

re.M 多行模式

自己寫多行匹配 http://python3-cookbook.readt...

回答2:

表達式那邊加個flag吧

tite = ’......’print(re.findall(’(?<=<title>).+?(?=<)’, title, re.S))

標簽: Python 編程
主站蜘蛛池模板: 亚洲精品第五页 | 广东毛片 | 精品国产自在在线在线观看 | 亚洲最大情网站在线观看 | 欧美成人另类69 | 日本一级特黄特色大片免费视频 | 欧美特级另类xxx | 日韩www视频 | 韩国精品视频在线观看 | 欧美日韩高清 | 日韩欧美一区二区不卡看片 | 天天澡天天碰天天狠伊人五月 | 欧美在线亚洲国产免m观看 欧美在线一级精品 | 亚洲欧美在线观看播放 | 亚洲国产精品线在线观看 | 亚洲国产欧美精品 | 涩涩国产精品福利在线观看 | 欧美片欧美日韩国产综合片 | 久久久久久久久久久久久久久久久 | 亚洲第99页 | 国产成人久久精品二区三区 | 久久国产精品-国产精品 | www.99在线观看 | 久久精品国产三级不卡 | 久久精品免视着国产成人 | 色视频一区二区三区 | 2022国产精品网站在线播放 | 成人精品区 | 国产成人a一区二区 | 亚洲第一区视频 | 国产农村乱 | 国产福利微拍精品一区二区 | 失禁h啪肉尿出来高h | 美女张开腿黄网站免费国产 | 成人在免费视频手机观看网站 | 日b毛片 | 日本一本久 | 欧美2区 | 99精品视频在线视频免费观看 | 久草视频2 | 一本色道久久99一综合 |