色综合图-色综合图片-色综合图片二区150p-色综合图区-玖玖国产精品视频-玖玖香蕉视频

您的位置:首頁技術文章
文章詳情頁

Python正則表達式高級使用方法匯總

瀏覽:26日期:2022-07-20 15:14:09

正則表達式是一個以簡單直觀的方式匹配指定文本信息從而達到查找、替換等操作的目的。正則表達式以其簡單而高效的特點使得其在數據分析和數據驗證方面應用廣泛。

對于簡單的正則表達式可以直接百度之,這里重點引薦下‘特殊’操作。

1.非貪婪模式 - {x,y}?

非貪婪模式是指在使用正則匹配時,盡可能少的匹配(默認是貪婪模式,即:盡可能多的匹配)。例:

>>> re.search(r’[d]{2,5}?’,’091234568’)

<_sre.SRE_Match object; span=(0, 2), match=’09’>

在這里{2,5}?匹配只是匹配2-5個[d]時只要滿足2(最少的)個就好,在看看貪婪模式:

>>> re.search(r’[d]{2,5}’,’091234568’)<_sre.SRE_Match object; span=(0, 5), match=’09123’>

這時候,匹配2-5個[d]時,默認匹配最多的5個。

注意:貪婪和非貪婪模式的區別就是重復操作符后有沒有?字符

2.分組

正則表達式提供了一個機制將表達式分組,匹配的結果也將按照表達式單獨分組。例:

>>> m = re.search(r’(d{3})-(d{5})’,’029-25642’)>>> m.group()’029-25642’>>> m.groups()(’029’, ’25642’)>>> m.group(2)’25642’

可以通過m.groups()看到分組匹配結果,通過m.group(index)查看具體編號的分組結果(編號從1開始,0是完整的匹配)。那分組有什么用呢,好像也沒什么特殊的含義,不急,下面會用到。

3.引用分組(回溯) - N

有這么一種情況,比如假設我要找出一個html文本中的所有<a></a>標簽,怎么辦?試試這樣:

>>> re.search(r’<(w+)>.+</(w+)>’,’<a>this is a demo</e>’)<_sre.SRE_Match object; span=(0, 21), match=’<a>this is a demo</e>’>

奇怪的事情來了,為什么<a></e>被匹配成功了,顯然結果并不是想要的,那怎么才能只匹配<a></a>而過濾掉其他的呢(比如<a></e>)?答案就是引用分組,例:

>>> re.search(r’<(w+)>.+</1>’,’<a>this is a demo</e><p>demo two</p>’)<_sre.SRE_Match object; span=(21, 36), match=’<p>demo two</p>’>

這里1是關鍵,意思就是當前位置匹配的結果需要和第一個分組匹配的結果一致,或者說第一個分組的匹配結果期望在這里再次出現。以此類推。該方法最多只能匹配前99個分組。

4.分組命名 - (?P<name>.*)

分組命名最開始由python引入,比如Django路由中會用到。分組命名的好處是方便,直接使用名字比編號要簡單而且不會變化,例:

>>> m = re.search(r’(?P<first_name>d{3})-(?P<second_name>d{4})’,’029-8967’)>>> m.group(’first_name’)’029’>>> m.groupdict() {’first_name’: ’029’, ’second_name’: ’8967’}

當然,命名分組仍然是編號分組,依然可以使用編號進行查找分組。

5.先行斷言 - X(?!Y)、X(?=Y)

假設有這么一種情況,要查找所有163信箱的文本,也就是@163.com結尾的所有email賬號信息,也就是說不要@163.com這部分,但是其還要參與匹配。這就用到了先行斷言,也即基于之后的內容是否存在接收或拒絕一個匹配,而不需要接下來的內容作為匹配的一部分。例:

>>> re.search(r’h(?!e)’,’hello home!’)<_sre.SRE_Match object; span=(6, 7), match=’h’>

h(?!e)表示匹配h,而且h后面不能是e,此處匹配成功的是home,但是只返回h

>>> re.search(r’h(?=e)’,’hello home!’)<_sre.SRE_Match object; span=(0, 1), match=’h’>

h(?=e)表示匹配he,此處匹配成功的是hello,但是只返回h

6.標記

不區分大小寫:re.IGNORECASE(簡寫re.I)-使得正則表達式不區分大小寫 點匹配換行符:re.DOTALL(簡寫re.S)-使得 . 符號可以匹配換行符 多行模式:re.MULTILINE(簡寫re.M)-使得^$字符可以匹配任意行的開始與結束 詳細模式:re.VERBOSE(簡寫re.X)-使得正則表達式可以換行書寫,且可以加入注釋 調試模式:re.DEBUG-將調試信息輸出到sys.stderr 使用多個標記時,使用|分隔,如re.S|re.M

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持好吧啦網。

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 欧美另类69xxxxx 视频 | 国产亚洲精品aaa大片 | 兔子先生节目在线观看免费 | 欧美一级久久久久久久大 | 欧美日韩高清观看一区二区 | 国产精品2019 | 国产在线一区二区三区欧美 | 免费国产成人 | 欧美一级视频免费观看 | 日本亚欧乱色视频在线观看 | 欧美第一精品 | 中文久久 | 男人的天堂视频在线 | 欧美午夜激情影院 | 精品一区二区三区四区在线 | 国内一级特黄女人精品片 | 日韩在线国产 | 中文精品99久久国产 | 亚洲最黄视频 | 日本免费成人网 | 作爱在线观看 | 国产中文字幕视频在线观看 | 男人躁女人躁的好爽免费视频 | 亚洲精品第五页 | 欧美最新的精品videoss | 日本精品在线观看 | 亚州一级片 | 国产一级特黄aa级特黄裸毛片 | 国产伦久视频免费观看视频 | 欧美aaaa在线观看视频免费 | 欧美不卡视频在线观看 | 欧美一级特黄aaa大片 | 欧美日本一区亚洲欧美一区 | 精品91 | 亚洲精品久久久久久久福利 | 国产精品欧美一区二区三区不卡 | 亚欧成人毛片一区二区三区四区 | 亚洲美女影院 | 最近中文字幕精彩视频 | 在线观看久草视频 | www.av视频在线 |