re.sub(“。*”,“,”(replacement)“,“ text”)在Python 3.7上的替換次數(shù)翻倍
這不是一個(gè)錯(cuò)誤,而是來(lái)自提交fbb490fd2f38bd817d99c20c05121ad0168a38ee的Python3.7中的錯(cuò)誤修復(fù)。
在正則表達(dá)式中,非零寬度的匹配將指針位置移動(dòng)到匹配的末尾,以便下一個(gè)斷言(無(wú)論是否為零寬度)都可以從匹配之后的位置繼續(xù)進(jìn)行匹配。因此,在您的示例中,在.*貪婪地匹配并消耗了整個(gè)字符串之后,指針隨后移至字符串末尾的事實(shí)實(shí)際上仍然為該位置的零寬度匹配留有“余地”,這可以從以下代碼,在Python2.7、3.6和3.7中的行為相同:
>>> re.findall('.*', ’sample text’)[’sample text’, ’’]
因此,該錯(cuò)誤修復(fù)程序是在非零寬度匹配之后立即替換零寬度匹配,現(xiàn)在可以用替換文本正確替換兩個(gè)匹配。
解決方法在Python 3.7(在Windows 64位上測(cè)試)上,使用RegEx替換字符串.*會(huì)使輸入字符串重復(fù)兩次!
在Python 3.7.2上:
>>> import re>>> re.sub('.*','(replacement)','sample text')’(replacement)(replacement)’
在Python 3.6.4上:
>>> import re>>> re.sub('.*','sample text')’(replacement)’
在Python 2.7.5(32位)上:
>>> import re>>> re.sub('.*','sample text')’(replacement)’
怎么了?如何解決?
相關(guān)文章:
1. 為什么python為什么在“。”之后的對(duì)象和方法名稱之間要留空格?2. 解決啟動(dòng)django,瀏覽器顯示“服務(wù)器拒絕訪問(wèn)”的問(wèn)題3. PHP:“草根語(yǔ)言”挑戰(zhàn)“大腕”Java .Net4. $.ajax中contentType: “application/json” 的用法詳解5. Python量化交易實(shí)戰(zhàn)之使用Resample函數(shù)轉(zhuǎn)換“日K”數(shù)據(jù)6. 為什么從類內(nèi)部訪問(wèn)類變量需要“自我”。在Python中?7. IntelliJ IDEA 2020.3.3現(xiàn)已發(fā)布!新增“受信任項(xiàng)目”功能8. IntelliJ IDEA彈出“IntelliJ IDEA License Activation”的處理方法9. 在Ubuntu 12.04中的Python 2.7中導(dǎo)入Tensorflow時(shí)出錯(cuò)。“找不到GLIBC_2.17”10. java中“==“和equals()的區(qū)別詳解
