文章詳情頁

淺析Python迭代器的高級用法

瀏覽：101日期：2022-07-17 10:50:01

跳過開頭

首先是跳過開始部分，這個在我們讀取文本的時候最常用。在實際的應用當中，比如記錄的日志或者是代碼等等，一般來說頭部都會附上一段說明，或者用注釋標注或者是用特殊的符號標記。這些信息是給用到數據的程序員看的，當我們通過代碼獲取數據的時候，顯然是希望可以過濾掉這些信息的。

比如我們有一段數據，它的開頭用#做了一些注釋：

# This is a data for student# Rows 100xiaoming, 17, 99;xiaoli, 18, 98;...

常規操作當中，我們會創建一個打開文件的迭代器，我們通過遍歷這個迭代器去獲取文件當中的數據：

with open(’xxxx.txt’) as f: for line in f: print(line)

如果只是用來輸出還好，如果我們需要加工文件當中的數據，那么頭部的注釋信息就會干擾我們代碼的運行。我們當然可以手動加入一些判斷，但是這會比較麻煩，代碼也不夠美觀。針對這個問題，一個比較好的解決方案是dropwhile。

dropwhile是itemtools當中的一個函數，它可以接收一個我們自定義的過濾函數和迭代器重新生成一個新的迭代器，這個新的迭代器當中會過濾掉之前迭代器頭部不符合我們要求的數據：

在剛才的例子當中我們想要過濾掉頭部加了#注釋的部分，我們可以這么操作：

from itertools import dropwhilewith open(’xxxx.txt’) as f: for line in dropwhile(lambda line: line.startswith(’#’), f): print(line)

這樣出來的結果就沒有頭部我們不需要的內容了。

當我們知道頭部不符合情況的數據的格式的時候，可以使用dropwhile來規定過濾的格式。如果我們知道需要過濾的條數，則可以使用另外一個工具，叫做islice，它的本質是一個切片函數，就像是Python當中數組的切片功能一樣，可以切出迭代器當中指定片段的數據。

舉個例子：

from itertools import dropwhilewith open(’xxxx.txt’) as f: for line in islice(f, 3, None): print(line)

這樣我們就會從第三行開始獲取，之前的數據會被過濾掉。它其實就代表著數組當中[3: ]的切片操作。

迭代排列組合

我們都知道在C++當中有一個叫做next_permutation的函數，可以傳入一個數組，返回下一個字典序的排列。在Python當中也有同樣的功能，但是是以迭代器的形式使用的。

舉個簡單的例子，比如我們有a, b, c三個元素，我們希望求出它的所有排列：

items = [’a’, ’b’, ’c’]from itertools import permutationsfor p in permutations(items): print(p)

permutations還支持多傳一個參數，比如上述的排列當中我們希望只保留前兩個元素，除了切片之外，我們只需要多傳一個參數就好了，like this：

for p in permutations(items, 2): print(p)

除了排列之外，itertools當中還支持組合，用法還是一樣，只是把函數名稱換成是combinations而已：

from itertools import combindationsfor c in combinations(items): print(c)

在一般的組合當中，一個元素一旦被選中那么它接下來就會從候選集當中移除，再也不會被選中。如果我們希望獲得有放回的組合，我們可以再換一個函數，這個函數名稱有點長，但是名字倒也直觀叫做combinations_with_replacement。但既然是有放回的抽樣，我們需要設定元素的數量，否則抽樣可以無限進行下去。

for c in combinations_with_replacement(items, 3): print(c)

迭代合并后的序列

上一篇文章當中我們介紹了zip可以同時迭代多個迭代器，除此之外還有一種情況是我們需要把多個迭代器串起來迭代。比如系統的日志打在了多個文件當中，我們希望找出其中有error的日志來分析。這個時候，我們希望的不是同時讀取多個迭代器，而是希望能夠有辦法將多個迭代器的內容串聯起來。這個功能就是itertools當中的chain方法，它接受多個迭代器，當我們遍歷的時候，會自動將多個迭代器的內容串聯起來，我們可以無縫迭代。

舉個例子：

from itertools import chainnums = [1, 2, 3]chars = [’a’, ’b’, ’c’]for i in chain(nums, chars): print(i)

這樣我們會把nums和chars當中的內容一起輸出出來，就好像從頭到尾只執行了一個迭代器一樣。

你可能會說我們不用chain也可以實現啊，我們可以這樣：

for i in nums + chars: print(i)

的確，從結果上來看這樣也是行得通的。但是如果我們分析一下內部執行的時候的中間變量，會發現當我們執行nums+chars的時候，實際上是先創建了一個新的臨時list。然后在這個list當中存儲nums和chars的數據，也就是說我們迭代的其實是這個新的list。這帶來的結果是我們額外開辟了一段內存，并且花費了一些時間。如果我們使用chain，它并不會有這樣的中間變量，完全是通過迭代器來執行的迭代，非常節省內存，這也是chain的優點。

歸并迭代的內容

對于歸并操作我們應該都不陌生，在之前的歸并排序以及一些題解的文章當中我們見過很多次。同樣，我們在使用工具合并多個迭代器內容的時候，如果迭代器當中的內容有序，我們也可以對多個迭代器當中的元素進行歸并，而不再需要我們自己手動操作。

使用我們之前介紹的heapq的庫可以非常輕松地做到這一點，我們一起來看一個例子：

a = [1, 3, 5]b = [2, 4, 6]import heapqfor c in heapq.merge(a, b): print(c)

執行之后，我們會得到[1, 2, 3, 4, 5, 6]的結果。也就是說通過heapq.merge操作，我們把多個有序的迭代器合并到了一起。當然我們也可以自己合并，但如果我們只是需要利用當中的數據的話，使用merge操作可以節省內存空間。

到這里內容就結束了，本文和之前的文章基本上列舉完了常用的迭代器用法。當然，除了上述講到的內容之外，Python當中的迭代器還有一些其他的用法，不過相對不太常用，感興趣的同學可以私下了解。

以上就是淺析Python迭代器的高級用法的詳細內容，更多關于Python迭代器的高級用法的資料請關注好吧啦網其它相關文章！

Python 編程

上一條：帶你學習Python如何實現回歸樹模型下一條：python 使用遞歸的方式實現語義圖片分割功能

相關文章：

1. springboot自動配置原理解析2. 使用Python3 poplib模塊刪除服務器多天前的郵件實現代碼3. Python TestSuite生成測試報告過程解析4. 在JSP中使用formatNumber控制要顯示的小數位數方法5. SpringBoot集成mqtt的多模塊項目配置詳解6. 深入了解JAVA 軟引用7. 解決AJAX返回狀態200沒有調用success的問題8. 簡述JAVA同步、異步、阻塞和非阻塞之間的區別9. springboot的yml配置文件通過db2的方式整合mysql的教程10. IntelliJ IDEA設置默認瀏覽器的方法

排行榜

					
					SpringBoot集成mqtt的多模塊項目配置詳解
深入了解JAVA 軟引用
在JSP中使用formatNumber控制要顯示的小數位數方法
使用Python3 poplib模塊刪除服務器多天前的郵件實現代碼
Python TestSuite生成測試報告過程解析
簡述JAVA同步、異步、阻塞和非阻塞之間的區別
解決AJAX返回狀態200沒有調用success的問題
springboot的yml配置文件通過db2的方式整合mysql的教程
IntelliJ IDEA設置背景圖片的方法步驟
IntelliJ IDEA設置默認瀏覽器的方法
springboot自動配置原理解析