利用python進行文件操作
作者: wyh草樣
出處:https://www.cnblogs.com/wyh0923/p/14084898.html
什么是文件
文件是系統存儲區域的一個命名位置,用來存儲一些信息,便于后續訪問。能夠在非易失性存儲器中實現持續性存儲,比如在硬盤上。當我們要讀取或者寫入文件時,我們需要打開文件;在操作完畢時,我們需要關閉文件,以便釋放和文件操作相關的系統資源,因此,文件操作的主要包括以下:
打開文件
讀取或者寫入 關閉文件 打開文件Python使用內置的open()函數打開一個文件,并且返回一個文件對象,也叫句柄(handle)。
f = open('test.txt') # 在本文件夾下面的一個文件f = open('C:/Python33/README.txt') # 全路徑
再打開文件時,我們需要指定文件打開的模式,當我們需要讀取文件時,使用f = open('test.txt', ’r’),寫入文件時,使用f = open('test.txt', ’w’),追加輸入時f = open('test.txt', ’a’),這里的a就是append的意思。追加模式和寫入模式的區別就是,寫入模式打開一個文件時,無論這個文件是否有內容,都會被清空再寫入;在使用追加模式時,打開的文件,只是在原有的內容上繼續進行寫入。同時我們也要制定以文本模式打開還是二進制模式打開。
文本模式(text mode)和二進制(binary mode)模式的區別
文本模式中,讀取時操作系統的換行符(’n’ on Unix,’rn’ on Windows)會被轉換成Python的默認換行符n,寫入時會將默認的換行符轉換為操作系統的換行符;在二進制模式中不會轉換。這個轉化在對文本文件沒有影響,但是對于二進制數據會有影響,比如圖像文件或者EXE文件等。因此, 再打開這類文件時,一般使用二進制模式進行讀寫
常用模式
r 文本模式,讀取 rb 二進制模式,讀取 w 文本模式,寫入 wb 二進制模式,寫入 a 文本模式,追加 ab 二進制模式,追加 + 可讀可寫
f = open('test.txt', ’r’) # 讀模式f = open('test.txt', ’w’) # 寫模式f = open('img.bmp',’r+’) # 可讀可寫f = open('img.bmp',’w+’) # 可讀可寫f = open('img.bmp',’rb’) # 二進制讀取
如何關閉文件
當文件操作結束時,我們最好主動關閉文件。盡管Python有垃圾回收(garbage collector)機制,去清理不用的對象,但是最好還是自己關閉文件。最簡單的方法就是:
f = open('app.log', ’r’)do_something()f.close()
但是這個辦法不安全,因為在進行其他操作時,可能會出現異常,程序退出,那么關閉文件的語句就不會被執行。因此,可以用語句來處理:
try: f = open(’app.log’, ’r’) do_something()finally: f.close()
無論是否發生異常,關閉文件的指令都會被執行。但是python官方給出的最佳用法是:
with open(’app.log’, ’r’) as f: do_something()
使用這種用法,我們不必調用close()方法,在with語句程序內部就會執行,無論內部是否出現異常。with語句被稱為上下文管理器,我們可以暫且不管這個的原理,只需要知道使用with語句,關閉文件的操作會被自動執行,這也是官方推薦的最佳用法,比用語句寫起來簡單。
文件操作
寫入文件主要介紹兩個方法:
1.write()方法這個方法的參數是一個單獨的字符串,比如:
lines = [’line1’, ’line2’]with open(’filename.txt’, ’w’) as f: s = ’’ for data in lines: s += data s += ’n’ f.write(s)
其實更好的寫法是使用join函數:
lines = [’line1’, ’line2’]with open(’filename.txt’, ’w’) as f: f.write(’n’.join(lines))
其實更加優雅的寫法,可以使用生成器:
lines = [’line1’, ’line2’]with open(’filename.txt’, ’w’) as f: f.writelines('%sn' % l for l in lines)
讀取文件
這里介紹四種用法,后面都默認文件已經被打開了:1.read()方法
result = f.read()
這里返回的是文件內容,是str類型的結果,這個方法還帶一個數值類型的參數,指定讀取多少內容,如果省略了或者是負數,那么就返回文件的全部內容。2.readline()方法
result = f.readline()
返回的也是字符串,不過是一行內容,繼續調用,就會返回下一行內容3.readlines()方法
result = f.readlines()
這里返回的是一個列表,但是當數據較大時,這樣的用法會很占用內存,不推薦在數據量大時使用4.直接循環文件對象
for line in f: print line do_something()
這樣的用法節省內存,快速,并且代碼還簡單
result = f.readlines()------------------------result = list(f)
這兩種寫法返回的結果是一樣的顯然我們推薦第四種用法。
如何處理大文件大文件主要問題在于占用內存較大,我們不能一下子將文件全部內容讀入內存,最好的做法如下:
with open('log.txt') as f: for line in f: do_something_with(line)
一行一行讀取,內存不會爆,同時速度也更快,使用with語句,無論內部是否出現異常,在結束時,文件對象都會被關閉,因此在處理大文件時,最好這樣來做。
以上就是利用python進行文件操作的詳細內容,更多關于python 文件操作的資料請關注好吧啦網其它相關文章!
相關文章:
