色综合图-色综合图片-色综合图片二区150p-色综合图区-玖玖国产精品视频-玖玖香蕉视频

您的位置:首頁技術文章
文章詳情頁

解決python 使用openpyxl讀寫大文件的坑

瀏覽:9日期:2022-06-25 09:29:35

由于需要處理xlsx類型的文件,我使用了openpyxl來處理,然而文件比較大,大約有60多MB。讀文件的時候雖然慢了一點,但還是能夠讀出來,但是當我想寫入時卻報錯了。

解決python 使用openpyxl讀寫大文件的坑

顯示設備沒有多余的空間,百度了一下,發現有不少關于openpyxl讀寫大文件的問題。總結來看,解決方案主要有以下兩種,當然,我兩種都用上了。

手動釋放內存

del wb, wsgc.collect()

這一招還算有用,在讀完文件后可以看到內存占用明顯下降了一點。

安裝lxml

使用命令·pip install lxml安裝依賴

這個依賴并非必須安裝的依賴,但是可以使openpyxl流式處理數據。

總之使用了以上兩種方案后,終于可以成功處理數據了。

補充:openpyxl讀取大文件的若干問題

需要編寫一個EXCEL文件對比工具

excel文件通常8MB,300張左右的表,每張表實際范圍為ZZ500.

使用openpyxl對表格進行遍歷,完成兩個表之間的對比,找出公式不相同的單元格編程中遇到若干問題

1、讀取時報錯,錯誤代碼忘記了,原因是通過數組的方式讀取了一個不存在的數值

如 SS[’AA’],這個數值沒有定義,因此報錯(PHP直接返回空值),使用SS.get(’AA’,null)進行修改

D:Python34Libsite-packagesopenpyxlreaderstyle.py

164: format_code = builtin_formats.get(numFmtId,’General’)2、讀取時內存占用過大

基本就是內存占用了2G以上以后,程序就不動了,原因是某些表格的表格范圍識別的非常大,最大可為ZZ65535

通過研究,代碼進行了如下修改

1:使用X64版本,X64版本在運行時,可以運行4G以內內存占用的程序,比2G大一倍,能夠完成大部分表格的讀取,如ZZ5000,但是遇到ZZ65535范圍的表格,內存占用達到了4G+,也會導致程序停止運行.

2:限制最大單元格遍歷范圍,最大限制為ZZ5000,能夠有效降低內存占用

3:定時重新讀取EXCEL文件(如每對比30張表),釋放內存,(Python內存釋放真的很痛苦,全部是指針引用,A=B,DEL A;是不會釋放空間的,要DEL B才行).

4:雖然openpyxl讀取文件時有個只讀模式(性能模式),但是速度實在是太慢了.

通過代碼修改,現在完成文件對比所用的內存通常在2G以內

以上為個人經驗,希望能給大家一個參考,也希望大家多多支持好吧啦網。如有錯誤或未考慮完全的地方,望不吝賜教。

標簽: Python 編程
相關文章:
主站蜘蛛池模板: gv手机在线观看 | 92av在线 | 91精品视频在线播放 | 亚洲免费视频网站 | 永久黄网站色视频免费网站 | 久草资源视频 | 亚洲精品在线视频 | 亚洲欧美卡通动漫丝袜美腿 | 国产呦精品系列在线 | 国产在线精品一区二区中文 | 国产一区二区成人 | 免费亚洲视频在线观看 | 久久综合日韩亚洲精品色 | 久草在线免费资源 | 亚洲国产欧美在线人成精品一区二区 | 国产成人麻豆tv在线观看 | 在线精品国内外视频 | 大学生一级一片第一次免费 | 国产精品亚洲一区二区三区久久 | 欧美在线观看免费一区视频 | 乱子伦xxxx | 福利一二三区 | 欧美成 人h版在线观看 | 天码毛片一区二区三区入口 | 久久在线播放 | 成人网视频在线观看免费 | 国产在线精品观看 | 精品亚洲福利一区二区 | 久久久久久久性高清毛片 | 久久免费在线观看 | 日本免费的一级绿象 | 日本三级香港三级少妇 | 成人国产综合 | 国产精品亚洲二线在线播放 | 国产一二三区在线 | 欧美午夜免费毛片a级 | 中文字幕精品在线 | 性感美女一级毛片 | 国产成人a一区二区 | 午夜毛片视频高清不卡免费 | 久久精品久久精品 |