文章詳情頁(yè)

python 下載文件的幾種方式分享

瀏覽：2日期：2022-06-23 09:39:42

1 、一般同步下載

示例代碼：

import requestsimport osdef downlaod(url, file_path): headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64; rv:68.0) Gecko/20100101 Firefox/68.0' } r = requests.get(url=url, headers=headers) with open(file_path, 'wb') as f: f.write(r.content) f.flush()2、使用流式請(qǐng)求，requests.get方法的stream

默認(rèn)情況下是stream的值為false，它會(huì)立即開(kāi)始下載文件并存放到內(nèi)存當(dāng)中，倘若文件過(guò)大就會(huì)導(dǎo)致內(nèi)存不足的情況，程序就會(huì)報(bào)錯(cuò)。當(dāng)把get函數(shù)的stream參數(shù)設(shè)置成True時(shí)，它不會(huì)立即開(kāi)始下載，當(dāng)你使用iter_content或iter_lines遍歷內(nèi)容或訪問(wèn)內(nèi)容屬性時(shí)才開(kāi)始下載，需要注意一點(diǎn)：文件沒(méi)有下載之前，它也需要保持連接。

iter_content：一塊一塊的遍歷要下載的內(nèi)容iter_lines：一行一行的遍歷要下載的內(nèi)容

使用上面兩個(gè)函數(shù)下載大文件可以防止占用過(guò)多的內(nèi)存，因?yàn)槊看沃幌螺d小部分?jǐn)?shù)據(jù)。

示例代碼:

3 、異步下載文件

由于request的請(qǐng)求是阻塞式的，所以要用aiohttp模塊來(lái)發(fā)起請(qǐng)求。

示例代碼：

import aiohttpimport asyncioimport osasync def handler(url, file_path): headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64; rv:68.0) Gecko/20100101 Firefox/68.0' } async with aiohttp.ClientSession() as session: r = await session.get(url=url, headers=headers) with open(file_path, 'wb') as f: f.write(await r.read()) f.flush() os.fsync(f.fileno())loop = asyncio.get_event_loop()loop.run_until_complete(handler(url, file_path))4、異步拆分下載文件

上面用的是一個(gè)協(xié)程下載一個(gè)文件，下面的方法是將文件分成幾部分，每個(gè)部分用一個(gè)協(xié)程下載，最后再寫入文件。

下面這個(gè)例子用的是流式寫入，即把內(nèi)容寫入到磁盤里面。

import aiohttpimport asyncioimport timeimport osasync def consumer(queue): option = await queue.get() start = option['start'] end = option['end'] url = option['url'] filename = option['filename'] i = option['i'] print(f'第{i}個(gè)任務(wù)開(kāi)始運(yùn)行') async with aiohttp.ClientSession() as session: headers = {'Range': f'bytes={start}-{end}'} r = await session.get(url=url, headers=headers) with open(filename, 'rb+') as f: f.seek(start) while True:chunk = await r.content.read(end - start)if not chunk: breakf.write(chunk)f.flush()os.fsync(f.fileno())print(f'第{i}個(gè)任務(wù)正在寫入中ing') queue.task_done() print(f'第{i}個(gè)任務(wù)寫入成功')async def producer(url, headers, filename, queue, coro_num): async with aiohttp.ClientSession() as session: resp = await session.head(url=url, headers=headers) file_size = int(resp.headers['content-length']) # 創(chuàng)建一個(gè)文件 with open(filename, 'wb') as f: pass part = file_size // coro_num for i in range(coro_num): start = part * i if i == coro_num - 1:end = file_size else:end = start + part info = {'start': start,'end': end,'url': url,'filename': filename,'i': i, } queue.put_nowait(info)async def main(): # 需要填的有url，filename，coro_num url = '' filename = '' coro_num = 0 headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64; rv:68.0) Gecko/20100101 Firefox/68.0' } queue = asyncio.Queue(coro_num) await producer(url, headers, filename, queue, coro_num) task_list = [] for i in range(coro_num): task = asyncio.create_task(consumer(queue)) task_list.append(task) await queue.join() for i in task_list: i.cancel() await asyncio.gather(*task_list)startt = time.time()loop = asyncio.get_event_loop()loop.run_until_complete(main())end = time.time() - starttprint(f'用了{(lán)end}秒')5、注意

以上的示例都是介紹思路，程序并不健壯，健壯的程序需要加入錯(cuò)誤捕獲和錯(cuò)誤處理。

以上就是python 下載文件的幾種方式分享的詳細(xì)內(nèi)容，更多關(guān)于python 下載文件的資料請(qǐng)關(guān)注好吧啦網(wǎng)其它相關(guān)文章！

Python 編程

上一條：python如何在word中存儲(chǔ)本地圖片下一條：完美處理python與anaconda環(huán)境變量的沖突問(wèn)題

相關(guān)文章：

1. jsp網(wǎng)頁(yè)實(shí)現(xiàn)貪吃蛇小游戲2. SpringMVC+Jquery實(shí)現(xiàn)Ajax功能3. JavaScript實(shí)現(xiàn)組件化和模塊化方法詳解4. 關(guān)于Ajax跨域問(wèn)題及解決方案詳析5. .Net Core和RabbitMQ限制循環(huán)消費(fèi)的方法6. ASP.NET MVC遍歷驗(yàn)證ModelState的錯(cuò)誤信息7. PHP設(shè)計(jì)模式中工廠模式深入詳解8. ASP中if語(yǔ)句、select 、while循環(huán)的使用方法9. 刪除docker里建立容器的操作方法10. asp(vbs)Rs.Open和Conn.Execute的詳解和區(qū)別及&H0001的說(shuō)明

排行榜

					
					IntelliJ IDEA設(shè)置編碼格式的方法
IntelliJ IDEA創(chuàng)建web項(xiàng)目的方法
淺談Python中re.match()和re.search()的使用及區(qū)別
刪除docker里建立容器的操作方法
django模型動(dòng)態(tài)修改參數(shù),增加 filter 字段的方式
IDEA怎么切換Git分支的實(shí)現(xiàn)方法
IDEA 重新導(dǎo)入依賴maven 命令 reimport的方法
.Net Core和RabbitMQ限制循環(huán)消費(fèi)的方法
PHP設(shè)計(jì)模式中工廠模式深入詳解
JavaScript實(shí)現(xiàn)組件化和模塊化方法詳解
關(guān)于Ajax跨域問(wèn)題及解決方案詳析