色综合图-色综合图片-色综合图片二区150p-色综合图区-玖玖国产精品视频-玖玖香蕉视频

您的位置:首頁技術(shù)文章
文章詳情頁

python 下載文件的幾種方式分享

瀏覽:2日期:2022-06-23 09:39:42
1 、一般同步下載

示例代碼:

import requestsimport osdef downlaod(url, file_path): headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64; rv:68.0) Gecko/20100101 Firefox/68.0' } r = requests.get(url=url, headers=headers) with open(file_path, 'wb') as f: f.write(r.content) f.flush()2、 使用流式請求,requests.get方法的stream

默認情況下是stream的值為false,它會立即開始下載文件并存放到內(nèi)存當中,倘若文件過大就會導致內(nèi)存不足的情況,程序就會報錯。當把get函數(shù)的stream參數(shù)設(shè)置成True時,它不會立即開始下載,當你使用iter_content或iter_lines遍歷內(nèi)容或訪問內(nèi)容屬性時才開始下載,需要注意一點:文件沒有下載之前,它也需要保持連接。

iter_content:一塊一塊的遍歷要下載的內(nèi)容iter_lines:一行一行的遍歷要下載的內(nèi)容

使用上面兩個函數(shù)下載大文件可以防止占用過多的內(nèi)存,因為每次只下載小部分數(shù)據(jù)。

示例代碼:

3 、異步下載文件

由于request的請求是阻塞式的,所以要用aiohttp模塊來發(fā)起請求。

示例代碼:

import aiohttpimport asyncioimport osasync def handler(url, file_path): headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64; rv:68.0) Gecko/20100101 Firefox/68.0' } async with aiohttp.ClientSession() as session: r = await session.get(url=url, headers=headers) with open(file_path, 'wb') as f: f.write(await r.read()) f.flush() os.fsync(f.fileno())loop = asyncio.get_event_loop()loop.run_until_complete(handler(url, file_path))4、 異步拆分下載文件

上面用的是一個協(xié)程下載一個文件,下面的方法是將文件分成幾部分,每個部分用一個協(xié)程下載,最后再寫入文件。

下面這個例子用的是流式寫入,即把內(nèi)容寫入到磁盤里面。

import aiohttpimport asyncioimport timeimport osasync def consumer(queue): option = await queue.get() start = option['start'] end = option['end'] url = option['url'] filename = option['filename'] i = option['i'] print(f'第{i}個任務(wù)開始運行') async with aiohttp.ClientSession() as session: headers = {'Range': f'bytes={start}-{end}'} r = await session.get(url=url, headers=headers) with open(filename, 'rb+') as f: f.seek(start) while True:chunk = await r.content.read(end - start)if not chunk: breakf.write(chunk)f.flush()os.fsync(f.fileno())print(f'第{i}個任務(wù)正在寫入中ing') queue.task_done() print(f'第{i}個任務(wù)寫入成功')async def producer(url, headers, filename, queue, coro_num): async with aiohttp.ClientSession() as session: resp = await session.head(url=url, headers=headers) file_size = int(resp.headers['content-length']) # 創(chuàng)建一個文件 with open(filename, 'wb') as f: pass part = file_size // coro_num for i in range(coro_num): start = part * i if i == coro_num - 1:end = file_size else:end = start + part info = {'start': start,'end': end,'url': url,'filename': filename,'i': i, } queue.put_nowait(info)async def main(): # 需要填的有url,filename,coro_num url = '' filename = '' coro_num = 0 headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64; rv:68.0) Gecko/20100101 Firefox/68.0' } queue = asyncio.Queue(coro_num) await producer(url, headers, filename, queue, coro_num) task_list = [] for i in range(coro_num): task = asyncio.create_task(consumer(queue)) task_list.append(task) await queue.join() for i in task_list: i.cancel() await asyncio.gather(*task_list)startt = time.time()loop = asyncio.get_event_loop()loop.run_until_complete(main())end = time.time() - starttprint(f'用了{end}秒')5、注意

以上的示例都是介紹思路,程序并不健壯,健壯的程序需要加入錯誤捕獲和錯誤處理。

以上就是python 下載文件的幾種方式分享的詳細內(nèi)容,更多關(guān)于python 下載文件的資料請關(guān)注好吧啦網(wǎng)其它相關(guān)文章!

標簽: Python 編程
相關(guān)文章:
主站蜘蛛池模板: 国产乱子伦真实china | 香蕉毛片| 女在床上被男的插爽叫视频 | 日韩精品中文字幕在线观看 | 在线视频欧美亚洲 | 夜色www国产精品资源站 | 韩日一级毛片 | 亚洲精品国产第一区第二区国 | 成人亚洲国产综合精品91 | 久久三级网站 | 亚洲男人天堂 | 手机看片1024国产基地 | 一区二区免费看 | 在线视频中文 | 久久黄色一级视频 | 欧美日韩在线观看精品 | 男人女人真曰批视频播放 | 成人欧美视频在线观看播放 | 毛片a级三毛片免费播放 | 日本欧美一区二区三区视频 | 一区二区三区免费精品视频 | 国产色爽女小说免费看 | 久久91亚洲精品久久91综合 | 久久不见久久见免费影院www日本 | 欧美自拍视频在线 | 在线观看精品自拍视频 | 久色视频在线 | 日本免费不卡在线一区二区三区 | 中文字幕在线网址 | 成人免费视频软件网站 | 午夜免费69性视频爽爽爽 | 一级做a爱 一区 | 日韩成人免费一级毛片 | 日韩精品无码一区二区三区 | 日本精品一在线观看视频 | 日韩精品一区二区三区在线观看l | 91久久青青草原免费 | 成人在线视频国产 | 国产精品久久久久久久久久久搜索 | 精品国产视频在线观看 | 九九国产视频 |