Python while true實(shí)現(xiàn)爬蟲定時(shí)任務(wù)
記得以前的windows 任務(wù)定時(shí)是可以的正常使用的,今天試了下,發(fā)現(xiàn)不能正常使用了,任務(wù)計(jì)劃總是掛起。
接下來記錄下python 爬蟲定時(shí)任務(wù)的幾種解決方法。
今天是第一篇,后面會(huì)陸續(xù)更新。
首先最容易的是while true死循環(huán)掛起,上代碼
import osimport timeimport sysfrom datetime import datetime, timedeltadef One_Plan(): # 設(shè)置啟動(dòng)周期 Second_update_time = 24 * 60 * 60 # 當(dāng)前時(shí)間 now_Time = datetime.now() # 設(shè)置 任務(wù)啟動(dòng)時(shí)間 plan_Time = now_Time.replace(hour=9, minute=0, second=0, microsecond=0) # 設(shè)置差值,-1 day, 21:48:53.246576,類似于這樣 # time.sleep()需要傳入int,所以下面使用.total_seconds() # 主要用來計(jì)算差值,返回int,具體功能可以自行查閱相關(guān)資料 delta = plan_Time - now_Time first_plan_Time = delta.total_seconds() % Second_update_time print('距離第一次執(zhí)行需要睡眠%d秒' % first_plan_Time) return first_plan_Time# while Ture代碼塊,掛起程序,睡眠時(shí)間結(jié)束后調(diào)用函數(shù)名進(jìn)行執(zhí)行while True: s1 = One_Plan() time.sleep(s1) # 下面這里是自己定義的函數(shù),想跑代碼的可以換成hellow world函數(shù)或者注釋掉這行測試下 exe_file(D_list) print('正在執(zhí)行首次更新程序')
個(gè)人感覺使用這種方式進(jìn)行定時(shí)計(jì)劃的啟動(dòng)如果為單個(gè)程序,并且一天執(zhí)行一次的話沒什么問題,如果要考慮到一天執(zhí)行多個(gè)任務(wù)并且一天需要執(zhí)行多次,短板一下就凸顯出來了,
在工作的情況中還需要考慮到很多因素,比如爬蟲程序需要在晚上12點(diǎn)和早上6點(diǎn),9點(diǎn),下午3點(diǎn)執(zhí)行四次,并且需要同時(shí)執(zhí)行4個(gè)爬蟲,還需要考慮到網(wǎng)絡(luò)是否穩(wěn)定,如果程序掛掉該怎么處理等等因素
以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持好吧啦網(wǎng)。
相關(guān)文章:
1. asp(vbs)Rs.Open和Conn.Execute的詳解和區(qū)別及&H0001的說明2. CSS hack用法案例詳解3. ASP 處理JSON數(shù)據(jù)的實(shí)現(xiàn)代碼4. PHP設(shè)計(jì)模式中工廠模式深入詳解5. 用css截取字符的幾種方法詳解(css排版隱藏溢出文本)6. asp中response.write("中文")或者js中文亂碼問題7. 將properties文件的配置設(shè)置為整個(gè)Web應(yīng)用的全局變量實(shí)現(xiàn)方法8. ThinkPHP5實(shí)現(xiàn)JWT Token認(rèn)證的過程(親測可用)9. ASP 信息提示函數(shù)并作返回或者轉(zhuǎn)向10. jsp網(wǎng)頁實(shí)現(xiàn)貪吃蛇小游戲
