python定时执行nutch爬取任务示例

发布时间:2020-09-12编辑:脚本学堂
分享一个python定时执行nutch,以运行爬取任务的代码,有研究python定时任务的朋友参考下。

python写了个定时爬取的任务,办法比较笨将原来的内容删掉,重新爬取每天3点爬一遍。

在网站比较小时,用着还算稳定。

例子:
 

复制代码 代码示例:
## startTime=3
import os import time while 1: now=time.time()
if time.localtime(now).tm_hour==startTime: os.system("rm -rf crawled")
   command="bash bin/nutch crawl urls.txt -dir crawled -depth 2"
   os.system(command)
else:
   time.sleep(30*60)