本教程只适用于萌芽采集插件v10.7.4以上版本,低于此版本的,请更新至最新版。
使用python脚本可以多线程采集,相比程序原来的定时采集任务,采集速度快n倍,并且不会导致网页运行卡顿,采集时不影响网站访问。
需要用到的Python脚本在本页面下载,然后按教程添加插件定时任务。
看了教程还不会使用Python脚本采集的,请添加程序定时任务实现自动采集。
采集全部只执行一次,执行后将关闭采集全部任务,采集成功后,请在插件任务管理里面删除。
采集全部不需要每天都执行,平时只需要添加采集当天的任务即可,因为只有资源站每天更新的资源才需要定时采集到我们自己的网站上。
第一步:选择资源站,绑定分类
插件可以自动绑定分类,但是前提是你程序内已经有对应的分类,才能自动绑定,如果你程序内没有对应的分类,则不能自动绑定分类。
没有自动绑定上的分类,需要自己手动绑定,或者添加对应的分类后再添加定时任务。
手动选择你要采集的资源站,进入查看哪些分类已绑定,未绑定的分类是否需要采集,要采集的话,请自行绑定到指定分类上。
第二步:添加插件定时任务
第三步:设置打开接口
插件设置,打开接口开关,点击保存,要保证才生效,重要的事说三遍。点击保存,要保证才生效!点击保存,要保证才生效!
第四步,下载Python脚本
在本页找到python脚本,并下载,将压缩包上传到服务器
linux 系统安装的宝塔面板,可放在 /www/python/ 路径
windows 安装的宝塔面板,可放在 C:/www/python 路径
然后解压后看到config.yaml配置文件,打开编辑
然后修改对应配置,在插件设置里面打开接口开关后,会有相关密码和token,填入这里保存
第五步:检查Python环境
linux系统安装的宝塔面板,可以直接使用宝塔面板自带的Python,无需额外配置Python虚拟环境
通过宝塔面板“终端”进入,输入命令查看Python版本;(如果通过终端无法进入,请换SSH登录服务器后操作)
btpython --version
如果显示出Python版本,不低于3.7,则可以直接使用,直接去创建计划任务即可
windows 操作系统的,安装了最新版本宝塔面板的,Python安装路径在,确定有安装Python就行
第六步:创建计划任务
任意宝塔面板后台,创建计划任务,如图填写
Liunx 计划任务脚本内容如下:文件路径在哪里就填哪里
btpython /www/python/collect.py
执行间隔最低间隔一小时执行一次,如果你设置过低,比如30分钟执行一次,那也不生效;当然你也可以设置间隔两小时,三小时执行一次脚本。
Windows 宝塔面板计划任务,填写如下:
"C:/Program Files/python/python.exe" -u "C:/www/python/collect.py"
第七步:测试任务
注意,点击执行后,弹窗日志里面可能显示为空,一般需要等一会儿日志才能显示。
如下图则是运行成功了