新手使用火车头发布接口如何采集文章教程
火车采集器(LocoySpider)是一款功能强大且易于上手的专业采集软件,强大的内容采集和数据导入功能能将您采集的任何网页数据发布到远程服务器,自定义用户cms系统模块,不管你的网站是什么系统,都有可能使用上火车采集器,系统自带的模块文件支持:风讯文章,动易文章,动网论坛,PHPWIND论坛,Discuz论坛,phpcms文章,phparticle文章,LeadBBS论坛,魔力论坛,Dedecms文章,Xydw文章,惊云文章等的模块文件。更多cms模块请自己参照制作修改,也可到官方网站与大家交流制作。 同时您也可以使用系统的数据导出功能,利用系统内置标签,将采集到的数据对应表的字段导出到本地任何一款Access,MySql,MS SqlServer内。
LocoySpider采用Visual C#编写,可独立在Windows2008下运行(windows2003 自带net11框架。最新版的火车采集器是2008版,需要升级到net20框架才能使用),如您在Windows2000、Xp等环境下使用,请先到微软官方下载一个net framework20或更高环境组件。火车采集器V2009 SP2 04月29日 在我们将数据采集下来后数据默认是保存在本地的,我们可以使用以下几种方式对数据进行处理。
1、不做任何处理。因为数据本身是保存在数据库的(access、db3、mysql、sqlserver),您如果只是查看数据,直接用相关软件打开查看即可。
2、Web发布到网站。程序会模仿浏览器向您的网站发送数据,可以实现您手工发布的效果。
3、直接入数据库。您只需写几个SQL语句,程序会将数据按您的SQL语句导入到数据库中。
4、保存为本地文件。程序会读取数据库里的数据,按一定格式保存为本地sql或是文本文件。 火车采集器采集数据是分成两个步骤的,一是采集数据,二是发布数据。这两个过程是可以分开的。
1、采集数据,这个包括采集网址,采集内容。这个过程是获得数据的过程。我们做规则,在采的过程中也算是对内容做了处理。
2、发布内容就是将数据发布到自己的论坛,CMS的过程,也是实现数据为已有的过程。可以用WEB在线发布,数据库入库或存为本地文件。
具体的使用其实是很灵活的,可以根据实际来决定。比如我可以采集时先采集不发布,有时间了再发布,或是同时采集发布,或是先做发布配置,也可以在采集完了再添加发布配置。总之,具体过程由您而定,火车采集器的强大功能之一也就是体现在灵活中。
1、首先在采集列表页的源码中将带有缩略图的那部分源码复制下来,如图:
2、查看网站的源码,找到这行代码,如图:
3、打开火车头,进入采集网址规则—添加多级网址采集规则,选中手动填写链接地址规则,并将第二步骤中选中的代码粘贴进去,如图:
4、将代码进行如下修改:
5、改好后保存并进行采集测试,如图所示
6、然后再在采集内容规则里进行修改,选中“缩略图”标签,打开,进行内容替换,如图:
7、然后点击文件下载,选中下载,并填好缩略图保存路径及命名方式,如图:
8、在“文件保存及部分高级设置”里设定缩略图的保存盘符及其前缀,我设定为桌面,前缀为“/”,如图:
9、我们保存后测试一下,一起顺利,缩略图顺利采集下来了
前沿:
如果你对火车头一点都不知道,你还是去网上自学一点火车头采集的知识,我也不是什么大师,硬着头皮写的,至少能用,在这里我不会教你如何写采集规则,因为写法种类太多,你问我我也不知道,火车头相关文件夹里提供的发布接口内置了马甲发布文章,并且支持远程抓取本地化,和发布文章时间设置(10-70分钟随机)。用户只需关注火车头标题和内容即可,参数值标题(title),内容(content)。
第一步:站点设置里设置下火车头免登录发布接口的全局变量值:
第二步:将发布接口上传覆盖程序根目录:
第三步:登录火车头软件后导入发布模块"
下图更多处下拉--选择导入:
导入后:
上图中,数字1处填写你在网站后台设置的全局变量值。
2 处选择 utf-8 编码。
3 处填写你网站域名,不要带 反斜杠'/'
4处选择不需要登录
5 处点击获取列表--选择你需要入库的分类
6 随便给当前这个发布模块写个名字,后续采集任务模块会用到。
最后点击保存配置按钮。
---------
下面讲解导入采集任务:
新建任务分组后,在该分组下导入任务规则(导入任务至该分组):
选择我们的采集任务规则(ljobx文件):
下一步:双击规则项
点击第三步:修改发布内容设置
修改下你发布的分类:
最后保存即可:
然后右键开始任务采集:
第一种:
在后台发布信息的时候提示:在dedecms栏目中添加文章时,有时候dedecms会提示你所选择的栏目与当前模型不相符,请选择白色的选项!
解决办法:
这个主意是你更新文章的时候栏目没选择正确,或选择的栏目是封面不支持发布文章,如果是新建栏目的时候失误的可以改栏目属性就可以了,把文章的上一级栏目的属性修改为最终列表栏目 ,你可以添加文章了。
第二种:
火车头采集系统发布的时候:这个问题跟上面的类似,但我们一般发布文章或软件不会出现这个问题,所有肯定是火车头发布栏目id不正确,需要修改下发布参数
解决办法:
主要是 typeid=[分类ID]这个参数可能没有,需要根据不同版本的火车头,位置位于发表post数据的地方。
多素材网
为您解答
望采纳
0条评论