织梦微信采集规则怎么写,单页采集规则就行谢谢。
完全没看懂你想问什么,你是想说需要采集某个标签然后发布到DEDE还是其他的意思?
如果是采集标签,首先讲采集部分,需要针对该采集部分添加一个标签去采集,具体的就是在火车头的那个采集规则里添加,
发布部分需要在DEDE中后台添加字段,然后修改火车头发布模块(如果dede原本就带有的话就不需要修改)
更新 622
来源,以及作者跟原文章有关,原文章没有写就不会有的。
这个采集成功率大概有95%,采集不了就只能手动添加了,不是很多。
BASE64:e2RlZGU6bGlzdGNvbmZpZ30NCntkZWRlOm5vdGVpbmZvIG5vdGVuYW1lPSJiYrLJvK8iIGNoYW5uZWxpZD0iMSIgbWFjdGh0eXBlPSJzdHJpbmciDQoJcmVmdXJsPSJodHRwOi8vIiBzb3VyY2VsYW5nPSJ1dGYtOCIgY29zb3J0PSJhc2MiDQogIGlzcmVmPSJubyIgZXhwdGltZT0iMTAiIHVzZW1vcmU9IjAiIC99DQp7ZGVkZTpsaXN0cnVsZSBzb3VyY2V0eXBlPSJiYXRjaCIgcnNzdXJsPSJodHRwOi8vIiByZWd4dXJsPSJodHRwOi8vd3d3LmJhYnl0cmVlLmNvbS9sZWFybi94dWVsaW5ncWlhbi96YW9xaWppYW95dS8oKikiDQpzdGFydGlkPSIwIiBlbmRpZD0iOTkiIGFkZHY9IjEiIHVybHJ1bGU9ImFyZWEiIG11c3RoYXM9IiINCiBub3RoYXM9IiIgbGlzdHBpYz0iMSIgdXNlbW9yZT0iMCJ9DQoJe2RlZGU6YWRkdXJsc317L2RlZGU6YWRkdXJsc30NCgl7ZGVkZTpiYXRjaHJ1bGV9ey9kZWRlOmJhdGNocnVsZX0NCgl7ZGVkZTpyZWd4cnVsZX17L2RlZGU6cmVneHJ1bGV9DQoJe2RlZGU6YXJlYXN0YXJ0fTx1bCBjbGFzcz0idGV4dExpc3QgdGV4dExpc3RCaWciPnsvZGVkZTphcmVhc3RhcnR9DQoJe2RlZGU6YXJlYWVuZH08L3VsPnsvZGVkZTphcmVhZW5kfQ0Key9kZWRlOmxpc3RydWxlfQ0KDQp7L2RlZGU6bGlzdGNvbmZpZ30NCg0Ke2RlZGU6aXRlbWNvbmZpZ30NCntkZWRlOnNwcGFnZSBzcHR5cGU9J2Z1bGwnfXsvZGVkZTpzcHBhZ2V9DQp7ZGVkZTpwcmV2aWV3dXJsfWh0dHA6Ly93d3cuYmFieXRyZWUuY29tL2xlYXJuL2FydGljbGUvNjgwey9kZWRlOnByZXZpZXd1cmx9DQp7ZGVkZTprZXl3b3JkdHJpbX17L2RlZGU6a2V5d29yZHRyaW19DQp7ZGVkZTpkZXNjcmlwdGlvbnRyaW19ey9kZWRlOmRlc2NyaXB0aW9udHJpbX0NCntkZWRlOml0ZW0gZmllbGQ9J3RpdGxlJyB2YWx1ZT0nJyBpc3VuaXQ9JycgaXNkb3duPScnfQ0KICAge2RlZGU6bWF0Y2h9PHRpdGxlPlvE2sjdXV9f0/22+c7E1cJfsaaxpsr3PC90aXRsZT57L2RlZGU6bWF0Y2h9DQogICANCiAgIHtkZWRlOmZ1bmN0aW9ufXsvZGVkZTpmdW5jdGlvbn0NCnsvZGVkZTppdGVtfXtkZWRlOml0ZW0gZmllbGQ9J3dyaXRlcicgdmFsdWU9JycgaXN1bml0PScnIGlzZG93bj0nJ30NCiAgIHtkZWRlOm1hdGNofXsvZGVkZTptYXRjaH0NCiAgIA0KICAge2RlZGU6ZnVuY3Rpb259ey9kZWRlOmZ1bmN0aW9ufQ0Key9kZWRlOml0ZW19e2RlZGU6aXRlbSBmaWVsZD0nc291cmNlJyB2YWx1ZT0nJyBpc3VuaXQ9JycgaXNkb3duPScnfQ0KICAge2RlZGU6bWF0Y2h9ey9kZWRlOm1hdGNofQ0KICAgDQogICB7ZGVkZTpmdW5jdGlvbn17L2RlZGU6ZnVuY3Rpb259DQp7L2RlZGU6aXRlbX17ZGVkZTppdGVtIGZpZWxkPSdwdWJkYXRlJyB2YWx1ZT0nJyBpc3VuaXQ9JycgaXNkb3duPScnfQ0KICAge2RlZGU6bWF0Y2h9ey9kZWRlOm1hdGNofQ0KICAgDQogICB7ZGVkZTpmdW5jdGlvbn17L2RlZGU6ZnVuY3Rpb259DQp7L2RlZGU6aXRlbX17ZGVkZTppdGVtIGZpZWxkPSdib2R5JyB2YWx1ZT0nJyBpc3VuaXQ9JzEnIGlzZG93bj0nMSd9DQogICB7ZGVkZTptYXRjaH08ZGl2IGNsYXNzPSJLX2NvbnRlbnQiPlvE2sjdXTxkaXYgY2xhc3M9J2xvb2tQYWdlanVtcCcgc3R5bGU9InRleHQtYWxpZ246Y2VudGVyOyI+ey9kZWRlOm1hdGNofQ0KICAge2RlZGU6dHJpbSByZXBsYWNlPSIifTxoMT48c3Bhbj4oLiopPC9oMT57L2RlZGU6dHJpbX0NCntkZWRlOnRyaW0gcmVwbGFjZT0iIn08ZGl2IGNsYXNzPSJ0aW1lS2V5d29yZCIgYWxpZ249ImNlbnRlciIgc3R5bGU9ImNvbG9yOmdyYXk7IiA+KC4qKTwvZGl2PnsvZGVkZTp0cmltfQ0Ke2RlZGU6dHJpbSByZXBsYWNlPSIifTxkaXYoW14uXSopPnsvZGVkZTp0cmltfQ0Ke2RlZGU6dHJpbSByZXBsYWNlPSIifTwvZGl2PnsvZGVkZTp0cmltfQ0Ke2RlZGU6dHJpbSByZXBsYWNlPSIifTxhKFtePl0qKT4oLiopPC9hPnsvZGVkZTp0cmltfQ0Ke2RlZGU6dHJpbSByZXBsYWNlPSIifX08cD57L2RlZGU6dHJpbX0NCiAgIHtkZWRlOmZ1bmN0aW9ufQ0KDQoNCg0KDQoNCg0KDQoNCg0KDQoNCg0KDQoNCg0KDQoNCg0KDQoNCg0KDQoNCg0KDQoNCg0KDQoNCg0KDQoNCg0KDQoNCg0KDQoNCnsvZGVkZTpmdW5jdGlvbn0NCnsvZGVkZTppdGVtfQ0Key9kZWRlOml0ZW1jb25maWd9:END
命名采集节点名称,填写引用网址,引用网址就是你需要采集的网址所在的网址,网址匹配区域就是所在网址的区域。我举个例子
比如在某某网页上有一堆网址列表,而你需要的就是采集这些网址,那你就只要查看它的源代码,找到开始代码和
结束代码就可以了。内容页面配置也是同理,你找到你需要采集的网页,查看他的源代码
,你需要从哪个标签开始采集
就些那个标签
中间是内容
然后那个标签结束
就填写结束标签。举例
我从目标网页的<body>标签开始采集
,采集到</body>标签结束
那么
我的采集内容匹配
就是
<body>[内容]</body>过滤规则就是
你需要过滤特定的内容
然后在过滤规则填上就行。
用编辑器打开\dede\templets\index_menu2htm 文件,修改123行到140行之间的内容,删除
<a id='link100' class='mm'>
<div onClick="ShowMainMenu(100)">模块</div>
</a>
<a id='link3' class='mm'>
<div onClick="ShowMainMenu(3)">采集</div>
</a> <a id='link6' class='mm'>
<div onClick="ShowMainMenu(6)">会员</div>
</a>
<a id='link7' class='mm'>
<div onClick="ShowMainMenu(7)">模板</div>
</a>
然后保存文件就好了。
文字、、flash、论坛附件、软件站资源可以一网打尽。强大的内容采集和数据导入功能能将您采集的任何网页数据发布到远程服务器,cms系统,或保存为本地文件,Access、MySql、MS SqlServer数据库。不管你的网站是什么系统,都可以使用上火车头采集器。
当然程序不光是用来采几篇文章的。使用它,你可以自动获取那些经常更新的信息,比如域名过期信息,最新新闻等。你也可以将它做为一个论坛灌水或是发帖机,顶帖机来用,前提是您做好发布模块。您也可以将它视作一下或是文件批量下载工具,程序自带的下载功能不差于主流的一些下载工具。当您将它用来发送 数据,可以实现更为复杂的功能。 火车采集器(LocoySpider)是一款功能强大且易于上手的专业采集软件,强大的内容采集和数据导入功能能将您采集的任何网页数据发布到远程服务器,自定 义用户cms系统模块,不管你的网站是什么系统,都有可能使用上火车采集器,系统自带的模块文件支持:风讯文章,动易文章,动网论坛,PHPWIND论坛,Discuz论坛,phpcms文章,phparticle文章,LeadBBS论坛,魔力论坛,Dedecms文章,Xydw文章,惊云文章等的模块文件。更多cms模块请自己参照制作修改,也可到官方网站与大家交流制作。 同时您也可以使用系统的数据导出功能,利用系统内置标签,将采集到的数据对应表的字段导出到本地任何一款Access,MySql,MS SqlServer内。
推荐 小猪浏览器 科技的 瞬采DEDECMS采集器。
很不错的,是一款智能的机器人软件,完全模拟人工,支持dedecms 53 5455 56 57 新闻及软件频道,内置发布接口,、附件自动采集发布本地化,无需ftp操作,简单易用,看了教程,立马就可以上手使用了。
1瞬采DEDECMS采集器,内置DEDECMS全系列 新闻、软件频道发布接口,不限制添加网站数量,轻松维护几十上百个网站;
2不绑定电脑,软件是纯绿色的,压缩包2m多,随身携带,u盘上都可以运行;
3内置300多条采集规则,智能自动识别大部分论坛和网站,采集主帖和回复、采集文章都可以,不限制被采集的网站,自己做采集规则也很简单;
4全自动 附件、本地化,无需手动ftp到网站附件文件夹;
5支持附件、自动上传到网盘,节约有限的网站空间,还能赚网盘下载费用;
6跟踪跟新采集,只要目标网站有新文章,立刻能采集发布到指定的版块,有多少抓多少,自动更新网站内容;
7支持采集论坛隐藏的帖子,会自动回复并采集下来;
8支持自动购买论坛的收费附件,实现完全无障碍采集;
9伪原创支持多国语言自动翻译;
10伪原创支持 词汇过滤、替换,支持繁体化,段落错排,删除句子等高级优化功能
……
功能太多,无法一一列举。
瞬采系列为收费版,可以试用小猪浏览器免费版,2者内核一样的!
小猪浏览器免费版适合少量的采集发布操作,免费版的功能超过市面大多数收费版的软件。
0条评论