火车头采集下来怎么发布到网站上?

火车头采集下来怎么发布到网站上?,第1张

1

大家都知道php有个函数htmlspecialchars()是将预定义字符串做转换的,而htmlspecialchars()这个函数在php54默认为utf8编码的

2

一般建站新手站长搭建织梦环境都是用的dedeampz织梦集成环境一键搭建的织梦环境,原因就在这里了,dedeampz搭建完成的CMS网站默认的编码格式是gbk的

3

如果你安装的是织梦53或者56可能没事,因为dede56之前的版本其中php的版本默认配置的是53版本的php,但是织梦57开始集成其中的php是54版本的,而这时的php54默认编码格式跟环境的编码格式冲突(格式不一致)

4

格式不一致的时候如果你输入的标题是纯英文+数字,这没问题,能正常使用,因为编码格式utf-8跟gbk的区别在于中文字符

5

如果你输入的是中文字符,那么htmlspecialchars()函数在转换的时候因为编码格式不同导致的乱码是他不识别,所以就直接输出空,因为他什么也没有转过来,这也就是为什么你输入汉语标题提交,却提示“标题不能为空”的原因!

6

问题分析清楚了,解决方法也很明显了,下面提供两种解决方法

第一种:将php的版本切换回53版本或者比53更早的版本的,这个问题自然就解决了

7

第二种:给htmlspecialchars(函数)添加ENT_COMPAT ,'GB2312'

就是给php的这个函数强制设定编码格式,这样也能解决这个问题,具体对应的位置是

①:dede/article_addphp 这个php文件中查找

$title = htmlspecialchars(cn_substrR($title,$cfg_title_maxlen));

改成

$title = htmlspecialchars(cn_substrR($title,$cfg_title_maxlen),ENT_COMPAT ,'GB2312');

②:然后再找到dede/article_editphp这个php文件中查找

$title = htmlspecialchars(cn_substrR($title,$cfg_title_maxlen));

改成

$title = htmlspecialchars(cn_substrR($title,$cfg_title_maxlen),ENT_COMPAT ,'GB2312');

③:include/ckeditor/ckeditor_php5php 查找

htmlspecialchars($value)

改为htmlspecialchars($value, ENT_COMPAT ,'GB2312')

这样也能解决以上问题

本文采用http://jingyanbaiducom/article/11c17a2c60027df446e39d0chtml站点信息

解决的请点赞

文字、、flash、论坛附件、软件站资源可以一网打尽。强大的内容采集和数据导入功能能将您采集的任何网页数据发布到远程服务器,cms系统,或保存为本地文件,Access、MySql、MS SqlServer数据库。不管你的网站是什么系统,都可以使用上火车头采集器

当然程序不光是用来采几篇文章的。使用它,你可以自动获取那些经常更新的信息,比如域名过期信息,最新新闻等。你也可以将它做为一个论坛灌水或是发帖机,顶帖机来用,前提是您做好发布模块。您也可以将它视作一下或是文件批量下载工具,程序自带的下载功能不差于主流的一些下载工具。当您将它用来发送 数据,可以实现更为复杂的功能。 火车采集器(LocoySpider)是一款功能强大且易于上手的专业采集软件,强大的内容采集和数据导入功能能将您采集的任何网页数据发布到远程服务器,自定 义用户cms系统模块,不管你的网站是什么系统,都有可能使用上火车采集器,系统自带的模块文件支持:风讯文章,动易文章,动网论坛,PHPWIND论坛,Discuz论坛,phpcms文章,phparticle文章,LeadBBS论坛,魔力论坛,Dedecms文章,Xydw文章,惊云文章等的模块文件。更多cms模块请自己参照制作修改,也可到官方网站与大家交流制作。 同时您也可以使用系统的数据导出功能,利用系统内置标签,将采集到的数据对应表的字段导出到本地任何一款Access,MySql,MS SqlServer内。

1、运行火车头软件,点击发布到发布窗口界面;

2、点击添加,依次选择发布接口,选择网站编码、填写后台路径、(因为是免登陆接口)选择不需要登录&http请求,然后获取列表看看是否成功,成功后请保持配置。

(注意:如果无法获取列表说明没有配置成功,检测接口文件是否上传,后台路径是否正确等)

3、如果你需要同时发布到多个网站,请重复2操作,原则上可以发布N个。

4、配置完发布接口后回到火车头界面,双击你要发布的采集规则,进入采集规则 编辑任务窗口,切换到第三步:发布内容配置;

5、点击 启用 Web在线发布到网站,然后添加发布配置,在弹出Web发布配置窗口选择你你的发布配置,点击添加,多个网站发布可以多选;

6、双击你添加的网站发布,点击获取列表 绑定你要发布到网站的指定栏目的栏目ID,保存规则,到此你的采集规则发布到网站已经配置好了;

7、如果你要一条采集规则多个网站发布就重复第6步,原则上可以发布N个站。

八爪鱼采集器是一款功能全面、操作简单、适用范围广泛的互联网数据采集器,不同于火车头采集器。八爪鱼采集器可以通过智能识别和灵活的自定义采集规则设置来采集网页中未加载的内容。以下是一般的采集步骤:1 打开八爪鱼采集器,并创建一个新的采集任务。2 在任务设置中,输入要采集的网址作为采集的起始网址。3 配置采集规则。可以使用智能识别功能,让八爪鱼自动识别页面的数据结构,或者手动设置采集规则。4 如果手动设置采集规则,可以通过鼠标选择页面上的数据元素,并设置相应的采集规则,以确保正确获取所需的数据。5 设置翻页规则。如果需要采集多页数据,可以设置八爪鱼采集器自动翻页,以获取更多的数据。6 运行采集任务。确认设置无误后,可以启动采集任务,让八爪鱼开始采集数据。7 等待采集完成。八爪鱼将根据设置的规则自动抓取页面上的数据,并将其保存到本地或导出到指定的数据库等。八爪鱼采集器拥有强大的数据采集能力,可以帮助用户轻松采集各类网页数据。了解更多八爪鱼采集器的功能和使用方法,请前往官网教程与帮助了解更多详细信息。

DABAN RP主题是一个优秀的主题,极致后台体验,无插件,集成会员系统
网站模板库 » 火车头采集下来怎么发布到网站上?

0条评论

发表评论

提供最优质的资源集合

立即查看 了解详情