火车头采集器采集正常,发布失败提示无标题(实际上标题采集正常)

火车头采集器采集正常,发布失败提示无标题(实际上标题采集正常),第1张

这个问题应该是dedecms的一个bug,53和55都存在这个bug

要解决这个问题的办法是:在网站后台系统基本参数设置里,其它选项,删除非站内链接(选否),然后确定,再清空缓存

  关于采集的优与却点,这个主要看个人是怎么认为的,基本上国内的cms系统都带采集,因方便快捷,普遍被站长们接受,因选择采集过后,就不需要挖空心思的去想如何创建站内容。当然采集不好是因为大家都去采集,可以说大量的内容堆积形成了一个垃圾圈,当然搜索引擎也是拒绝收录或者被k掉。这里我们就不谈采集优点与缺点,因为我自己也是很矛盾的,虽然我认为采集不够好,但我每天仍然会用到它。以下仅仅是我个人的看法,希望能给新手一定的帮助。

  采集也就是我们把别人网站上的内容给弄到自己的网站上去。你可以用Ctrl+C 然后再Ctrl+V。但是复制与粘贴不同的是,它批量的,是程序智能化的。你手工能在一分钟能复制多少文章可想而知,当然还要分开文章标题和内容,甚至发布时间,作者等。如果用采集就不一样了,在性能允许的情况下,它可以一分钟采集几百篇文章。从而大大减轻了站长们的时间。

  国内的cms一般都带采集功能,并且都在不断完善提升之中,还有一些原来没有的采集功能的论坛及博客程序,都会有人开发出采集插件。因个人比较喜欢使用dedecms也就是(织梦)所以对其他的cms系统不是很了解,但是网络上相关教程很多,大家可以自行查找后,阅读以下即可。除此之外还有哪些程序自带采集了,我们可以百度以下看看,很多的如php168、phpcms、帝国cms、动易、新云、等等。

  下面会讲一个比较强大的采集器,那就是火车头,火车采集器是用来批量采集网页,论坛等的内容,直接保存到数据库或发布到网站的一种工具,他们可以根据用户设定的规则自动采集原网页,获取格式网页中需要的内容。

  DEDECMS:功能强大,新手需要多学习,才能掌握。功能无比强大,相信用过的人都知道。不过DEDE有词语替换,只要你导入词语替换数据,那么它就可以执行替换了,这对伪原创还是比较好的。

  php168:

  1自带新浪新闻采集系统,可以很方便自由的采集新浪国内、国际、社会、娱乐、科技、财经、军事、体育精选新闻。

  2可以自由添加采集参数,并且可以共享采集参数,即可把采集参数导出来,分享给其他人。

  3可以很方便的采集类似奇虎这样的新闻,也就是说你可以做一个像奇虎这样的站。

  帝国cms:

  1使用简单:无需会任何程序,只需在相应的内容加上相应的标签即可。

  2多重过滤:同一链接可设置不重复采集;设置采集关键字(不包含不采集);内容字符替换;广告过滤;过滤相似信息;过滤标题相同信息;可设置采集前几条记录。

  phpcms:整个站点内容页(注意是内容页,就是文章的详细展示页面)的通用规则,这里如果设置好后,以后添加采集任务时,会自动继承这个规则,就会省很多工作量。

  火车头:功能强大自定义参数,不过新手可以参照官方教程一步步操作。像这种采集软件,一般只要在网站程序没有采集功能,或者功能不够强大达不到自己要求的朋友可以去使用看看。个人感觉,火车头是比较不错的采集软件。

  采集的优缺点

  虽然本文章没有提到,这里还是给新手朋友们仔细的分析一下。

  优点:可以花少量的时间来完成很多文章的分布。一个小时可以发上千篇文章。减少了网站维护和写作时间,给站长提供了方便。

  缺点:内容高度重复,因为你是采集别人的文章,所以你和别人的文章大量的重复,就算你是伪原创也同样,你想想如果100个人都使用伪原创工具,那和采集的不还是同样的吗先不谈伪原创工具的好与不好,如果互联网上充斥着那样的文章,却一点可读性的价值都没有,你觉得你的网站能留得住客户吗网站内容的重复带来的结果就只有,收录少,排名低。

  建议新手朋友们的方法

  在网上看到一些人说做网站是很简单的,只要把程序安装上去,然后采集就ok了。还说什么采集比较适合新手,个人觉得就是扯淡,一个网站没有可读性,有价值的文章,你觉得你这样能留住客户吗我希望的是新手尽可能的少用采集,多充实一些比较有价值的文章,也就是你的原创文章,不要一咕噜的采集。以下说几点希望对新手有用。

  1新手用了采集,那么就会产生惰性,以后就算做站,都会选用采集器。

  2新手建站本身就是个学习的过程。自己写文章是很重要的。先不说你是否具备能写,或者你写不出来,你改别人的文章也是好的。这样不仅比伪原创的程序高,而且可读性也较高。最重要的是新手朋友可以从中不断学习与提升自己的知识。

  3 误导了新手对建站的看法。本来建站就是服务网民,给自己带来收益。而使用采集过后,特别是那些伪原创工具一旦使用过后,那就是向前看,而不管网民是否喜欢。这样会让新手变得目光短浅,不利于长期的发展。

  4 不利于新手学习seo,如果用采集器,那基本上就用不到seo了,seo是一个理论+实践的过程。只有在实践中论证理论,改变自身错误的看法,才能真正的把握seo的核心部分。

  个人认为新手尽量靠自己的手来写文章,尽管写的不好,我相信以后会好的,如果是想赚钱,那也不要是使用采集器,因为网络上赚钱不是你想的那么简单。别以为,建个网站,就有钱了。这个方法如果在前两年还行得通,而现在却行不通了。如果你要想赚钱,必须有一个过程。所以对新手说,每天写一篇文章都可以,然后不停地学习、实践,我相信目标会离你越来越近。

1

大家都知道php有个函数htmlspecialchars()是将预定义字符串做转换的,而htmlspecialchars()这个函数在php54默认为utf8编码的

2

一般建站新手站长搭建织梦环境都是用的dedeampz织梦集成环境一键搭建的织梦环境,原因就在这里了,dedeampz搭建完成的CMS网站默认的编码格式是gbk的

3

如果你安装的是织梦53或者56可能没事,因为dede56之前的版本其中php的版本默认配置的是53版本的php,但是织梦57开始集成其中的php是54版本的,而这时的php54默认编码格式跟环境的编码格式冲突(格式不一致)

4

格式不一致的时候如果你输入的标题是纯英文+数字,这没问题,能正常使用,因为编码格式utf-8跟gbk的区别在于中文字符

5

如果你输入的是中文字符,那么htmlspecialchars()函数在转换的时候因为编码格式不同导致的乱码是他不识别,所以就直接输出空,因为他什么也没有转过来,这也就是为什么你输入汉语标题提交,却提示“标题不能为空”的原因!

6

问题分析清楚了,解决方法也很明显了,下面提供两种解决方法

第一种:将php的版本切换回53版本或者比53更早的版本的,这个问题自然就解决了

7

第二种:给htmlspecialchars(函数)添加ENT_COMPAT ,'GB2312'

就是给php的这个函数强制设定编码格式,这样也能解决这个问题,具体对应的位置是

①:dede/article_addphp 这个php文件中查找

$title = htmlspecialchars(cn_substrR($title,$cfg_title_maxlen));

改成

$title = htmlspecialchars(cn_substrR($title,$cfg_title_maxlen),ENT_COMPAT ,'GB2312');

②:然后再找到dede/article_editphp这个php文件中查找

$title = htmlspecialchars(cn_substrR($title,$cfg_title_maxlen));

改成

$title = htmlspecialchars(cn_substrR($title,$cfg_title_maxlen),ENT_COMPAT ,'GB2312');

③:include/ckeditor/ckeditor_php5php 查找

htmlspecialchars($value)

改为htmlspecialchars($value, ENT_COMPAT ,'GB2312')

这样也能解决以上问题

本文采用http://jingyanbaiducom/article/11c17a2c60027df446e39d0chtml站点信息

解决的请点赞

完全没看懂你想问什么,你是想说需要采集某个标签然后发布到DEDE还是其他的意思?

如果是采集标签,首先讲采集部分,需要针对该采集部分添加一个标签去采集,具体的就是在火车头的那个采集规则里添加,

发布部分需要在DEDE中后台添加字段,然后修改火车头发布模块(如果dede原本就带有的话就不需要修改)

dedecms在采集时如果遇到会自动采集和它的属性的(譬如头条,幻灯片,推荐等) 但如果没有就只能显示无省略图了,这个没办法改变的, 如果觉得不美观你可以在修改时添加相关的并作相应的设置

DABAN RP主题是一个优秀的主题,极致后台体验,无插件,集成会员系统
网站模板库 » 火车头采集器采集正常,发布失败提示无标题(实际上标题采集正常)

0条评论

发表评论

提供最优质的资源集合

立即查看 了解详情