dede文章网址匹配规则 不能包含怎么为多项
织梦网站的建站的一般步骤,用自己的话简要说明下
1、要有虚拟主机、mysql数据库和域名
2、上传dedecms程序到虚拟主机根目录,安装dedecms,安装过程中需要填写数据库账户、密码等信息。
3、安装dedecms后,就需要调试dedecms模板了。
织梦cms如何建站织梦站总结篇,小编将会把整个仿站的思路进行理清并讲解:
1服务器准备
如果是学习测试,小编建议:使用本地软件模拟即可。下载phpstudy在本地搭建环境,模拟服务器环境,需要修改步骤:
1找到phpstudy下相应的WWW下的网站目录文件设置
2打开apache和MySQL(可以设置相应的版本)
3数据库的密码账号设计,即可打开网站
2准备采集器
下载需要模仿的网站的资料(css\js\img\html等),放在设置的WWW下的文件里
3织梦标签生成器
下载一个织梦标签生成器,也可以使用在线版
4准备一个网页html编辑器
进行网页代码的修改,修改的部分也是比较少的,最主要的是嵌入织梦的后台调用数据代码
5到织梦官网下载一个基础后台
6安装织梦模板,安装地址:www域名/install
7修改相关的模板文件页面,类似于:\\list_等网页
最后修改完成,记得生成;注意文件的备份
用dedecms仿站,详细的步骤有哪些?1、找到目标网站,分析一下结构
2、用工具将需要仿的页面down下来,包括html文件和和css以及js文件等等
3、用dreamweaver编辑html文件,将织梦模板特有的标签套用进去
4、标签都替换好之后,将其替换到织梦的模板文件中
5、模板都做好之后,后台生成下静态文件,就ok了。
如果你要启用字符串混淆来防采集,请在文档模板需要的字段加上 function='RndString(@me)' 属性,如:{dede:field name='body' function='RndString(@me)'/}。
更新缓存,再更新html
1、织梦CMS文章采集
新建一个文章采集节点,后台——采集——采集节点管理——增加新节点,选择内容模型为普通文章。
设置节点基本信息。目标源码同上篇文章所说,通过查看目标网站源代码后设置,区域匹配模式默认字符串,只有在字符串无法确定区域的时候才用正则表达式,不过一般都用不上。最后就是织梦cms采集的特点之一防盗链模式,如果目标网站有防盗链功能则开启次功能可以成功采集,但是会降低采集速度。次测试目标网站没防盗链功能,所以不开启。
列表网站获取规则。同上篇文章分析,列表网址是有规律的可批量生成。这里要说下dedecms的强大之处,不仅获取列表网址的方式能灵活组合,而且如果目标网站整站使用的都是同一个模板,就可以启用“多栏目通配(#)”功能,通过设置后一个采集规则就可以采集整站并发布不同栏目了,而不需要一个栏目对应一个规则。(此功能小编会另外单独写一篇教程)
文章网址匹配规则。查看目标列表页源代码,设置要采集文章网址区域的开始和结束的html,接下来又是dedecms特点之一,如果采集网址页面链接有可直接设置采集为缩略图,非常方便。对区域网址进行再次筛选功能也有特色,除支持正则表达式外还声明了“必须包含”和“不能包含”的优先级,本篇体验目标站无干扰网址,所以留空。
保存并测试,系统会应用前面的设置测试采集网址,完整无误后保存信息并进入下一步内容采集设置。
网页内容获取规则。系统会默认一个采集url为预览网址,另外内容分页导航所在的区域匹配规则也很灵活,除了和phpcms一样有全“部列出的分页列表模式”、“上下页形式或不完整的分页列表模式”外,还多了一个“分页列表规则”。
各字段内容采集,dedecms的内容匹配规则和phpcms一样:“起始无重复HTML[内容]结尾无重复HTML”,[内容]即为所采内容。过滤规则是{dede:trim replace=""}规则{/dede:trim},多个规则的话一个一行,如果要替换成指定的值,则只要在replace=""的引号里设置即可。
其中,内容摘要、关键字、缩略图系统会用正则进行自动匹配,我们只需设置过滤内容即可。其余字段分别设置匹配规则和过滤规则,系统同样自带了几个常用的过滤规则,但是点击“常用规则”后为弹出小窗口模式,稍微有点不方便。针对本测试的标题采集,以下两种方式都是可以的,如图:
文章作者、文章来源和发布时间字段一样采集,但是此版本dedecms在这几个字段下没有“自定义处理接口”了,如果有的话会稍显灵活,例如设置固定值可直接用“@me="固定值"”实现。现在不能用自定义处理接口设定固定值,也没有字段值设置,只能通过采集网页某一固定值然后用替换。如图:
dedecms的文章内容采集非常强大,除了匹配规则和过滤规则,还有个“自定义处理接口”。如果你有php基础的话,可以通过此功能对采集结果@me进行各种处理,强大到不行啊。以后小编会专门发一篇此功能的讲解文章。最后,不能直接在采集管理处新增采集字段,只能在对应内容模型管理中增加字段,采集管理会自动增加。如小编在“普通文章”内容模型那增加了一个“chinaz字段”,则采集设置中自动增了一个“chinaz字段”项目。
保存并测试,查看列表测试信息和网页规则测试,检查是否正确,无误后确定并开始采集。进入采集指定节点设置页面,因为小编之前有测试一遍,所以有60个历史种子网址,即小编之前已经采集了60个网址,另外还有几个选项大家按需求选择。
点开始采集网页,出现此采集提示信息显示采集进度,不知道是小编人品不好还是dede采集本身缺点,经常会浏览器没反应,采集停止在那,只有手动点击了才会继续。
采集完成后点右上角的“导出数据”,然后选择导出栏目,如果你在前面启用了“多栏目通配(#)”并指定了栏目ID,则要勾选此处的“批量采集选项”,其余选项根据自己需求选择,然后确定。如果勾选了“完成后自动生成导入内容HTML”则会在导入完后自动更新网站,否则就要先手动去生成。
通过这个系统,可以方便的治理,发布,维护网站的内容,而不再需要硬性的写HTML代码或手工建立每一个页面。CMS有什么优点?可以应用在什么地方?在CMS领域,在各个层面都有极多地优点,在政府上网,学校上网,商业门户,信息港,地方门户网,等各种设计到文章发布和用治理的网站建设中。 可以针对各种内容进行分类和发布治理。可以针对不同类型的用户发布不同的内容,可以将各种内容进行分类。
可以任意定义内容类型与多媒体支持。
用户接口可编辑性强,可以根据客户要求订做用户接口和风格模块。
可分布式治理。站点治理和维护人员无须集中在同一个办公室,甚至都不用在同城,全球任何一个有网络的地方都可以让您实现高效率的治理。
可开发性强,可以针对不同的需求进行专门的开发。
轻易使用。任何一个人在经过十个小时左右的专业培训后就可以很轻松的治理并运作整套系统。
假如您的公司需要制作一个网站来介绍和推广您的产品,要进行网上客户支持或者开通上网购物等服务的话。一套继续了在线购物功能的CMS系统将可以成为非常不错的选择。同时各种类型的新闻以及文章发布,个人或者团体的weblog,在线小区,广告,下载,投票都可以选用CMS系统。CMS系统本身就是一个内容治理系统(英文全名:Contents Management System),在所治理的内容中,可以包括文章,,投票,广告,下载,多媒体文件,甚至可以嵌入论坛,留言板。对于文章可以进行分类治理,可以对同类型标题进行索引,根据要害字来搜索这个栏目中的相关主题的文章。对于的治理可以做成相册,也可以做成展览性质的专题站。在下载方面,可以通过FTP治理来进行下载,也可以使用普通常见的HTTP用户名加密访问进行下载,而CMS本身也支持下载治理,对各种属性的文件,流媒体都可以进行治理。社区论坛,留言板等需要进行用户治理的功能,可以通过CMS与论坛系统结合后实现,而CMS本身并非一个强大的用户治理系统,内容治理就是内容治理。相比之下,假如需要强大的用户治理功能,不如选择一套在用户治理上面比较专业的论坛。
首先明确下发布的每一篇新闻都是文章,每一篇文章都有flag属性。
flag属性包括:头条[h]推荐[c][p]幻灯[f]滚动[s]跳转[j]图文[a]加粗。
那么就可以根据flag属性来区别新闻和文字新闻。
新闻的flag属性无疑是p,
文字新闻的flag属性可以设置为c。
因此新闻的调用标签是{dede:arclist flag='p'}
文字新闻的调用标签是{dede:arclist flag='c'}。
学长先帮你到这里了。
第一:基础优化
网站后台-->系统基本参数-->文档HTML默认保存路径,清除掉,所有的栏目地址都保存到根目录即可。
第二:网站地图
第三:栏目和文章页标题
可以给织梦网站的栏目设置不同的关键词,针对栏目设置的关键词来做文章,这样对能够大大提高栏目页的权重,还有文章页面的关键词,充分利用长尾关键词能给网站快速增加流量有优势!(这个关于织梦的相关优化搜外都有教程)
第四:织梦CMS程序应用
织梦后台功能还是很强大的,比如采集-->文档关键词维护-->可以添加已经发布过的文章关键词做锚文本,可增加用户粘度和提高用户体验,建议把关键词频率设置为2-3比较合适,不断的积累,细水长流。
第五:系统安全
如果是简单企业站,可以删除根目录中install,member,tagphpindexphp这些文件,会提高系统安全性。
如何使用dedecms自带采集功能的文字过滤与替换的方法
使用dedecms建站一般都会用到采集功能 这篇文章将为您讲述: 如何使用dedecms自带采集功能的文字过滤与替换的方法
1去除超链接,这种最常用。
{dede:trim replace=”}<a([^>])>{/dede:trim}
{dede:trim replace=”}</a>{/dede:trim}
如果填成这样,那就把链接的文本也一起去掉了
{dede:trim replace=”}<a([^>])>()</a>{/dede:trim}
2过滤JS调用广告,比如GG的广告,就加个这样的:
{dede:trim replace=”}<script([^>])>()</script>{/dede:trim}
3过滤div标签。
这个很重要,如果没过滤干净则可能使发布出来的文章版面错位, 目前大多数遇到采集后错位的原因在此。
{dede:trim replace=”}<div([^])>{/dede:trim}
{dede:trim replace=”}</div>{/dede:trim}
有的时候也需要这样子过滤:
{dede:trim replace=”}<div 选择器>()</div>{/dede:trim}
4其它的过滤规则可以照以上规律进行推出。
5过滤摘要和关键字使用,经常要用到。
{dede:trim replace=”}{/dede:trim}
6简单替换。
{dede:trim replace=’替换后的词语’}要替换的词语{/dede:trim}
采集的内容当然也要求搜索引擎收录, 过滤和替换目的是减少重复,进行伪原创,如何具体的操作,就看个人的要求与喜好了。
本文由织梦者转自网络
这个问题应该是dedecms的一个bug,53和55都存在这个bug
要解决这个问题的办法是:在网站后台系统基本参数设置里,其它选项,删除非站内链接(选否),然后确定,再清空缓存
0条评论