新人昨天创建了一个**网站,主要是手机看**,用的dedecms自带采集,但是采集**采集不了,有
1、织梦CMS文章采集
新建一个文章采集节点,后台——采集——采集节点管理——增加新节点,选择内容模型为普通文章。
设置节点基本信息。目标源码同上篇文章所说,通过查看目标网站源代码后设置,区域匹配模式默认字符串,只有在字符串无法确定区域的时候才用正则表达式,不过一般都用不上。最后就是织梦cms采集的特点之一防盗链模式,如果目标网站有防盗链功能则开启次功能可以成功采集,但是会降低采集速度。次测试目标网站没防盗链功能,所以不开启。
列表网站获取规则。同上篇文章分析,列表网址是有规律的可批量生成。这里要说下dedecms的强大之处,不仅获取列表网址的方式能灵活组合,而且如果目标网站整站使用的都是同一个模板,就可以启用“多栏目通配(#)”功能,通过设置后一个采集规则就可以采集整站并发布不同栏目了,而不需要一个栏目对应一个规则。(此功能小编会另外单独写一篇教程)
文章网址匹配规则。查看目标列表页源代码,设置要采集文章网址区域的开始和结束的html,接下来又是dedecms特点之一,如果采集网址页面链接有可直接设置采集为缩略图,非常方便。对区域网址进行再次筛选功能也有特色,除支持正则表达式外还声明了“必须包含”和“不能包含”的优先级,本篇体验目标站无干扰网址,所以留空。
保存并测试,系统会应用前面的设置测试采集网址,完整无误后保存信息并进入下一步内容采集设置。
网页内容获取规则。系统会默认一个采集url为预览网址,另外内容分页导航所在的区域匹配规则也很灵活,除了和phpcms一样有全“部列出的分页列表模式”、“上下页形式或不完整的分页列表模式”外,还多了一个“分页列表规则”。
各字段内容采集,dedecms的内容匹配规则和phpcms一样:“起始无重复HTML[内容]结尾无重复HTML”,[内容]即为所采内容。过滤规则是{dede:trim replace=""}规则{/dede:trim},多个规则的话一个一行,如果要替换成指定的值,则只要在replace=""的引号里设置即可。
其中,内容摘要、关键字、缩略图系统会用正则进行自动匹配,我们只需设置过滤内容即可。其余字段分别设置匹配规则和过滤规则,系统同样自带了几个常用的过滤规则,但是点击“常用规则”后为弹出小窗口模式,稍微有点不方便。针对本测试的标题采集,以下两种方式都是可以的,如图:
文章作者、文章来源和发布时间字段一样采集,但是此版本dedecms在这几个字段下没有“自定义处理接口”了,如果有的话会稍显灵活,例如设置固定值可直接用“@me="固定值"”实现。现在不能用自定义处理接口设定固定值,也没有字段值设置,只能通过采集网页某一固定值然后用替换。如图:
dedecms的文章内容采集非常强大,除了匹配规则和过滤规则,还有个“自定义处理接口”。如果你有php基础的话,可以通过此功能对采集结果@me进行各种处理,强大到不行啊。以后小编会专门发一篇此功能的讲解文章。最后,不能直接在采集管理处新增采集字段,只能在对应内容模型管理中增加字段,采集管理会自动增加。如小编在“普通文章”内容模型那增加了一个“chinaz字段”,则采集设置中自动增了一个“chinaz字段”项目。
保存并测试,查看列表测试信息和网页规则测试,检查是否正确,无误后确定并开始采集。进入采集指定节点设置页面,因为小编之前有测试一遍,所以有60个历史种子网址,即小编之前已经采集了60个网址,另外还有几个选项大家按需求选择。
点开始采集网页,出现此采集提示信息显示采集进度,不知道是小编人品不好还是dede采集本身缺点,经常会浏览器没反应,采集停止在那,只有手动点击了才会继续。
采集完成后点右上角的“导出数据”,然后选择导出栏目,如果你在前面启用了“多栏目通配(#)”并指定了栏目ID,则要勾选此处的“批量采集选项”,其余选项根据自己需求选择,然后确定。如果勾选了“完成后自动生成导入内容HTML”则会在导入完后自动更新网站,否则就要先手动去生成。
首先,你仔细看看是不是按照这个dede的采集规则一步步操作的。
http://jingyanbaiducom/article/86fae34693d6443c49121af0html
还有下面这个,看看能不能帮到你
首页导航
<li><a href="{dede:globalcfg_cmsurl/}/">首页</a></li>
标签名称:channel
标记简介:织梦常用标记,通常用于网站顶部以获取站点栏目信息,方便网站会员分类浏览整站信息
功能说明:用于获取栏目列表
适用范围:全局使用
基本语法:
{dede:channel type='top' row='8' currentstyle="<li><a href='~typelink~' class='thisclass'>~typename~</a> </li>"}
<li><a href=' http://www63iicom'>小公主</a> </li>
{/dede:channel}
参数说明:
typeid = '0' 栏目ID
reid = '0' 上级栏目ID
row = '100' 调用栏目数
col = '1' 分多少列显示(默认为单列)
type = 'son | sun' son表示下级栏目,self表示同级栏目,top顶级栏目
还有就是如果还是不能解决问题。那就用第三方软件试试,比如火车头就还挺好用的。操作方法也不难。
祝你成功!
采集**,是很费劲的,还有织梦CMS不太适合做**站,你所说的手机看**,是指手机可以在线观看吗?如果是在线观看,你想要采集什么,是采集**的播放地址吗?采集**的播放地址,也就是一些很过时的免费**了,因为好的**都是收费的,或者是正在院线上映,如果你只采集过时的**,可以采集优酷,优酷有开放链接。你觉得这些过时的**会有几个人观看呢?所以说,个人**站都是搞一些收费的**,或者是正在上映的**,来提供用户免费观看的。这个具体怎么做,就应该不是采集的问题了,我可能回答的有点跑题了,可还是希望给个采纳,因为纯手打,还有你可以去百度搜索(趣址)哪里有好多在线观看的**站,你可以借鉴一下。
装个下面这个东西吧,里面还有一个PW论坛可以玩玩,我本地测试DEDECMS一般用这个,
安装後直接把DEDE程序解压放到WWW里面去可以啦
PHPWind Wamp 20是一个快速架设web环境的软件集成包(包括最新版的PHPWind 53 论坛系统)。您无须任何复杂操作,只要下载PHPWind Wamp 20软件包,点击安装,就能轻松实现站长的梦想。
一、 PHPWind Wamp 20优点
简单: 真正做到任何人都可以轻松架设论坛及环境只需下载PHPWind Wamp 软件包,点击安装文件即 OK。
高效: PHPWind Wamp 已经自动配置和优化了相关环境。
安全: 1安装PHPWind Wamp 20不改动您本地计算机的任何设置和文件保证您的计算机安全正常
2PHPWind Wamp 20采用最新的论坛程序,我们对此进行了优化和配置,论坛本身具有很高的安
全性
3PHPWind Wamp20采用了目前最新的PHP,apache,mysql版本,我们对此进行了优化和
配置,最大程度的提高了用户使用论坛程序的安全性和高效性
二、 安装环境需求及软件包简介
1系统需求
操作系统:Microsoft Windows2000/XP/2003
2软件包
集成软件: phpwind53简体中文GBK版高速论坛程序
phpMyAdmin-292
ZendOptimizer-322
mysql-5027
php-520
apache-224
三、 安装使用说明
1 下载PHPWind Wamp 20软件包
2 解压缩PHPWind Wamp 20软件包至任意位置;
3 执行exe文件,根据提示进行安装
4、相关帐户说明(安装完后及时修改论坛和数据库密码)
论坛创始人:
用户名 : admin 密码 :admin
MySQL 数据库:
用户名: root 密码: phpwindnet
0条评论