关关采集器是一款完全免费的无限制网络资源数据采集软件。关关采集器破解版具有运行稳定、功能强大、操作简便等优点,可以为用户提供专业强大的采集功能,支持乱序采集模式,可以自定义不同生成方式目录和内容,使得采集和生成速度更快更稳定,同时提供章节重复检测手工模式,可以有效去除重复内容。
【基本介绍】
关关采集器是一款可以帮助用户朋友对指定的网页链接进行批量采集的工具,如果您有一系列关键词需要统计所包含的网页,不如使用这款完全免费的关关采集器,输入指定关键词即可一键高速采集。
【软件功能】
1采集和生成速度更快更稳定!
2支持乱序采集模式(见演示图片)
3替换采集模式+图片行间水印+图片
FTP负载+文字图片化等等
4支持server2003或server2008
5集图片没有黑块和其他BUG,而且不会再有CPU达到100%
6不会出现界面卡死、运行缓慢等...
7配套伪拼音化
8数字化
9内连关键词设置,
10非拼音化的内连初始化提取
11打乱模式
12{pinyin}标签在列表页和内容使用
13信息和列表的状态标签
14书架拼音化标签
15信息页面的拼音化标签等..
16信息页面和列表页面的最后章节标签等..
17阅读页面的拼音化标签等..
18搜索拼音化的标签
【软件特点】
1、支持server2003或server2008;
2、软件十分稳定;
3、软件的采集和生成速度很快;关关采集器破解版支持技术售后服务
【采集编写教材】
关关采集器采集规则编写教程
在关关采集器Rules文件夹下建立一个xml文件。为了方便区分,今天给大家演示编写云谣阁的采集规则,我就把这个xml文件命名为yunyaoge.xml
点击规则--规则管理器 出现如图所示。点载入开始编写采集规则
下面说下需要填写的内容
左边这里点击之后在右边都会出现相关的说明。很简单的。
只需要记住几个关键就行了 下面给大家举例说明一下记住一下几个正则
今天给大家演示采集的网站是www.yunyaoge.com,我们就打开这个网站首页,然后在网页随意空白处点击右键,然后点查看源文件(或者是查看网页源代码浏览器不同,显示的不同,但是意思是一样的),这里我看可以看到<meta charset="gbk" /> 表示这个网页是gbk编码的。这里在这里让填写编码我们就写gbk就行了
同样的道理,下面的novelname novelauthor这些我们都直接正则匹配就行了。就拿novelname来说 我们打开网页http://www.yunyaoge.com/xs/0/88/点击查看源文件,找到作者<meta property="og:novel:book_name" content="圣墟" />那么我们这里直接写<meta property="og:novel:book_name" content="(.+?)" />如图所示
一步一步的写完,那么接下来就是测试结果了。如果哪里有不对的地方,测试的时候会有提示。按照提示再修改就行了
【具体操作】
使用前请先设置好数据库和网站目录,而且设置好这两点之后只能把关关采集器关闭然后再打开才能生效!切记切记!
分类设置设置正确来保证你采集到的小说在你网站上显示的是正确的。
具体说明
1|玄幻魔法=,玄幻,魔法,玄幻魔法,异陆,穿越,奇幻,奇幻-异界幻想,奇幻-仙侠情缘,奇幻-妖精灵怪,奇幻-西方魔幻,奇幻-吸血家族,玄幻小说,重生文学,奇幻小说,玄幻异界,奇幻魔法,穿越架空,
=前面的是你网站的分类。 比如你采集http://www.yunyaoge.com/xs/0/88/这本小说。他的分类是玄幻小说,你只要写1|玄幻魔法=,玄幻小说, 就行了 一一对应,很简单
生成设置,如果你网站是伪静态的网站,生成目录页html 生成内容页html这些都不用选。只需要选个生成opf就行了。
采集动作这里,建议大家不要选检测重复章节。否则会有好多内容章节采集不到!有点相似的他就给你过滤了,真心很坑
高级设置这里的功能也是,说明也很详细,看自己需要勾选就行了
开始采集后可以看到采集进度
【更新日志】
1增加手工模式分卷删除.
2增加手工模式选择性插入采集.
3增加手工模式编辑文章.
4更新数字化BUG速度更快.
5增加定时生成静态首页提高网站稳定性
6支持定义不同生成方式目录和内容独立
7支持章节重复检测手工模式
8支持章节缺少TXT检测手工模式
9支持批量删除支持jieqi和qiwen
10支持批量生成增加自定语句多ID切割
11增加自定章节,缺少字数,或缺少内容为空替换指定内容
12增加杂项可以获取段内容调用标签
13增加相邻书推荐功能.
14增加随机推荐书功能.
15增加TXT专页面生成功能
16支持上一页下一页地址定义
17支持规则设置专码提取新地址内容
18支持jieqi1.8Cms最新建站系统
19增加超级防采集器模式混合模式