安下载(俺下载):打造放心的绿色安全下载站! 安下载首页|软件分类|最近更新

所在位置: 首页  >  电脑软件  >  网络软件  >  网络辅助 > 无人值守免费自动采集器 v3.4.6 绿色版
无人值守免费自动采集器

无人值守免费自动采集器

 v3.4.6 绿色版
  • 软件大小:22.9 MB
  • 更新日期:2019-07-11 15:42
  • 软件语言:简体中文
  • 软件类别:网络辅助
  • 软件授权:免费版
  • 软件官网:
  • 适用平台:WinXP, Win7, Win8, Win10, WinAll
  • 软件厂商:

6
软件评分

本地下载文件大小:22.9 MB

软件介绍 人气软件 下载地址

为您推荐: 网络软件

  无人值守免费自动采集器是一款可自动采集信息的软件,此软件也可以简称为ET,无需人工操作,此软件24小时自动完成采集工作,可长期运行,即使是以年为单位。此外,本款软件无需繁琐的安装步骤,支持查看采集目录以及采集的文章,大致的操作流程为建立方案->配置采集规则从目标获取信息->配置中间规则->配置发不规则,将信息添加到您的网站->开始自动工作,操作简单,只需要根据软件的提示完成即可。目前此软件支持windows xp简体中文版、windows 2000简体中文版、windows 2003简体中文版、windows vista简体中文版;对于其他语言环境的windows系统,部分可以使用,用户可自行尝试,开发方不提供对应技术支持,用户自行选择下载。

无人值守免费自动采集器

软件功能

  设置劫持特征代码

  很多地区的电信宽带用户在上网时,会被强行在访问信息中,用一些代码替换访问信息,让用户只能通过代码中的框架查看原本要访问的网页,这通常用来显示电信的广告或进行其他隐秘的动作,这种行为被称为劫持浏览器;当出现这种情况时,ET所采集的源码也只能得到这些劫持代码,而不是要采集的网页源码。通过设置这些劫持代码的特征字符串,ET会尝试突破劫持访问真实的网页源码,最多可以重试5次访问该网址。

无人值守免费自动采集器

  设置UserAgent

  网站通过userAgent来判断当前用户使用的是什么浏览器,并根据这个浏览器能够支持的情况提供相应的功能。浏览器在访问一个网页时通常会传送一个识别字串告诉网站它是什么浏览器软件,我们访问的部分网站会对UserAgent进行限制,我们可以在基本设置中修改UserAgent,也可以点击'获取本机UserAgent'按钮获得本机的IE默认UserAgent。

无人值守免费自动采集器

  自动工作

  选择好将要执行的工作方案后,点击主窗口左侧下方的自动按钮,即可开始全自动工作,用户从此时起可以扔掉鼠标键盘、抛开繁累的网站更新,与朋友结伴出游,网站内容自有ET为您默默收集更新。

  处理文章

  当文章列表区中有待处理文章时,点击主窗口左侧下方的‘处理文章’按钮,将按顺序对文章列表区的第一项待处理文章执行采集动作,在文章列表区,双击某项文章条目,将对该篇文章执行采集动作,无论这篇文章是否已经被处理。

  工作记录

  该栏记录ET的每一步工作过程及状态,包括目录采集和文章处理两大部分,我们通过工作记录可以了解该次采集执行是否正确完成,或是出现了什么问题;当出现问题时,可以根据提示、结合信息栏的其他反馈内容,用户可以迅速准确地找到故障原因并予解决。

  采集源码

  此栏显示执行过程中所采集的文章列表页、文章页面、文章分页等的网页源代码,利用此栏源代码,可以方便的进行规则测试、提供规则定制依据。

  分析数据

  此栏显示文章处理过程中的各个数据项信息,从分析到的原始代码,到整理后的代码,再到经过URL修正后的代码,用户通过查看此栏,可以了解设置的数据项分析规则是否准确、整理组规则是否完善、最终的信息是否符合自己的要求。例如:当工作记录栏提示错误‘正文字数大于或小于发布设置’时,我们可以查看本栏的‘正文’数据项,了解具体是大于还是小于发布设置,原因是正常还是因为整理组设置不当,从而调整各个设置。

  发送代码

  此栏显示ET向发布网站发送的数据,包括文章检查部分和文章发布部分;用户可以通过此栏信息了解通过一系列分析、整理操作,最终向发布网站提交的数据,用以检查自己的采集规则数据项、发布规则的参数设置等是否正确、完整。

  返回信息

  此栏显示ET向发布网站发送数据后发布网站的反馈,包括文章检查反馈和文章发布反馈;通过查看此栏,我们可以清晰的了解当采集过程出现问题时的大部分原因。一些接口在返回错误信息时,信息可能是HTML代码,不熟悉HTML代码的用户阅读比较吃力,点击WEB浏览按钮,可以在操作系统默认浏览器中方便的查看它们。

  步进标记

  点击[步进]按钮将标记插入到规则中或将选择字符串替换为标记。标记代码为,为选用项,表示网址中规律变化的数字字符串;[步进]标记在自动列表网址规则中可选用,并可使用多次

  子循环标记

  点击[子循环]按钮将标记插入到规则中或将选择字符串替换为标记。标记代码为,为选用项,表示网址中规律变化的数字字符串;[步进]标记每步进一次,[子循环]标记则进行一次循环,即嵌套循环;当自动列表规则中仅有[子循环]标记时,作用等同于[步进]标记;[子循环]标记在自动列表网址规则中仅能使用一次。

软件特色

  此软件无第三方恶意插件、病毒木马等危害电脑的信息

  支持无人值守,自动完成采集操作

  自动运行的时间长久,可24小时不间歇的进行采集工作

  此软件的稳定性能好,没有特殊情况发生就不会掉线

  下载文件和下载文章的速度快

  支持伪原创功能,可把别人的东西转换成自己的

  可支持采集任何信息到软件中

  支持将信息进行导出或导入

安装方法

  此软件无需安装,找到下载完成的压缩包并解压,然后双击“ET采集3.exe”应用程序即可进入软件界面。

无人值守免费自动采集器

使用方法

  从列表中采集缩略图

  1、在系统导航栏中找到采集配置功能然后点击进入相关界面,然后在选择列表设置。

无人值守免费自动采集器

  2、找到列表分析规则后点击页面地址,然后选择缩略图。添加完成后得到如图所示的编码。

无人值守免费自动采集器

  3、然后在【缩略图数据项】中设置它的相关参数,注意,【缩略图数据项】中采集规则留空时,数据项的取值就是【缩略图标记】的采集结果。

无人值守免费自动采集器

  4、滑动鼠标到页面底部,因为我们采集到缩略图通常是图片地址,所以,文件选项里勾选【作为文件网址】。

无人值守免费自动采集器

  5、点击文件下载,勾选启用下载前的选项框。

无人值守免费自动采集器

  6、最后,一定要在发布配置的发布项窗口中使用数据项标记给网站的缩略图参数赋值才会生效。

无人值守免费自动采集器

  7、ET3支持多层列表,在多层列表中使用【缩略图标记】,将以最后一次使用【缩略图标记】的采集结果作为【缩略图数据项】的值。

无人值守免费自动采集器

常见问题

  ET3多层列表中同名标记的用法

  在ET3的新功能多层列表中,每个列表页的列表分析规则都有名称相同并且可以调用的“文章标题”、“缩略图”、“附加信息”等标记,那么各个列表页之间这些同名标记的关系如何,该怎么使用呢。

无人值守免费自动采集器

  一、同一列表页的标记

  和单列表页时一样,在网址合成中可以调用从该页面的列表分析中获取的[页面地址]、[附加信息]。

  二、不同列表页的同名标记

  1、[文章标题]

  在多个列表页中获取的[文章标题],将去除首尾空白字符后按从上到下的顺序合并,并以空格分隔。

  合并的内容将作为“列表数据-文章标题”,在采集目录时显示并可在数据整理中调用。

  如果数据项中没有设置“标题”数据项的采集规则,它将作为“标题”数据项的值。

  2、[缩略图]

  如果有多个列表页使用了[缩略图]标记,那么只有最后一次获取到的[缩略图]有效。

  它将作为“列表数据-缩略图”,可以在数据整理中调用。

  如果“缩略图”数据项没有设置采集规则,它将作为“缩略图”数据项的值。

  3、[附加信息]

  [附加信息]有三个标记,用法相同。

  如果有多个列表页使用了[附加信息]]标记,那么只有最后一次获取到的[附加信息]]有效。

  它将作为“列表数据-附加信息”,可以在数据整理中调用。

  从3.1.7版开始,如果列表分析规则中没有使用[附加信息]标记,而在网址合成中使用了[附加信息]标记,那么该标记的取值将调用上层列表页中的同名[附加信息]标记的取值,即上层列表页的最后一次有效同名标记的取值。

  为什么发布配置的检查网址里不能调用数据项

  发布配置的检查网址栏里,只有一个[文章标题]的按钮,不能在这里调用其他数据项的值。

无人值守免费自动采集器

  因为ET在使用检查网址执行文章重复检查时,还没有执行数据项的采集,自然也就无法调用数据项的值,这是为提高效率,节约时间所做的设计。

  如果在所有的数据项采集都完成后再去进行文章重复检查,那么当文章重复时,前面的所有工作就都做了无用功,造成了极大的浪费。

  用户有多个数据项的值参与重复检查的需求时,可以在发布接口文件中增加文章重复检查功能,而将检查网址留空,不使用检查网址进行文章重复检查。