火车采集器官方版是合肥乐维信息技术有限公司旗下一款专业好用的大数据采集神器,从2005年到2017年,用户量一直稳居同类前列。火车采集器官方版主要以数据抓取、处理、分析,挖掘为核心功能,既可以支持目前所有主流和非主流的CMS,BBS等网站程序,灵活迅速地抓取网页上散乱分布的数据信息,火车采集器官方版还能完美支持采集所有编码格式的网页,且多个大型服务端同时稳定运作,快速分解任务量,最大化提升效率。除此之外,火车采集器官方版历经十二年升级更新,目前用户突破十万,在十二年间形成了良好的口碑,是目前最受欢迎的网页数据采集软件。
火车采集器官方版软件特点
1、全自动
无人值守工作,配置好程序后,程序将依据您的设置自动运行,完全无需人工干预。
2、本地编辑
本地可视化编辑已采集的数据。
3、采集测试
这是其它任何同类采集软件所不能比的,程序支持直接查看采集结果并测试发布。
4、管理方便
使用站点+任务方式管理采集节点,任务支持批量操作,再多的数据管理也很轻松。
5、支持所有网站编码
完美支持采集所有编码格式的网页,程序还可以自动识别网页编码。
6、多种发布方式
支持目前所有主流和非主流的CMS,BBS等网站程序,通过系统的发布模块能实现采集器和网站程序间的完美结合
火车采集器官方版安装步骤
1、将火车采集器官方版下载下来,并解压到当前文件夹中,点击其中的火车采集器9.21版安装程序.exe应用程序,进入许可协议界面,接着点击下一步。
2、选择软件安装位置界面,华军知识兔小编建议用户们安装在D盘中,选择好安装位置点击下一步。
3、火车头采集器(Locoy Spider)安装结束,点击完成即可。
火车采集器官方版使用教程
1、新建分组
新建一个任务分组,选择所属分组,确定分组名称和备注。
2、新建任务
确定所属分组,新建一个任务,填写任务名称并保存。
3、Web发布配置
Web发布配置定义了如何登陆一个网站以及向该网站提交数据。
主要涉及到登录信息的获取,网站编码设定,栏目列表的获取,以及使用数据测试发布效果。
4、Web发布模块
可以定义网站登录,获取栏目列表,获取网页随机值,内容发布参数,以及上传文件,构造发布数据等高级功能。
5、数据库发布配置
数据库发布配置定义了数据库链接信息的设置以及数据库模块的选择。
6、数据库发布模块
用于编辑数据库的发布模块,方便知识兔将数据发布到配置好的数据库中。
火车采集器可选mysql、sqlserver、oracle、access四种数据库类型,在文本输入框中填写sql语句
(需有数据库相关知识),并可使用标签替换相应数据。也可在采集器模块文件夹中加载某一模块进行编辑。
7、计划任务
设置列表中采集任务的启动计划,可每间隔、每天、每周、仅一次、或自定义Cron表达式,
(Cron表达式的写法可参考相关术语中的介绍)。保存设置后,任务即可按照设置执行。
8、插件管理
插件是可以用来扩展火车采集器功能的程序
火车采集器V9支持PHP源码、C#源码、C#类库三种类型的插件,
可用于扩展http请求、内容处理和文件下载的功能,并可以分别进行测试。
9、http二级代理
网络中的服务器,可以让网络用户去取得所需要的网络信息。
代理的功能有可以突破自身ip的访问限制访问国外站点,访问一些单位或团体内部资源,
突破电信的ip封锁和隐藏真实的ip等。
火车采集器V9支持http代理、socket4和socket5代理。
10、http模拟请求
可以设置如何发起一个http请求,包括设置请求信息,返回头信息。并具有自动提交的功能。
下载仅供下载体验和测试学习,不得商用和正当使用。
下载体验