大小:73.1M 软件类型:汉化软件
软件语言:简体中文 时间:2021-09-21 00:01:20
软件授权:共享软件 运行环境:linux
后羿收集器liunx版本是后羿收集器的liunx版本,适合使用liunx系统的个人博主和站长使用。该软件可以轻松收集并放在车站的货架上。软件支持后台操作,必要时可下载使用。
软件功能
1.可视化和定制收集过程。
全程问答指导,可视化操作,自定义收集流程。
自动记录和模拟网页的操作顺序。
高级设置满足更多采集需求。
2.点击提取网页数据。
点击鼠标选择要抓取的网页内容,操作简单。
选择提取文本、链接、属性、html标签等。
3.运行批处理数据收集。
软件根据采集流程和提取规则自动批量采集。
快速、稳定、实时显示采集速度和过程。
可以切换软件在后台运行,不打扰前台工作。
4.导出并发布收集的数据。
收集的数据会自动制成表格,字段可以自由配置。
支持将数据导出到本地文件,如Excel。
并一键式发布到CMS网站/数据库/微信微信官方账号等媒体。
施用方式
在安装包的文件夹中,按住shift键并点击鼠标右键,会弹出如下界面。点击在终端打开。
输入以下命令,-i后跟您的文件名。如果权限不够,在前面输入sudo,输入后再输入密码。
常见问题
1.XX网站可以收藏吗?XX数据可以采集吗?
正如我们在官网的视频教程中已经介绍的,后羿采集器是一款通用的网页采集软件。只要有网站,就可以浏览网页,能看到的内容大部分都可以收集(视频比较特殊,要具体情况具体分析)。
为了保护您的隐私,您的所有任务和配置都以加密形式存储在云中。除了你自己,没有人可以查看具体内容。您在收集过程中输入的帐户密码和收集结果存储在您的本地计算机中。但是,请严格遵守相关法律法规。如果后羿收款员收到任何关于非法收款的报告,将立即关闭账户。
2.为什么数据收集会提前停止?
如果遇到提前停止采集的问题,请按照以下步骤进行自检:
第一步:请确认在浏览器中可以看到多少内容。
有时,搜索显示的数量与您最终可以看到的数量不一致。请确认你能看到多少条数据,然后确定采集是提前停止还是正常停止。
第二步:收集的结果数量与浏览器中看到的数量不一致。
在收购过程中,如果遇到这个问题,有两种可能:
第一种可能是采集速度太快,网页加载时间太慢,导致无法从网页采集数据。
在这种情况下,请增加请求的等待时间。等待时间较长后,网页将有足够的时间加载内容。
请求等待时间在启动设置-智能策略中设置,如下图所示:
第二种可能是你遇到了其他问题。
我们可以在运行界面点击“查看网页”,观察当前网页内容是否正常,是否不能正常显示,是否有异常提示等。
出现上述情况,我们可以降低采集速度,切换代理IP,手动编码等。至于哪种方法可以奏效,需要测试一下才能知道不同的网站有不同的问题,没有统一的解决方案。
如果您尝试上述方案后无法解决问题,可以在帮助中心给我们反馈,我们将为您提供支持。
3.为什么收集字段不完整?
不完整的字段通常有以下两种情况:
首先,由于列表元素的结构不同,有些元素有字段,有些没有,这是正常现象。请首先确认您想要的字段是否存在于网页的相应元素中。
二是页面结构发生了变化,通常发生在同一搜索结果包含多个页面结构的场景中,比如某搜索引擎的搜索结果(包含多种网站)。
这种情况需要根据具体问题来分析。您可以导出您的收集任务并将其发送到我们的官方帮助中心。我们的客户服务将帮助您进行测试和分析。
更新日志
3.5.4
更新时间:2020-11-02。
提高
导出csv时支持制表符分隔。
添加退出软件的API接口。
使最优化
优化文件下载的各种兼容性问题。
修理
解决分组运行的问题。
修正了无法深度收集链接的错误。
显示全部
后羿采集器liunx版,后羿采集器liunx版是后羿采集器的liunx版本,适合使用liunx系统的个人博客主和站长使用,利用软件能够轻松的对站群进行采集和上架,软件支持后台运行,有需要的可以下载使用,您可以免费下载。
简体中文 73.1M 共享软件