Cyotek WebCopy是一款专业的网站复制软件。网站复制工具久友下载站小编为你推荐Cyotek WebCopy。允许您下载网页,以便以后无需连接互联网即可阅读它们。扫描内容后,它将分析内容并下载其中包含的项目,例如图像,文本,子文件夹等。为了更好地下载页面,该应用程序为您提供2个选项,快速和正常。这意味着您可以选择该工具扫描页面的深度,因此,如果需要,您甚至可以访问所选网站的最深部分。深度扫描将花费一些时间,但是作为回报,您将获得完整的报告,其中包含已检测到并下载的所有链接和文件夹,以及所有错误或未下载的文件。您可以按内容类型或名称过滤所有内容。该软件还允许您使用网页结构(包括类别和子类别)创建地图。对于个别情况,您还可以创建规则以包括或排除内容,并配置选项以处理需要密码的页面。
软件功能:
在本地复制整个或部分网站,下载页面并将链接重新映射到资源,以准备网站进行脱机浏览。
Cyotek WebCopy允许您将整个网站的结构下载到您的计算机上,以准备进行脱机查看。
这在Internet访问受限的情况下非常有用,并且可以帮助您降低Internet连接的总体成本。
应用程序执行的实际操作是对所选网站进行爬网并生成其结构的完整脱机表示。
所有内容都会下载到用户定义的位置,但是所有资源的链接都会进行组织和重新映射以指向本地路径,从而使您可以访问在线(如在线)页面。易于使用是使该应用程序脱颖而出的主要优点之一。
用户只需要输入要处理的URL即可开始扫描过程。
安装方式:
1.下载并解压缩软件,双击安装程序以进入以下许可协议界面,选中[我接受协议]选项,然后进入下一个安装。
2.选择安装位置,用户可以选择默认路径,或单击[浏览]进行设置。
3.选择组件,用户可以选择默认组件。
4.要选择其他任务,用户可以选中[创建桌面图标]的选项。
5.准备安装,单击[安装]按钮开始安装。
6.弹出以下成功安装Cyotek WebCopy的提示,单击[完成]以结束安装。
软件特色:
如果网站包含太多网页,并且存储整个内容占用了硬盘驱动器上太多的存储空间,则可以将Cyotek WebCopy设置为仅下载其中的一部分或一部分。
对于更高级的用户,此任务使用简单的规则,域别名,代理字符串和正则表达式执行。
此外,您可以指示应用程序下载URL并将其包含在脱机副本中,但不能对其进行爬网。
Cyotek WebCopy还考虑网站包含需要身份验证的网页的情况。因此,您可以在进行实际分析过程之前输入凭据,或者让程序提示您输入用户名和密码。
扫描过程完成后,您可以使用附加的链接地图查看器来查看和过滤找到的URL。它还提供错误报告和媒体资源统计信息。
简而言之,Cyotek WebCopy是一个网站扫描工具,可以生成结构图并创建网站的准确本地副本以允许脱机浏览。它的过滤功能和灵活的配置选项使其值得一试,尤其是因为它没有价格标签。
使用说明:
使用“站点链接”对话框
入门>用户界面>使用“网站链接”对话框
通过“网站链接”对话框,您可以查看扫描的网站和页面之间的所有链接。
从“ URL”字段中选择一个URL,以自动查看指向所选URL的所有链接以及该URL中的所有链接。在查找特定的URL时,您也可以过滤这些列表。
列出地图中的所有URL,并允许您选择事件URL
允许您在浏览器中打开选定的URL,或显示URL的属性
允许您过滤所选组合中显示的URL列表
显示包含至少一个指向所选URL链接的所有页面
显示从所URL链接到的所有页面
将URL设置为活动URL
•右键单击一个项目,然后选择“设置为活动URL”
- 要么-
•双击列表中的URL
在浏览器窗口中打开URL
•右键单击该项目,然后选择在浏览器中打开
复制所选项目
•右键单击该项目,然后选择“复制”
将所有项目导出到CSV
•右键单击列表,然后选择“导出”
使用正则表达式编辑器
入门>用户界面>使用正则表达式编辑器
几个可配置选项支持正则表达式。您可以使用基本编辑器来输入和测试正则表达式。
显示正则表达式编辑器
•单击任何支持表达式的字段旁边显示的“编辑正则表达式”按钮
使用正则表达式编辑器
1.在“表达式”字段中输入正则表达式模式
2.在测试字段中输入测试数据
3.测试字段的内容将使用颜色编码,以表明它与您指定的模式匹配。结果列表还将显示找到的所有匹配项,选择匹配项将在“测试”字段中突出显示匹配的文本。
4.“语言元素”选项卡显示常用正则表达式元素和示例的列表。双击语言元素,将其插入表达式中。
更新源表达式
•单击“插入”按钮,使用新表达式更新源字段,然后关闭编辑器。
自动导入样本URL数据
•单击“加载链接映射URL”按钮,将当前链接映射中的所有URL自动加载到测试数据字段中
配置域别名
使用项目>高级项目自定义>配置域别名
如果要复制的站点具有指向您要自动转换为要爬网的域的链接,则可以使用域别名功能。
自定义域别名
•从“项目属性”对话框中,单击“域别名”选项。
添加新别名
1.在“别名模式”字段中,输入搜索模式。您可以使用正则表达式
2.单击“添加”按钮
删除别名
1.从列表中选择要删除的别名
2.单击“删除”按钮
更新别名
1.从列表中选择要编辑的别名。别名模式字段将更新以匹配选择。
2.输入别名模式的新值。列表中的所选项目将使用您指定的更改进行更新。
指定默认文档
使用项目>指定默认文档
对于某些站点,您可能具有指向该文件夹的链接,而其他站点则可能具有该文件夹的默认文档的链接。 WebCopy将这些分类为两个单独的条目,并相应地生成其他元素。
如果定义默认文档,WebCopy将尝试将无页面URL链接到包含默认文档名称的URL。
抓取其他根URL
使用项目>获取其他根URL
如果您网站的某些部分没有任何入站链接,但是您仍想对这些部分进行爬网,则可以为爬网过程指定其他种子URL。
自定义其他根URL
•从“项目属性”对话框中,单击“其他根URL”选项。
新增网址
1.在URI字段中,输入URl
2.单击“添加”按钮
删除网址
1.从列表中选择要删除的URL
2.单击“删除”按钮
更新本地时间戳
使用项目>更新本地时间戳
默认情况下,WebCopy下载文件时,它将指定当前日期和时间。但是,如果要创建给定站点的存档,则最好将本地时间戳记与上次修改时间相匹配(如果适用)。
如果文件没有上次修改的时间戳,则将继续使用当前日期和时间。
启用本地时间戳记更新
1.在“项目属性”对话框中,单击“复制”选项。
2.选中“更新本地时间戳”选项。