LinkChecker是一款专门用来检测网页链接的软件。非常好用的网页链接检测工具LinkChecker。该程序旨在验证网站的无效链接,并使用户能够确定递归的深度/复制数据/创建忽略列表。用户检测完成后,您还可以查看检查时间,网站大小,有效和无效URL的数量,警告,内容类型(图像,文本,应用程序,音频,视频,邮件的数量)和链接(最小,最大)。和平均长度,域数)相关的统计信息,并允许将结果导出到计算机,支持HTML,TXT,CSV和XML等格式,该软件具有极其简单的操作界面,任何用户都可以轻松使用它!
安装方式:
1.下载并解压缩该软件,双击安装程序以进入LinkChecker安装向导界面,然后单击[下一步]。
2.选择安装位置。默认安装文件夹为C:\ Program Files(x86)\ LinkChecker。如果需要更改,请单击[浏览]按钮。
3.选择开始菜单文件夹,默认为LinkChecker,无需更改,直接转到下一个安装。
5.要准备安装,请单击[安装]按钮以执行安装操作。
6.弹出以下LinkChecker安装完成提示,单击[完成]以结束安装。
软件介绍:
LinkChecker是一个Windows程序,旨在验证来自特定网站的链接的有效性。它集成了可以由所有用户类别配置的直观选项。
简单的界面
无需特别注意即可在短时间内完成安装过程。就界面而言,LinkChecker选择了一个显示所有主要选项的简单窗口。
您可以首先粘贴包含要检查的链接的URL。对网站建立索引可能需要一段时间,具体取决于其复杂性。
列表将填充所有包含错误的链接,并显示其名称和父URL。同时,屏幕的上部显示所有活动的URL,以及排队和检查的项目。
查看和复制数据
单击列表中的项目以显示有关问题链接的详细信息,例如检查时间,尺寸,修改日期,警告和结果。
配置应用程序设置
右键菜单提供了其他选项,您可以在默认浏览器中打开链接或将数据复制到剪贴板。此外,您可以指定扫描递归深度,在标识特定字符串时设置警告,并创建要在URL中忽略的模式列表。
扫描完成或停止后,检查结果将显示有效和无效的URL总数,警告,内容类型统计信息(例如,图像和文本文件总数)和URL统计信息(最小,平均和最大长度)。
表现与结论
该程序可能需要很长时间才能完成扫描作业,在此期间,它使用了很高的CPU和RAM。但是,由于该工具没有挂起,崩溃或弹出错误消息,因此在测试过程中我们没有遇到任何不愉快的惊喜。总而言之,它有助于实现其目的。
使用说明:
基本用法
要检查URL,只需在命令行或GUI应用程序中键入URL。这会
递归完整域。它还检查到域外所有链接的有效性。
也可以检查本地文件。在Unix或OSX系统上,语法为file:///path/to/my/file.html。在Windows上,语法为file:// C | /path/to/my/file.html。检查目录时,将检查所有包含的文件。
在GUI客户端上,“编辑”菜单包含书签文件的快捷方式。例如,如果安装了Google Chrome浏览器,则将显示一个名为插入Google Chrome浏览器书签”的菜单项,该文件可用于检查所有浏览器书签。
选项
命令行客户端选项记录在linkchecker(1)手册页中。
在GUI客户端中,可以使用以下选项:
递归深度
递归检查所有链接到给定深度。负深度(例如-1)将启用无限递归。
详细输出
如果已设置,请记录所有选定的URL。默认设置是仅记录错误和警告。
除错
在单独的窗口中打印调试输出,可以使用“帮助”->“显示调试”进行查看。
调试内存使用情况
配置内存使用情况,并在停止检查时编写统计信息并转储文件。您可以使用外部工具检查转储文件。此选项仅对开发人员有用。
警告字串
如果在所选URL的内容中找到任何字符串,请记录警告。每行输入一个字符串。
使用此选项可以检查包含某种形式的错误的页面,例如“此页面已被移动”或“ Oracle应用程序错误”。
忽略URL
匹配给定正则表达式的URL将被忽略并且不会被选择。如果不应检查某些URL类型(例如电子邮件)(例如“ ^ mailto:”),则很有用。
个人资料
每个用户都可以使用高级选项来编辑要检查或过滤的配置。 linkcheckerrc(5)手册页记录了所有选项。
在GUI客户端中,可以直接从对话框“编辑”->“选项”中编辑配置文件,然后单击“编辑”。
执行检查
所有URL必须通过初步语法测试。语法检查通过后,URL排队等待连接检查。所有连接检查类型如下所述。
HTP链接(http:,https :)
连接到给定的HTTP服务器后,请求给定的路径或查询。遵循所有重定向,如果提供了用户名/密码,则在必要时将其用作授权。永久移动的页面(状态代码301)发出警告。除2xx之外的所有最终HTTP状态代码均为错误。
对于HTTPS链接,将根据给定的主机名检查SSL证书。如果不匹配,将打印警告。
本地文件(文件:)
通常可以打开的可读文件是有效的。可读目录也是有效的。所有其他文件,例如不可读,不存在或设备文件均为错误。
检查文件内容的递归。如果它们是可解析的文件(例如HTML文件),则将检查该文件中的所有链接。
邮件链接(mailto :)
Mailto:链接解析为电子邮件地址列表。如果一个电子邮件地址失败,则整个列表将失败。对于每个电子邮件地址,请检查以下内容:
检查地址语法,@符号前后的部分。
查找MX DNS记录。如果找不到MX记录,则输出错误。
检查其中一台MX邮件主机是否接受SMTP连接。首先检查优先级较高的主机。如果没有主机接受SMTP,则将打印警告。
尝试使用VRFY命令验证地址。如果有答案,验证地址将作为信息打印。
FTP链接(ftp :)
对于FTP链接,请检查以下内容:
连接到指定的主机。
尝试使用给定的用户名和密码登录。默认用户为匿名用户,默认密码为匿名用户@。
尝试更改到给定目录。
使用NLST命令列出文件。
Telnet链接(telnet :)
如果提供了连接和用户/密码,请尝试登录到给定的telnet服务器。
NNTP链接(新闻:,新闻:,nntp)
尝连接到给定的NNTP服务器。如果指定了新闻组或文章,则将从服务器请求它。
不支持的链接(javascript:等)
不支持的链接将显示警告,但没有错误。无需进一步检查。
您可以在unknownurl.py源文件中看到已识别但不受支持的链接的完整列表。其中最突出的是JavaScript链接。
递归
在递归下降到URL之前,它必须满足几个条件。按照以下顺序检查条件:
该URL必须有效。
URL必须是可解析的。如果您的系统上安装了Word和Pywin32模块,则当前包括用于Windows系统的HTML文件,书签文件(Opera,Chrome或Safari),目录和MS Word文件。如果无法确定文件类型(例如,它没有通用的HTML文件扩展名,并且内容看起来不像HTM)
L),则假定它是不可解析的。
URL内容必须是可搜索的。 除了例如 mailto:或未知的URL类型。
不得超过最大递归级别。 它使用--recursion-level命令行选项,递归级别GUI选项或配置文件进行配置。 默认情况下,递归级别是无限的。
它必须与忽略的URL列表不匹配。 可以使用--ignore-url命令行选项或通过配置文件来控制。
机械手排除协议必须允许递归跟踪URL中的链接。 通过评估服务器robots.txt文件并在HTML标头数据中搜索“ nofollow”指令来进行检查。
请注意,本地和FTP目录以递归方式读取目录中的所有文件,而不仅仅是index.htm *的子集。
软件特色:
递归和多线程检查
以不同格式输出彩色或纯文本,HTML,SQL,CSV,XML或站点地图
HTTP / 1.1,HTTPS,FTP,mailto :、新闻:,nntp :、支持Telnet和本地文件链接
使用URL的正则表达式过滤器限制链接检查
代理支持
HTTP,FTP和Telnet用户名/密码授权
荣誉robots.txt排除协议
Cookie支持
HTML和CSS语法检查
防病毒检查
不同的界面:命令行,GUI和Web界面
使用说明:
1.运行LinkChecker并进入以下界面。
2.在“ URL”列中,用户可以直接输入或复制URL。
3.单击[开始]按钮执行分析操作。
4.在结果列表中,用户可以获取测试结果。
5.在“ URL属性”列下,用户可以查看URL属性。
6.您可以在“检查结果”列中检查详细的结果信息。
7.单击[选项]按钮,用户可以设置检测和软件的参数。
8.如果用户需要导出测试结果,则可以单击[文件]按钮,然后在选项下选择[保存项目]。