HtmlUnit是一个强大的无界面Java浏览器,是junit的扩展之一。它提供了丰富的API,在读取页面后,您可以有效的使用htmlunit分析页面上的内容,并调用页面、填写表单、点击链接,就像您在“正常”浏览器中所作的一样。它具有相当好的JavaScript支持,并且能够使用相当复杂的AJAX库来工作,根据所使用的配置模拟Chrome、Firefox或Internet Explorer。HtmlUnit还可以用来进行页面的测试工作,实现网页自动化测试。
HtmlUnit通常用于测试目的或从网站检索信息,但是它不是一个通用的单元测试框架,它是一种模拟浏览器进行测试的方法。一般来说,在小型爬虫项目中,这种框架十分常用,它可以有效的运行页面上的js,以便得到需要执行JS才能得到的值。