鱼羊防采集软件是一款功能强大的网页防采集软件。软件通过在网页中加入干扰代码来达到防止采集软件采集信息的目的,对网页显示和搜索引擎收录无任何影响。
经过半年多来的努力,鱼羊小子尽可能的将所想到的防采集思路付诸实践。但由于自身在制作鱼羊防采集的时候毫无VC++语言基础。虽说有一定的其他程序语言功底,在拼积木的方式下把鱼羊防采集做到今天这个地步,自身能力上也有很大的提高。但程序很多基础方面处理的并不好,数据保存查找方式、多线程数据安全、验证码生成等都是请别人帮忙完成的。
鱼羊防采集自v3.0以来,一直存在着一点问题,鱼羊小子也尽力寻找并解决之。但毕竟VC++语言功底不雄厚,始终没有解决问题。
我很希望将鱼羊防采集发扬光大,但自知自己能力有限,经过半个月的思考决定开放鱼羊防采集的源代码以供大家参考。希望有能力朋友根据此做出完善的防采集器来,源代码无条件使用。
对我来说我已经尽力了,我所想到的也都去实践了。
鱼羊防采集软件功能特点:
1.对网页毫无影响
程序在网页中加入“空格”;“换行符”;“Tab制表符”来打乱网页html源代码模板,使采集软件的采集模板失效,使一个模板不能做为通用采集模板。此技术基于《鱼羊防采集》v1.x测试版本的基础上,对搜索引擎毫无影响。
处理后的代码对比原代码,处理后的代码只比原代码稍稍大些。网页显示无任何影响,对于非专业访客根本察觉不出任何变化。
处理后的页面对于搜索引擎的收录无任何影响。因防止了软件对网页信息的采集,让搜索引擎判断为独创文章而非垃圾信息,而提高网页排名。
2.代码简单易整合
调用简单,只需几行代码便可完成防采集调用处理。
整合方便,容易整合到任何ASP或PHP网站中。
3.防采集能力强大
防采集处理后的网页,与原网页有程序无法匹配的规则,使采集程序的采集模板无非做为通用采集模板,极大程度的防止了程序采集对网页的采集。
采集程序根据采集模板对网页进行匹配采集处理,经防采集程序一处理,使得原采集模板失效。就算采集者对处理后的页面编写采集模板,也无法对毫无规则的网页进行多页匹配采集。最后使得专业采集程序对网页采集毫无办法。
对于专业采集程序都无办法,CMS程序自带或配置的采集程序更无办法。
对于通过防采集程序处理后的页面,采集者只能采用原始的手动采集方法来进行采集。
鱼羊防采集软件更新日记:
鱼羊防采集v2.0正式版
完全免费无限制
对网页毫无影响
代码简单易整合
防采集能力强大
完全免费无限制
相对于与《鱼羊防采集 v2.0专业版》功能毫无差别,并完全免费。关于源码:程序是使用VS.NET 2008编辑
鱼羊防采集软件4.4.2更新:
1.增加时间限制功能
2.修复模块优先级设置无效漏洞
3.修复模块数据关键词错误 “Cofing”修复为“Config”
4.取消授权功能
5.开放源码
其他说明
鱼羊防采集v2.x版本有别于鱼羊防采集v1.x测试版
v2.x中使用的是对网页无影响的空格 回车 和 Tab来打乱源代码的
v1.x则是加入字符a-z;A-Z;0-9
v1.x对搜索引擎的影响还有待观察