丹青中英日文文件辨识系统是一个功能强大的ocr中英文辨识软件。可以快速读取OCR格式的文档资源,支持文档重新编辑、保存操作,软件可识别繁体中文、简体中文、英文、日文及阿拉伯数字。
软件介绍:
丹青中英文文件辨识系统能辨识的范围包括各式彩色、黑白、表格及非表格文件;能辨识的内容包括繁体中文、简体中文、英文、日文及阿拉伯数字。辨识后的文本文件所占的内存空间远较未辨识前的影像档案小。在经过校对后即可储存成TXT、RTF、DOC、XLS、SLK、 CSV等各种档案格式,并且可以在一般的文字处理软件中被开启和编辑。除此之外还可直接传送成电子邮件,或将档案以HTML格式,透过网络浏览器直接开启。
软件特色:
可辨识繁中、简中、英文及日文四种文件
提供繁中、简中和日文三种操作介面
辨识后的文件可储存成各种常用档案格式再编辑
超高辨识速率及辨识率再提升,快速原文重现各式文件
功能特点:
1、输出档案
传送至其他应用软件:可将辨识结果直接传送至您所指定的应用软件中再处理,例如可设定辨识结果自动储存成HTML档案并直接传送至网络浏览器中。
可储存多种档案格式:辨识后的结果可储存成不同之档案格式,如TXT、RTF、DOC、XLS、SLK、CSV、HTML等,方便您做不同的应用与处理。
2、影像扫描
可处理彩色、灰阶或黑白的文件影像。
倾斜校正:自动侦测文件影像倾斜角度,并提供旋转影像之功能。
3、辨识文件< 文件分析及辨识 >
自动辨识:轻按一钮,即可自动分析、辨识、校对影像文件,图文分离,并转换成可编辑的文件档案。
设定辨识字集:不需切换语文环境,即可辨识繁中、简中、纯英文及日文四种文件。
高辨识速率:在Pentium III 667MHz个人电脑环境下,每秒钟能辨识高达150个中文字。
多种字体辨识及重现:能够辨识多种印刷字体,如明体、黑体、仿宋体、楷书、圆体、隶书等,并在辨识后还原成原稿的字体。
原文重现编辑环境:可辨识各种表格及影像,辨识结果依照原文件的图文版面格式呈现,方便您校对、编辑,节省重新排版的时间。
4、自动校对与学习
再辨识功能:提供合/分字、合/分行、合/分区块、变更区块属性等再辨识功能,让您能够修正错误的辨识结果。
学习新字功能:可将易辨识错误的字元输入到学习资料库中,提高下次辨识之正确率。
候选字功能:提供原文影像供辨识后图文作校对,且针对型态相近之文字及语意上前后相连的字词提供候选字轻松更正辨识错误的文字。
自动校对:利用内建的常用词库自动校对辨识出的文字,并标示出辨识时所碰到的疑问字,节省您校对的时间。