2024年6月8日发(作者:)
一、 公司介绍:
北京文通科技有限公司(简称北京文通公司)成立于1992年,是国内外知名的OCR技术生产商、
文档影像技术和应用解 决方案提供商,也是中关村科技园区首批入园企业、北京市科委认定的软件企
业和高新技术企业。在与清华大学电子工程系智 能图文实验室的携手合作过程中,文通成功地将"国
家863计划"项目成果——"文字图像识别技术TH-OCR"产业化,真正 实现了TH-OCR技术与市场
应用的完美结合。
二、 TH-OCR SDK 11.0介绍:
1. 什么是SDK
SDK就是Software Development Kit的缩写,中文翻译为“软件开发工具包”。这是一个覆盖
面相当广泛的名称,可以这么说:辅助开发某一类软件的相关文档,范例和工具的集合都可以叫“SDK”。
2. TH-OCR SDK 11.0简介
文通TH-OCR SDK 11.0,是北京文通科技有限公司研制开发的多语种亚洲语言文字识别软件开
发包,提供强大的识别API开发接口,帮助用户将OCR文字识别技术无缝内嵌到用户业务系统中,
为数字资料的建立提供了方便、快捷、稳定的技术手段。
TH-OCR SDK 11.0支持简体中文,繁体中文,日文,韩文,纯英文的文字识别,具有识别率高,
适应性强等突出的技术优势。可支持少数民族语言(蒙、藏、维、哈等等),以及绝大多数西欧语种。
3. TH-OCR SDK 11.0功能介绍
1) 支持TIFF,JPEG,PCX,BMP 格式图像的读取,支持Packbits 和G4 压缩的TIFF格式;
2) 可以对图像由于扫描引起的倾斜进行自动校正
3) 可以对图像进行自动版面分析
4) 支持GB_2312 码(大陆使用)、BIG_5 码(台湾使用)、GBK、Shift-JIS(日文使用)、KSC(韩文使
用)内码的输出
5) 能识别纯英文、简繁体中文、日文、韩文、中英文混排的文本图像
6) 根据识别结果能够进行版面恢复,并导出TXT、RTF,XLS,双层PDF等格式文件
7) 支持对内存中的图像进行识别
8) 能够获取识别字符在原文中的位置和大小信息
9) 支持对指定区域的识别
10) 支持回调函数显示OCR 识别进度
11) 可以对横排文本图像,纵排文本图像,表格文本图像、图形图像进行识别
4. TH-OCR SDK 11.0支持的开发语言
VC,VB,JAVA,DEPHI等
5. TH-OCR SDK 11.0 版本类型
1) 服务器版:服务器版不限制进程数,无识别页数限制,无SDK开发包费用。
2) 客户端版:客户端版仅提供一个开发授权,并且每天限制3000页识别,有SDK开发包费用。
3) Web Service版:提供进程调度技术,无进程限制和识别页数限制。
三、 TH-OCR SDK 11对比SDK10的优势
1. 使用新的识别引擎增加中日韩文字的识别速度和速度。
2. 更改为新的版面分析核心。自动版面分析升级,更新了复杂版面分析图像,表格,目录等,优
化了算法,提高了定位的准确性。
3. 增加了ocx方式,扩展了多种语言方式使用。
4. 定义了新的接口来满足增加的功能需要。


发布评论