2024年4月4日发(作者:)

汉王OCR录入工厂

软件系统应用方案

汉王OCR录入工厂软件系统应用方案

一、

背 景 概 述

信息资源对于网络时代,正如蒸汽机于工业社会,我们致力于信息资源建设,

正是在构建未来社会的基石。要丰富网络资源,提高原有信息知识的利用效率,

对图书、文献等信息资料的数字化就显得尤其重要。

目前,我国各级政府对数字化图书馆工程非常重视,国家专门成立了“863”

计划数字化图书馆战略小组,北京市把数字图书馆建设列为四项高科技基础工程

之一。这是一个运用现代高科技的数字资源系统工程,涉及到信息资源加工、存

储、检索、传输和利用的全过程,是信息基础建设的重要组成部分。但如何将种

类繁多的文档资料、行业信息进行出自动化处理,以期满足各种数字化信息的应

用呢?这就不能不说到OCR技术(光学字符识别)在信息数字化建设中的至关重

要的作用。

二、汉王OCR技术简介

OCR是英文Optical Character Recognition的缩写,意为光学字符识别。

中文OCR光学符号识别技术是一种汉字文稿的自动输入方式,它通过光学扫描

仪和计算机的配合,经OCR软件将图像数据进行运算分类后,将图像数据转化

为计算机内码,这样就可以极大地减轻数据录入工作的强度、提高数据录入的

速度。随着数字化信息资源的建设与管理对现有印刷品数字化的需求越来越

强,通过OCR技术处理的电子文档将广泛应用于各种电子出版物,网络资源,各

种大型文献资料数据库,数字化图书馆等多种领域,OCR技术应用成为信息资源

建设中的最重要阶段。

汉王科技公司自1985年就开始从事OCR技术的研究工作,曾受到国家863

计划、国家自然科学基金委员会、中国科学院的支持.是国内从事文字识别研

究与开发的骨干单位,在联机手写识别、中文OCR识别等方面处于国际领先

或先进水平。研究内容涉及到中文、英文、日文、韩文的印刷体识别,中文的