2024年5月1日发(作者:)

(19)中华人民共和国国家知识产权局

(12)发明专利说明书

(21)申请号 CN98125323.7

(22)申请日 1998.12.11

(71)申请人 英业达集团(西安)电子技术有限公司

地址 710000 陕西省西安市高新技术产业开发区西区F-2B号楼2楼

(72)发明人 薛其祥 陈淮琰 吴卫国

(74)专利代理机构 上海专利商标事务所

代理人 陈亮

(51)

G06F3/00

权利要求说明书 说明书 幅图

(10)申请公布号 CN 1257240 A

(43)申请公布日 2000.06.21

(54)发明名称

手写读音中文输入装置和方法

(57)摘要

本发明涉及一种以手写读音(注音或

拼音)输入中文的装置与方法,特别是可适用

于掌上型电脑(HPC)的手写读音中文输入方

法。在不使用较大存储器存储中文辨识用

数据及不使用键盘的情况下,根据输入装置

得到的手写读音数据,经过预处理及特征产

交给读音辨识系统,辨识系统匹配差别确定

辨识结果,再按照辨识出的读音字母查寻中

文汉字读音对照表,而得到所需的中文汉字,

达到输入的目的。

法律状态

法律状态公告日

法律状态信息

法律状态

权 利 要 求 说 明 书

1、一种手写读音中文输入方法,其特征在于,包括下列步骤:

a.由电脑相关输入装置输入手写的读音字母;

b.由该电脑对输入的手写读音字母采样得到读音字型数据;

c.将读音字型数字进行预处理,成为标准化的二进制数值;

d.对该二进制数值作滤波处理,并抽取一定的特征;

e.将步骤d的结果直接和存储在该电脑数据库中已知的标准读音表达形式匹配判别;

f.根据e步骤的判别结果查寻该电脑中文汉字与读音对照表,找到对照表中与输入

读音相同的所有中文汉字;

g.由电脑显示单元将这些中文汉字显示出来供使用者点选。

2、如权利要求1所述的方法,其特征在于,该输入装置与显示单元均为LCD。

3、一种手写读音中文输入装置,包括:

中央处理器,用以执行权利要求1所述的方法;

只读存储器,用以存储辨识系统、中文汉字读音对照表、字型库、操作系统等程序

数据;

随机存取存储器,存储辨识结果的暂时性数据;

显示单元,作为输入装置以取得所需的信息,且由一驱动器驱动,将所判定的中文

汉字显示出来供使用者选择。

4、如权利要求3所述的装置,其特征在于,含一键盘,供使用者键入声母与韵母,

以输入中文汉字。

5、如权利要求3所述的装置,其特征在于,该显示单元为LCD。

说 明 书

本发明涉一种在掌上型电脑上实现中文汉字输入的装置与方法,尤其涉及一种利用

手写输入读音,以辨识查找相应中文的输入方法及其装置。

当今世界高科技的电子技术正在以人们难以估量的速度快速发展。其中小型化且易

于移动的掌上型信息装置,凭借其轻便、超簿、精巧等特色,在今日众多科技电子

产品中更是独占鳌头。掌上型电脑(以下简称HPC)即是其中极具特色的一员。

目前的HPC产品,中文手写输入法、读音输入法等输入中文的方法已成为其标准

配置。没有这些输入法会使HPC产品在激烈的市场竞争中处于劣势。

请参照图1及图2所示,这两图说明中文手写输入法的辨识原理。在输入装置10

上,书写汉字字形,将汉字字型数值化后输入辨识系统核心11,作预处理111、模

式表达112、匹配判别113辨识出汉字。其主要的处理流程是由输入装置10经采

样(步骤200)得到中文字型数据,经预处理(201)去除噪声后成为标准化的二进制数

值,对该二进制数值进行滤波处理(202)及抽取一定的模式表达(特征取或基元分割

辨识)形式(203),先与存储在偏旁数据中已知的标准中文字偏旁表达形式匹配判别

(204),再与存储在字典114(特征模板或句法规则集合)中已知的标准中文字表达形

式进行匹配判别(分类或句法分析)(205)后,就可识别出所输入的未知中文汉字(206)。

参阅键盘的声母和韵母键位配置图(如图3所示)及中文汉字读音对照表(如图4所

示),再配合图5的流程图,读音输入法是以中文读音为基础,由键盘读键(300),

将键盘英文字母转换为读音字母(注音或拼音)(301),按中文汉字读音对照表,找出

对应的中文字序列(302),并将此中文汉字序列显示(303)出供使用者选择,而达到

通过键盘英文字母的点击达到读音输入的目的。

已知技术中利用中文手写输入法、读音输入法输入中文汉字的方式,的确有其便利

性。不过在实际应用中,已知技术对于在HPC上的应用却存在相当多的缺点。

读音输入法的缺点:

1、读音输入法是将读音字母分别对应于键盘的英文字母而输入读音字母的,对于

不熟悉键盘的用户来说比较困难。

2、读音输入法需要记忆键盘英文字母与读音字母的对应表。

3、为降低硬件成本,以及出于携带方便等的考虑,许多HPC没有设计硬件键盘,

这些厂商为了兼容性及用户界面(UI)的,要想办法实现了软键盘,以弥补无键盘的

不足。所谓软键盘是指用软件来模拟键盘,所不同的是硬键盘要敲击键盘进行输入,

而软键盘只能用笔点出。与软键盘的使用相比,直接书写要直接得多。(注:软键

盘是以手触摸或用笔点选屏幕上显示的键盘,一般的键盘欲称硬键盘或键盘。)

手写输入法的缺点:

对于HPC上的手写辨识系统,中文手写辨识系统要占用相当的空间,通常制作

15000字左右的中文手写辨识系统大约需占用1M空间,这些都会增加成本,并且

随着字符集的膨胀,辨识系统的辨识速度、辨识率会有所下降。

因此如果能够在不使用较大辨识数据的情况下,以手写读音输入中文汉字,自然可

以降低系统存储空间的占用比例,也可以解决大部分已有技术的缺点。不过此一新

方法的前提是,处理步骤必须非常简单,才不至于增加系统的负担,同时处理步骤

必须充分符合一般数字数据处理的模式,如此才更容易应用于HPC领域上。

有鉴于此,本发明的主要目的在于提供一种实现中文输入的装置与方法,能够在不

需要较大辨识数据的情况下,利用既有的读音输入法,以手写方法达到输入中文汉

字的目的。

根据上述的目的,本发明提供一种手写读音中文输入方法,可适用于HPC等产品。

首先针对中文读音几十个字母的字符集利用中文手写辨识的核心算法制作读音辨识

系统,仅需几十K字节的空间,接着根据输入装置所得到的手写读音数据,经过

预处理及特征提取交给读音辨识系统,辨识系统匹配判别后确定辨识结果,再按照

辨识出的读音字母查找中文汉字读音对照表,最后便可得到所需的中文字。

以下对照附图,对本发明的结构设计与操作原理,作一详细说明,以对本发明的特

征有更进一步的了解。图中:

图1为手写辨识原理示意图;

图2为图1所示的手写辨识流程图;

图3为键盘的声母与韵母键盘配置图;

图4为键盘的中文汉字读音对照表示意图;

图5为图3、图4所示的读音输入法的流程图;

图6为本发明实施例的掌上型电脑(HPC)设备中的硬件广场结构图;

图7为本发明的手写读音输入法的流程图;

图8为手写读音输入“安”字示例的手写拼音状态;

图9为手写读音输入法“安”字示例的辨识状态;

图10为本发明的手写读音输入法与已知中文手写输入法的对比表。

本发明所采用的中文输入方法,主要是利用手写读音经辨识后查找中文汉字读音对

照表来达到输入中文汉字的目的。以下以一实施例来说明本发明的内容。在以下实

施例中,是以掌上型电脑(HPC)的机型为例来说明,这是因为HPC受限于体积的

缘故,一般无法提供非常大的存储空间。因此,在使用本实施例所提供的手写读音

中文输入方法时,所需的存储空间可以大量减少。以下即就本实施例的HPC硬件

部分以及实现本发明的中文输入法软件部分,分述如下。

如图6所示,它是本发明实施例的掌上型电脑(HPC)设备中的硬件方块图。HPC中

包括CPU(中央处理器)20、键盘30、外接通信接口卡40、液晶显示屏(LCD)50、

LCD驱动器60、ROM(只读存储器)70和RAM(随机存取存储器)80。ROM与RAM

是分别用来存储HPC的固定数据(如字型库、操作系统程序等)以及暂时性数据(如

使用者的数据)。使用者在操作HPC时,可通过LCD显示屏幕50获得所需的信息,

并作为输入装置。而一般LCD显示屏幕50是由专用的LCD驱动器60加以驱动显

示。在本实施例中,当CPU20执行手写读音输入方法时,由LCD显示屏幕50得

到输入内容,经ROM70中的读音辨识系统得到辨识结果,暂存于RAM80中,再

通过ROM70中的读音输入法按照辨识出的读音字母查找中文汉字读音对照表,最

后便可得到所需的中文汉字。可经由LCD驱动器60,将得到的中文汉字显示在

LCD显示屏幕50上。基于上述HPC的硬件结构,以下就实际手写读音辨识中文

输入法的程序加以说明。

如图1所示的汉字辨识原理图,由输入装置10(如图6的LCD50等)得到字型数据,

经预处理111去噪声后成为标准化的二进制数值。对该二进制数值利用模式表达

112抽取某种特征后,与存储在字典114中已知的标准中文字表达形式进行匹配判

别113,就可识别出输入的中文字。利用此原理可制手写读音辨识系统。

参阅图7所示的手写读音输入法的处理流程,说明本实施例中实现手写读音输入中

文的处理流程。如图7所示,由输入装置10(如图6的LCD50等)采样得到中文读

音字型数据(400),经预处理(401)去除噪声后成为标准化的二进制数值。再对该二

进制数值进行滤波处理(402),抽取一定的特征(403),直接与存储在字典数据库中

已知的标准读音表达形式进行匹配判别(404),因为中文读音字母字型较简单,字

符集小,无需制作标准偏旁表达形式进行匹配判别,得琶的辨识结果(405)暂时存

放于RAM80中。

图4所示的中文汉字与读音对照表是读音输入法的核心,用以实现根据输入的读音

字母查找所需中文字的工作。这正是手写读音辨识输入法主要用到的部分。

根据RAM80中存放的读音字母查图4所示的中文汉字与读音对照到,找到所有中

文汉字读音对照表中输入读音字母相同的位置(406),该位置对应的中文汉字即为

所求的中文汉字。这样就可得出所需的全部中文汉字序列(407)。

下面再举具体输入“安”字的例子,作进一步说明。

图8及图9表示手写读音输入法输入“安”字的例子。图8所示直接在LCD屏幕上

书写“安”字的拼音“an”,经过手写读音辨识系统的辨识,得到拼音编码“an”。“an”

的ASCII码表示为01100001b 01101110b,查图4所示的中文汉字读音对照表,可

得“安”字的汉字序列,如图9所示,然后由使用者点选。

本发明将已知的手写输入法及读音输入法加以组合,创造了种手写读音的中文输入

方法,具有下列优点:

手写读音输入中文法所需存储器比中文手写辨识字符集所需存储器要小得多,而且

手写读音辨识率较高,辨识速度较书。

与使用键盘找寻中文读音按键相比,可以省略键盘,降低成本,提高辨识率,因此

提高了工作效率。

图10为本发明的手写读音输入法与已知的中文手写输入法的对比表,显示了本发

明确实优于已住的中文手写输入法。

本发明上述实施例并非用以限定本发明,任何熟习本技术者,在不脱离本发明的精

神和范围下,可作出许多更动与修饰,因此,本发明的保护范围以所附的权利要求

书为准。