2024年5月6日发(作者:)

用Microsoft Office 2003,提取图片中的文字

微软在Microsoft Office 2003中的工具组件中有一个“Microsoft Office Document

Imaging”的组件包,它可以直接执行光学字符识别(OCR)。

第一次使用,我们需要安装“Microsoft Office Document Imaging”的组件,点击“开始

→程序” ,在 “Microsoft Office 工具” 里点选“ Microsoft Office Document Imaging” 即

可安装运行(如图1所示)。

图1 安装组件

在安装Microsoft Office Document Imaging组件后,系统会自动安装一个名为“Microsoft

Office Document Imaging Writer”的打印机。

应用OCR功能:

第一步,打开Word ,将希望提取文字的图片,复制或插入到Word里。

第二步,点击“文件”菜单中的“打印” ,在“打印机”下拉列表框中选择“Microsoft

Office Document Imaging Writer”打印机(如图2所示)。

图2 选择打印机

其他选项无须额外设置,点击“确定”按钮后,设定好文件输出的路径及文件名(缺省

使用源文件名),然后很快就可以自动生成一个MDI格式的文档了。

图3 将文本发送到Word

第三步,打开刚才保存的MDI类型文件(如图3所示),根据你的需要用鼠标选择文字

内容(被选中的内容在红色的框内),然后单击鼠标右键,在弹出的快捷菜单中选择“将文本

发送到Word” ,即可将图片内容自动转换为一个新的Word文档,然后你就可以在Word

文档中随心所欲地进行编辑了。

提示:如果你不想将转换的内容输入到一个新的Word 文档中,而是希望粘贴到一个已

经打开的Word 文档,只需在上面的操作中点击右键菜单的“复制”,然后再到指定文档中执

行粘贴即可。