2024年4月4日发(作者:)
如何把纸质文件通过扫描转化成word文档
巧用Office 2003实现OCR文字输入
巧用Office 2003实现OCR文字输入
为了迎接市里的工作验收,领导拿来了许多存档文件,要求小王在三天内摘录并
形成汇报文档。看着厚厚的材料小王发愁了,这时有人提醒:你的笔记本电脑不
是刚装上Office 2003吗,里面的Microsoft Office Document Imaging不错。
它是一个光学字符识别(OCR)软件,可以用扫描仪扫入纸文档中的汉字,用它,
摘录文件的速度可快多了。
○ 操作准备
局里只有一台比较旧的F1210扫描仪,小王把它连接到笔记本电脑的并口,
接通电源以后安装扫描仪驱动程序。单击“开始”-->“所有程
序”-->“Microsoft Office工具”中的“Microsoft Office Document
Imaging”,将纸文档放入扫描仪,准备将其中的汉字输入Word。
○ 扫描设置
打开Microsoft Office Document Imaging窗口以后,单击工具栏中的“扫
描新文档”按钮,即可看到如图1所示的对话框。首先单击其中的“扫描仪”按
钮打开选择扫描仪对话框,查看当前扫描仪的型号是否在里面。如果对话框或下
拉列表中没有当前扫描仪,就要检查驱动程序安装和电源连接是否正确。
接下来要根据文档的特点选择扫描预设。如果是彩色纸张上的黑色或彩色文
本,或者是白色纸张上的彩色文本,可以选择“将彩色页面扫描为黑白图片”;
对常见的白色纸张上的黑色文本而言,可以选择“黑白模式”或“灰度模式”。
Microsoft Office Document Imaging提供的扫描预设功能可以满足大多数
文档的要求。如果文档使用的字体太小,或者由于纸张等缘故导致文字不太清楚,
就得适当调整扫描预设中的分辨率。用户只要选中要调整的某种扫描预设,单击
图1中的“预设选项”按钮打开菜单,选择其中的“编辑所选预设”,就可以看
到“预设选项”对话框的“常规”选项卡。单击其中的“高级”按钮打开如图2
所示的对话框,可将默认的分辨率(DPI)值由200修改为300。当扫描文档中
的文字是彩色或具有彩色背景时,选中图2中的“自动设置对比度,保存为单
色”,让扫描的图像具有较高的对比度,这样可以获得更好的文字识别效果。
除此之外,“预设选项”对话框还有三个选项卡。其中“页面”选项卡设置
扫描仪的幅面,常见的A4扫描仪应该选择“A4”(默认);“输出”选项卡可
以设置扫描文件的保存位置,还可以设置扫描文件的命名方式,可以根据自己的
需要进行调整;“处理”选项卡控制OCR的工作设置,一般采用其中的默认值就
可以了。
○ 扫描文档
文档放入扫描仪以后,根据其特点选择图1中的某一个扫描预设方式,单击
“扫描”按钮开始扫描文档。与大多数OCR软件不同,Microsoft Office
Document Imaging扫描结束即开始文字识别,完成后即可在窗口中显示结果。
该窗口分为“缩略图窗格”和“页面窗格”左右两部分。如果用户连续扫描
了多页文档,缩略图窗格显示各页的缩略图,页面窗格显示当前文档的图像。
如果用户有多页文档需要扫描和识别,可以在一页扫描结束后再次扫描下一
页,完成后会弹出一个对话框。单击“继续”按钮可以放入下一页文档,继续进
行扫描,但不识别和保存当前文档;单击“完成”按钮则停止扫描,执行识别并
保存文件。再次扫描新文档时只要将它放入扫描仪,单击图1中的“扫描”按钮
即可;单击“取消”按钮会停止扫描,不进行识别也不保存文件。
发布评论