2024年1月31日发(作者:)

《尚书七号》是一个OCR(光学字符识别)文字表格识别软件,是一个提高文档办公效率的好帮手。通过这个软件,可以把JPG图片文件识别出来生成TXT文本文件,再把文本文件里识别出来的内容粘贴到WORD里面就可以进行排版编辑。

尚书七号(文字识别) ocr已注册版下载地址:

/soft/(飞翔下载)

/Down/(直接进入下载页面)

慧视小灵鼠也不错的,下载地址:

/html/service/?channelid=12&catid=21&id=341

下面简单介绍一下操作步骤:

1.打开需要转换成文字的图像文件(支持的格式有:TIF、BMP、JPG)

2.单击“识别开始识别”或快捷键“F8”,来识别图像文件

3.输出“到指定格式文件”。可以保存的格式有:TXT、HTML、RTF和XLS。

今天发现优艾网上有比较详细的教程,特转载过来

/school/?ARTICLE_ID=215

一、什么是OCR

很早之前就听说有提取图片中文字的工具和方法,这种文字识别技术称为OCR(Optical Character Recognition)。OCR技术的出现,实现了将印刷文字扫描得到的图片转化为文本文字的功能,提供了一种全新的文字输入手段,大大提高了用户工作的效率。

二、OCR适合对象

1.印刷行业、文印店:经常会遇到客户只给你一本厚厚的宣传册(因为客户不知道电子稿保存的重要意义,甚至压根就不知道什么是电子稿),要你明天之前,必须把那本几十页宣传册上的文字,原原本本打出来。生意还是要做,没有办法,你只能再当一回为了打字而打字的工具了,除非你使用OCR;

2.办公室工作人员:老板某天拿了一张写满字的传单给你,要求你马上打成Word文档,对于打字慢或是懒得打的你,为了完成工作任务,OCR就很适合你了;

3.其他对象:工作中、网络中、现实生活中,OCR对很多人都是有用的,能帮你轻松提高效率。

三、准确选择OCR软件

正常购买扫描仪的时候,配套软件就会附有OCR功能,在网络上搜索,也会有一系列的OCR软件可以下载,如:

1.清华紫光OCR V7.5

简介:清华紫光 OCR支持Windows环境下的GB、BIG5、JIS和Shif。

FineReader OCR Professional 7.0.0.963

简介:一款OCR软件。为用户提供了现代OCR赤铜的全部功能,给予它们对信息管理的完全控制。

3.扫描小精灵 V1.30 Build 2003.03.21

简介:针对OCR的图像增强、虚拟TWAIN、批量扫描。

Ocr 汉字显示字体识别软件 1.0

简介:本软件是飞涛软件工作室开发的一款免费Ocr软件,主要用于识别图像文件之中出现的汉字。

Ocr 汉字显示字体识别软件 V1.0

简介:本软件是飞涛软件工作室开发的一款免费Ocr软件。

6.奥普印刷体文字识别OCR系统 专业版

笔者从事互联网行业也有三四年了,很早前就知道有OCR(文字识别技术),也曾花了好几天的时间研究了不下十种的OCR软件(包含以上6种),结果不是软件安装失败,就是提取文字的识别率太低。过了好久,笔者下载了"尚书六号",才发现它就是多年来一直寻找的OCR软件,并亲眼见证了OCR的成果,识别率达到90%以上。欣喜之余,写了这篇"图片文字提取(OCR)图解教程",首刊在私房博客()上,为所有在寻找OCR或想体验OCR成果的人提供参考,欢迎各网站转载。

"尚书六号"下载地址:/soft/

四、图片文字提取(OCR)图解范例

1.从扫描仪导入图片或截图生成

[图1] 截图后,打开Photoshop,新建文件,分辨率设:300像素/英寸

[图2] 粘贴后,保存为.jpg格式

[图3] 保存后的.jpg图片

图1、图2、图3是假设在浏览网页时,遇到含有文字的图片,利用腾讯TT截图功能,在Photoshop粘贴生成.jpg文件;当然,也可以使用键盘上的PrintScan键截图后,打开附件里的画图,进行粘贴生成.jpg文件。

2."尚书六号"的界面

3.导入需要提取的图片

[图5] 点击"文件",选择"打开图象页"

[图6] 选择刚才保存的并点击"打开"

[图7] "尚书六号"自动识别的三个选框

4.提取文字并保存文本

[图8] 不修改默认设置,直接点击"识别"后,弹出的界面

[图9] 将框内的文字选中,并复制到文本文件或Word文档进行个别错字修正。

一、怎么把Word转换成JPG方法?

①首先,打开Word文档选中需要转换为JPG图片的部分,然后复制;

②打开系统“开始”-->所以程序-->附件-->画图;

③然后将刚才在Word中复制的内容粘贴进来,单击左上角的“画图”按钮,然后将内容保存为“jpg”格式。(如下图)

二、JPG转为Word技巧!

这个,我们可能需要利用一些软件来实现了。在Office2003软件里面就已经自带了Document Imaging工具,有了它我们可以将文字“抠”出来。在“开始”菜单的“Microsoft Office工具”中打开Microsoft Office Document Imaging,在左侧窗口中单击鼠标右键,选择“粘贴页面”,把复制的图片粘贴到Document Imaging中,在“工具”中选择“使用OCR识别文本”,Document Imaging的OCR识别程序就会对图片进行识别,完成后选择“工具”中的“将文本发送到Word”,程序会自动打开Word文档,展现在你面前的就是从图片中“抠”出来的文字。

提示:一般而言,识别的准确率可以达到95%以上,但对英文和数字的识别不是太好。

注意:许多朋友第一次使用,好像需要安装,安装的时候插入Office安装盘即可。