2023年12月6日发(作者:)
、
.~
① 我们‖打〈败〉了敌人。
②我们‖〔把敌人〕打〈败〉了。
先了解一下: PDF文档到底是什么?
PDF是出版和图形领域的软件厂商Adobe制定的电子文档格式标准。Adobe为之提供了免费的文档浏览器--Adobe Acrobat Reader以及相应的编辑软件--Adobe Acrobat,后者可以对PDF文档中页面的组织、链接进行编辑,对文档进行批注等等。而Adobe的另外一款软件--Illustrator则可以从各个细致入微处修整PDF文件。与普通格式的电子文档(如纯文本、超文本、RTF格式以及Word文档等)相比,PDF文档具有能够完善保持版面样式、跨平台等优越性,所以国外许多组织机构在发放无需再次编辑的文件时通常选择使用PDF格式。在我国,许多电子书籍也开始采用PDF格式。
创建PDF文件的典型方法并不是使用Illustrator等软件来编辑,而是先用普通的文字处理和桌面排版软件如Word、WordPerfect和PageMaker等编排好文档,然后通过Adobe的PDF Distiller或者PDF Writer等仿打印机引擎制作PDF文件。另外也有一些PDF文档是直接使用Adobe Acrobat配合扫描仪将原书稿扫描制作完成的,虽然该软件配有支持对多种西方文字进行光学字符识别(OCR)的插件,但是为了保证文字的可靠性,多数情况下采用这种方法制作的PDF文件没有进行字符识别。
如何把PDF文档转换成Word文档
一款非常好的Pdf向Doc格式转换的工具,ScanSoft PDF Converter for Microsoft Word
v1.0。它是由ScanSoft公司同微软共同组队开发了一个全新的Office 2003 插件。该插件可以帮助你通过Word直接将Pdf文档转换为Word文档,并且完全保留原来的格式和版面设计。
这个名为 ScanSoft PDF Converter for Microsoft Word 的插件是首先捕获Pdf文档中的信息,分离文字同图片,表格和卷,再将其统一到Word格式。现在你可以重新利用早先你从网络上下载或Email中收到的Pdf文件中的信息,而无需添加任何其他软件。
ScanSoft PDF Converter for Microsoft 已经非常紧密的同Office 2003整合在一起了,有两种方式可以将Pdf格式转换成Doc文件。
第一种方式,在Microsoft Word 2003中你可以直接通过“文件”—>“打开”来打开Pdf文件。ScanSoft PDF Converter for Microsoft Word插件会自动弹出了,经过转换后我们就可以得到想要的Doc文件。
第二种方式,ScanSoft公司也已经开发了基于此的Smart Tag(Office 2003中重要的功能元件)能够轻松的通过右键来将PDF文件转换成为 Microsoft Word 文件。
===========================
PDF文件中的文字存在两种可能性: 其一,可能是以计算机字符代码的形式被包裹在文件中;
其二,也可能只是一个页面图像中的像素组成的线条,没有字符代码信息。很明显,只有第一种PDF文档可以通过Word打开和编辑。
如何让Word读取包含字符信息的PDF文档。由于Adobe公司在2000年就发布了4.x版本的Acrobat Reader,比以往的版本功能有所增强,所以我们就以这个版本为例来讨论。 实际上,Word至今也没有PDF文档的转换器,因而无法对其直接读取。我们采用的还是"剪刀+浆糊"的办法。
1.拷贝文字
通常情况下,如果需要拷贝PDF中某一页面上的所有文字,您可以进行如下操作。
定位页面。
单击工具栏上的"Text Select Tool"按钮。
选择"Edit"*"Select All",再选择"Copy"。
切换到Word,按"粘贴"按钮(或Ctrl+v)把内容贴到Word文档中。
如果需要拷贝的是整篇PDF文档,则可以按照下面的步骤进行。
打开PDF文件后,选择"View"*"Continuous"。
选择"Edit"*"Select All"。
拷贝选中的内容。
切换到Word,粘贴内容。
使用这种方法拷贝到Word文档中的文字会保持基本的字符格式,比如粗体、斜体、字符大小等等,但是不会具有样式等方面的设置。对于较复杂的文档,可能需要耐心进行调整。
2.拷贝图片
如果需要拷贝PDF文档中的图片,首先要找出一个隐藏的工具按钮"Graphics Select Tool"。具体办法如下。
(1)按下"Text Select Tool"按钮,不要松开鼠标左键,该按钮会向右延展,显示出额外的几个按钮。根据按钮的文字提示,选择正确的按钮(熟悉Photoshop、CorelDraw等绘图软件的用户对于这种一钮多用的情况并不陌生)。
(2)把鼠标指针移到PDF页面上,此时指针呈十字形。拖动选择好图片区域,拷贝。
(3)回到Word文档,粘贴即可。
拷贝图片不仅支持拷贝PDF文档中的图片到Word,实际上,我们可以选择任意区域,如文字区、图片区、文字和图片混合区,拷贝后粘贴到Word中,它们都会被当作图片插入到Word文档。
需要注意的是,有的PDF文档由于制作的时候设置了某些安全选项,禁止我们拷贝其内容。如果要了解这方面的设置,可以通过选择"File"*"Document
Info"*"Security"查看。如果其中的"Selecting Text and Graphics"一项被设置为"No",这时上述拷贝文字和图像方法就不起作用了。此时
PDF文档转换成Word文档及其它2009-05-01 16:53作者:朱铮南
(发表在《软件报》2009年33期)
一、怎样从多页的PDF文档里抽取若干页成为JPG格式图片
最方便的要数使用Adobe Acrobat,点击Adobe Acrobat里的“导出”工具按钮,并选择“JPG”,PDF文档的所有页面就自动转换成一个个JPG格式文件。
如果你有Photoshop软件,可以这样操作,在Photoshop里打开PDF文档,Photoshop会让你选择打开那个页面,选定页面后打开,再另存为JPG格式图片文件。这个方法的缺点是一次只能抽取一页,需要重复操作,效率比较低。
二、怎样将PDF文档转换成Word文档
在adobe acrobat里将要转换的PDF文档打开,操作菜单“文件”→“另存为”,将保存类型选为“Microsoft word”就能转换成Word文档。或者点击Adobe Acrobat里的“导出”工具按钮,导出文件类型选择“Word”,结果是一样的。
一款名字为e-PDF To Word Converter的软件专门用来将PDF文档转换成Word文档,网上有汉化特别版可供下载。
/网站提供在线转换服务,只需要将待转换的PDF文档上传到这个网站,网站就会将载转换成的Word文档发到你的电子信箱里。
特别要说明的是,如果是通过扫描纸质文件生成的PDF文档,转换成Word文档以后得到的每一页都是插在Word文档里的图片,无法进行编辑。即便是由Word等其它可以编辑的电子文档生成的PDF文档,转换成Word文档以后,文字也是分布在一个个图文框里,如果版面稍复杂一些,文字还有可能重叠在一起,重新编辑的工作量还很大。
三、怎样从PDF文档里导出文字
假如PDF文档是由Word等其它可以编辑的电子文档生成的,用adobe reader或adobe
acrobat的“选择工具”选中文字后按“Ctrl”+“C”键,就可以将文字复制到剪贴板里,随便你粘贴到那里。adobe reader在安装后的默认状态下,“选择工具”是看不见的,需要操作菜单“工具”→“自定义工具栏”,在“选择工具”前打上钩,将它显现出来。
若要将整篇PDF文档的文字都导出来,在adobe reader里只要操作菜单“文件”→“另存为文本”,导出的文字就存到了一个文本文件里了。在adobe acrobat里则是操作菜单“文件”→“另存为”,保存类型选择“纯文本”,或者点击“导出”工具按钮,导出文件类型选择“更多格式”→“纯文本”。
四、使用OCR文本识别技术导出文字
如果PDF文档是通过扫描纸质文件生成的,就不能够用上述简单的方法导出文字了,但也可以借助OCR文本识别技术来导出文字。
在adobe acrobat里可以操作菜单“文档”→“OCR文本识别”→“使用OCR识别文本”,经过识别以后,就可以用“选择工具”选中文字进行复制了。
adobe reader没有自带OCR文本识别功能,但可以这样操作,操作菜单“文件”→“打印”,打印机名称选择“Microsoft Office Document Image Writer”,这是一个随Microsoft Office
2003一起安装到计算机里的虚拟打印机,它将PDF文档打印到后缀为“mdi”的文件里,并自动打开,在打开的“mdi”文件里依次操作菜单“工具”→“使用OCR识别文本”和“工具”→“将文本发送到word”就可以将文字导出到一个Word文档里。
OCR文本识别技术的识别率取决于创建PDF文档时的扫描精度,那些字迹模糊不清的文档,能够正确识别出的文字也不会太多。
五、怎样复制出PDF文档里的插图
用adobe reader或adobe acrobat打开PDF以后用“选择工具”选中插图后按“Ctrl”+“C”键,就可以将插图复制到剪贴板里。在adobe acrobat里操作菜单“高级”→“文档处理”→“导出所有图像”,就能够一次将文档里的所有图片全部导出成一个个图像文件。
六、怎样复制PDF文挡里的表格
用“选择工具”选中PDF文挡里的表格,右击鼠标,在弹出的菜单里点选“复制为表”,在Excel里操作菜单“选择性粘贴”,在对话框里选择“csv”后点击“确定”,PDF文挡里的表格就复制到Excel里了。也可以选中PDF文挡里的表格,右击鼠标,在弹出的菜单里点选“在Excel里打开”,表格就自动变成了Excel表。
如果需要将表格粘贴到Word文挡,应当采用“选择性粘贴”以“无格式文本”进行粘贴,粘贴之后选中这些数据,再操作菜单“表格”→“转换”→“文本转换表格”。
如果PDF文档是通过扫描纸质文件生成的,就不能复制成表格,只可以将表格复制成图片。
以上将PDF文档转换成Word文档以及从PDF文档里导出文字或图像的方法,取决于该文档没有加密对文档进行限制,如果文档已经加密进行了限制,只有在解密了以后才有可能进行。
七、怎样去除word等软件里的Adobe Acrobat菜单栏
安装了Adobe Acrobat以后,在Word、Excel、AutoCAD软件的菜单里会多出几个Adobe
Acrobat的菜单栏,其实这是Adobe Acrobat和这些应用软件的无缝结合,利用这些菜单可以方便地将这些应用软件创建的文档转换成PDF格式的文档,并能对转换的有关参数进行控制和调整。但是由于这些菜单占据了位置,不少使用者希望将它们去除。
去除的方法很简单,在“控制面板”里进入“添加和删除程序”,找到 Adobe Acrobat后点击“更改”,在“程序维护”对话框里选“修改”,到下一步的“自定义安装”里将Office、AutoCAD去掉即可。
安装Adobe Acrobat的时候如果选择“自定义安装”,就可以在安装过程里提前将Office、AutoCAD等剔除,就不会在Word、Excel、AutoCAD等软件里添加Adobe Acrobat菜单栏了


发布评论