2024年4月30日发(作者:)

浅谈扫描法制作 PDF文件常见问题及解

决方法

摘要:PDF文件是图书、期刊、报纸、档案等纸质资料数字化的一种常见存

储格式。利用扫描仪直接扫描是纸质资料制作PDF文件的主要方法。本文以高速

扫描仪在档案文件数字化中的应用为例,探讨扫描法制作PDF档案文件时常见的

问题与解决方法,以期为相关工作提供参考借鉴。

关键词:扫描法;PDF文件;高速扫描仪;复制提取

1.扫描后PDF文件空白页问题的产生与解决措施

问题描述:扫描制作PDF文件时,发现扫描后所得的PDF文件中有少量空白

页,干扰阅览,想要删除。

产生原因:一是部分双面打印的纸质文件尾页原本就空白而没有内容;二是

待扫描纸质文件及其附件存在单面打印和双面打印共存的情况,数字化时为了避

免漏页而选择“双面扫描”时自然会扫入空白页。

解决方法:第一步,运行PDF文件编辑器Foxit PDF Editor软件,打开有

空白页待删减的PDF文件,将当前页定位到空白页;第二步,选择“文

档”→“删除页面”菜单,即可删除当前空白页;第三步,依此类推,删除其他

空白页。

2.扫描后PDF文件漏页问题的产生与补充

问题描述:扫描制作PDF文件时,发现扫描后所得的PDF文件不完整,漏掉

了个别页。

产生原因:由于原纸质文件存放时间过久、边缘有破损、个别页有褶皱等因

素,在扫描仪进纸过程中发生纸张粘连所致。

解决方法:第一步,在原纸质文件中找出所漏扫的页,单独重新扫描并存储

为PDF格式文件;第二步,运行PDF文件编辑器Foxit PDF Editor软件,打开

漏页待完善的PDF文件,并将当前页定位到漏页位置下一页;第三步,选择“文

档”→“导入页面”菜单,在弹出对话框的“文件”栏中点击“打开”,选择第

一步中补充扫描的漏页PDF文件,点击“确定”;第四步,点击“保存”,扫描

文件漏页问题解决完毕。

3.扫描后的PDF文件倒页问题的产生与矫正

问题描述:扫描制作PDF文件时,发现扫描后所得的PDF文件中某些页面文

字呈现方向并非竖直向上,而是向左偏转了90,影响正常阅读,需要矫正方向。

产生原因:由于原竖向排版的纸质文件中,有部分插图、表格、附件、附录

等因内容需要采用了横向排版,与主体文件文字方向不一致所致。

解决方法:第一步,运行PDF文件编辑器Foxit PDF Editor软件,打开倒

页待矫正的PDF文件,将当前页定位在倒页位置;第二步,选择“文档”→“版

面”菜单,在弹出的工具栏中点击“旋转页面”按钮,在当前页上单击鼠标左键

直至倒页调正为止(每单击鼠标左键1次倒页顺时针方向旋转90),点击“保

存并关闭版面”按钮;第三步,逐次操作,矫正其他倒页。

4.扫描后PDF文件页面内容不清晰的问题与解决措施

问题描述:扫描制作的PDF文件模糊不清,影响阅读,更无法达到出版印刷

和数字化保存的要求。

产生原因:在纸质文件扫描时,扫描软件的扫描分辨率设置过低,未达到纸

质文件数字化的行业标准。

解决方法:扫描前,调高扫描软件的扫描分辨率到合适的数值(通常扫描分

辨率最低不应低于200dpi;原件文字偏小、过密、清晰度较差时,分辨率应高于

300dpi;如需高精度仿真复制,则分辨率应在600dpi以上;若要印刷出版,分

辨率可设置得更高),即可扫描出满意的数字化文件。

o

o

5.扫描后PDF文件中个别彩色页变为黑白页的问题与解决措施

问题描述:扫描包含彩色页的纸质文件所得的PDF文件中,多数彩色页颜色

还原正确,可个别彩色页彩色丢失,呈现黑白状态,未能保持扫描前纸质文件的

原貌。

产生原因:实践中,在扫描彩色、黑白混合文件(例如各种红头文件)时,

通常会选择图像类型为“自动”模式,此事扫描软件会自动对没有彩色内容的页

采用黑白模式扫描,对含有彩色内容的页采用彩色模式扫描。可是,有时候,由

于个别页中彩色内容占比过低,未能被扫描软件准确识别,而是被看作黑白文件

进行扫描,最终导致扫描文件失真。

解决方法:对于全彩色文件或彩色与黑白混排的纸质文件,设置扫描图像类

型为“24bit颜色”(彩色模式),这样所有内容都会以彩色模式进行扫描,虽

然可能会多占用存储空间,但是保证了数字化扫描件的真实性。

6.扫描后的PDF文件无法复制提取文字的问题与解决办法

问题描述:扫描所得的PDF文件在常见的PDF阅读器中打开后,浏览、阅读、

标注一切正常,可是却无法选择、复制提取页面中的文字内容,给后续PDF文件

的检索查询和复制利用造成困难。

产生原因:常见的PDF文件分为文字型(通过Word等文字处理软件制作的

PDF文件)和图像型(通过扫描仪直接扫描制作的PDF文件)两种,扫描所得的

PDF文件只有保存为双层PDF格式文件(可搜索PDF文件),其中的文字内容才

能被复制提取和粘贴利用。

解决方法:第一步,重新扫描该纸质文件;第二步,存储时在弹出的存储页

面的“保存类型”一栏中选择“PDF/A(可搜索)File(*.pdf)”并保存,即可

将数字化后的文件以双层PDF文件的格式存盘,便于日后检索、利用。

7.待扫描纸质文件文字方向不一致的问题与解决办法

问题描述:待扫描文件中不同页的文字方向不一致,一次性扫描后部分页面

文字会偏转90呈现,影响正常阅读。

产生原因:原文件在当初形成过程中,根据内容呈现的需要会有横向排版和

纵向排版之分,且两种版式有时会混合存在于同一份文件中。

解决方法:调整扫描软件的“版式”设置,选择“自动图像方向”,则在扫

描过程中扫描软件便能自动识别所扫文件中不同页的文字方向,自动旋转调整为

竖直向上方向后统一呈现。

8.待扫描纸质文件尺寸大小不统一,如何能实现一次性扫描

问题描述:同一份待扫描纸质文件中有A4纸和A3纸等多种幅面同时存在,

尺寸规格不统一,多次扫描需要再次合成不方便,一次性扫描不知能否实现。

产生原因:正式文件的尺寸多为A4纸幅面,例如政府工作报告、上级下发

的文件、学术论文等。然而,有些文件中配有插图、附表、附件等,且根据内容

呈现的需要,排版为A3纸幅面。于是,同一份文件中就出现了A4纸与A3纸幅

面并存的情况。

解决方法:将待扫描纸质文件按页码先后顺序放入扫描仪进纸器中(注意要

展开之前处于折叠状态的A3页),将扫描仪扫描程序中对应的项设置为“自动

识别原件尺寸和方向”,此后正常操作,即可一次性扫描完成,所得PDF文件文

字均竖直向上,尺寸不同的多种页面存在于同一个PFD文件中。

纸质文件数字化扫描过程中可能遇到的问题和困难远不止这些,只要善于思

考,勤于动手,举一反三,一切难题最终都会解决,也一定能制作出高质量的

PDF文件。

结束语:综上所述,应用高速扫描仪进行档案文件PDF数字化制作的过程中,

可能会遇到各式各样的问题,影响最终的PDF文件质量。通过分析问题原因,可

以有效解决问题,并且总结经验,避免类似问题再次出现,最终获得高质量的

PDF数字化文件。

o

参考文献:

[1]赵晓琴.一步到位 扫描直接变PDF[J].电脑爱好者. 2012(05):28.

[2] 刘宁.PDF文件格式与电子期刊的发展[J].现代情报,2003,23(9):42-

43.

[3] 李珍,田学东.PDF文件信息的抽取与分析[J].计算机应用,2003,23

(12):145-147.

[4] 孙文顺,赵秀萍.PDF文件转换的问题探讨[J].2011,(06):59-61.

2