2024年3月15日发(作者:)

双层PDF技术应用论文

摘要: 随着PDF技术的发展,档案数字化管理技术实现了长足的

发展,同时随着技术的不断创新,其工作方式、管理模式必将出现新

的变革。在一定程度上利用先进的技术对档案进行数字化管理,进而

对档案进行多元化、网络化管理,同时转变档案的管理模式。在对档

案进行管理的过程中,以保管、利用档案实体为重点,同时以档案信

息的数字化存储为核心,使得档案管理走向数字化、规范化、网络化。

1 政策背景

档案作为一种重要的信息资源,具有较高的科研价值。在《国民

经济和社会发展第十个五年计划的建议》中共中央明确提出:档案作

为一种原生的信息资源,在国家信息化建设过程中,档案信息化建设

是一个重要的组成部分。通过加强档案信息化建设,提高档案管理的

现代化水平,这是先进生产力、先进文化发展的必然要求,同时也是

提高档案信息服务水平的必然选择,在档案事业发展过程中,提高档

案管理的现代化水平具有重要的现实意义。

2 技术研究

2.1 概念 PDF全称为便携文档格式(Portable Document Format),

是一个适合文档交换的开放标准,致力于不依赖文档创建环境,允许

用户交换及浏览的一种电子文档格式。具有不限定软硬件及系统环

境,高压缩比、长期保存、高质量输出等特点。

2.2 技术 PDF文件格式已成为国际标准,越来越多的行业和单位

正在使用它。PDF文件是一种具有多层结构的格式文件,其特点是:

文件既可以是文本型的(比如由word生成的文件),也可以是图像型

的(比如由扫描生成的文件),双层PDF技术还可以将tif、jpg、bmp、

gif、png、单层PDF(图像)等图像类文件经加工后输出为可全文检

索的双层(图层和文字层)PDF文件。双层PDF文件是指文件内容既

包含文本层,也包含图像层,且其位置上下一一相对应。对于PDF文

件来说,其每一页涉及的内容主要包括:第一上层是对纸质文件进行

扫描获取的原始图像,第二下层是通过OCR软件对图像进行扫描识别

后产生的文字结果。通过上述处理,用户在使用PDF文件的过程中,

看到的是扫描图像,原始版面的公章、签名等可以100%保留,在需要

的情况下,可以对下层的文字信息进行选择、复制、检索等。

2.3 制作方法 PDF(Portable Document Format)文件格式作为

一种特殊的文本格式,是由Adobe公司所开发,该文本格式与其他文

本格式相比,其优点主要表现为:尺寸小、阅读方便,同时便于网络

传播和使用。但是,如果对其进行文本、格式等操作就会变得比较困

难,因为在解码格式方面,PDF格式与Doc格式存在一定的差异,通

过回车符、换行符,以及图片格式等在PDF格式下无法将其直接转换

为Doc文件。具体的解决方式为:

Adobe Reader 6.0 Standard:通过点击菜单栏中的“创建PDF”

按钮,对相应的创建途径进行选择,选择“从文件”,选中需要转换

的文件。

在文件格式转换过程中,通过Acrobat Distiller使得转换更加

轻松,在这种情况下,借助Office 办公软件打开相应的Doc文件,

然后选择“文件”——“打印”中的Acrobat Distiller打印机。

Adobe Acrobat 7.0 Professional: 对于Adobe7来说,通常情

况下需要进行激活处理,用Paradox Key Generator生成,在rar文

档中,经解压后出现一个“Keygen”。 运行文件夹里的

程序,借助该组生成的S/N进行相应的安装处理,完成安装后,需要

重新启动计算机,进入Acrobat界面,在操作界面上选择弹出菜单列

表中的“Activate Option”,并单击“Activation by telephone”

按钮, 在弹出Acoabat中,产生Activation code,这时,Paradox

Key Generator程序将会被执行,在界面产生的S/N及Activation

code中输入Paradox Key Generator,同时取得Authorization code,

并手工输入。

利用Office2003的转换工具:首先使用Adobe Reader打开需要

转换的PDF文件,同时对文件菜单中的打印进行选择,按照

“Microsoft Office Document Image Writer”设置“打印机”的“名

称”,确认按照MDI格式将该PDF文件设为虚拟打印文件。对于

“Microsoft Office Document Image

Writer”项,如果在“名称”设置的下拉列表中没有找到,在这

种情况下,说明安装Office 2003时没有安装该组件,这时对其进行

更新和安装,需要借助Office 2003安装光盘中的“添加/删除组件”。

通过运行Microsoft Office Document Imaging,打开保存的MDI文

件,在工具栏中选择将文本发送到Word菜单,然后选中弹出窗口中

的“在输出时保存图片板式不变”,经过确认后,系统会自动提示“必

须在执行此操作前重新运行OCR,这可能需要一些时间”,最后按确

认键即可。

3 PDF技术在档案管理数字化的作用

PDF技术使档案数字化管理给搜索、查找、即时阅读带来的便捷

是毋庸多言的,能够简化并极大提高管理的质量和效率。许多纸质或

其他实物档案,由于年月已久,只要动一动就会散裂或尘化,损毁风

险极大,通过PDF技术数字化采集图片、视频、尺寸、材质、介绍、

文字描述等内容就可以在未来相当长一段时期保证原档的完好性,并

且便于向需要的人提供参考。

随着PDF技术的发展,档案数字化管理技术实现了长足的发展,

同时随着技术的不断创新,其工作方式、管理模式必将出现新的变革。

在一定程度上利用先进的技术对档案进行数字化管理,进而对档案进

行多元化、网络化管理,同时转变档案的管理模式。在对档案进行管

理的过程中,以保管、利用档案实体为重点,同时以档案信息的数字

化存储为核心,使得档案管理走向数字化、规范化、网络化。

参考文献:

[1]郭金光.双层PDF技术及在档案数字化中的应用[J].陕西档

案,2013(02).

[2]周锦云.档案管理系统的设计与实现[J].电子科技大学,2013

(03).

[3]熊雨前,徐红轮

(03).

.PDF技术及应用[J].数字与微缩影像,2011