2024年3月15日发(作者:)
双层PDF技术应用论文
摘要: 随着PDF技术的发展,档案数字化管理技术实现了长足的
发展,同时随着技术的不断创新,其工作方式、管理模式必将出现新
的变革。在一定程度上利用先进的技术对档案进行数字化管理,进而
对档案进行多元化、网络化管理,同时转变档案的管理模式。在对档
案进行管理的过程中,以保管、利用档案实体为重点,同时以档案信
息的数字化存储为核心,使得档案管理走向数字化、规范化、网络化。
1 政策背景
档案作为一种重要的信息资源,具有较高的科研价值。在《国民
经济和社会发展第十个五年计划的建议》中共中央明确提出:档案作
为一种原生的信息资源,在国家信息化建设过程中,档案信息化建设
是一个重要的组成部分。通过加强档案信息化建设,提高档案管理的
现代化水平,这是先进生产力、先进文化发展的必然要求,同时也是
提高档案信息服务水平的必然选择,在档案事业发展过程中,提高档
案管理的现代化水平具有重要的现实意义。
2 技术研究
2.1 概念 PDF全称为便携文档格式(Portable Document Format),
是一个适合文档交换的开放标准,致力于不依赖文档创建环境,允许
用户交换及浏览的一种电子文档格式。具有不限定软硬件及系统环
境,高压缩比、长期保存、高质量输出等特点。
2.2 技术 PDF文件格式已成为国际标准,越来越多的行业和单位
正在使用它。PDF文件是一种具有多层结构的格式文件,其特点是:
文件既可以是文本型的(比如由word生成的文件),也可以是图像型
的(比如由扫描生成的文件),双层PDF技术还可以将tif、jpg、bmp、
gif、png、单层PDF(图像)等图像类文件经加工后输出为可全文检
索的双层(图层和文字层)PDF文件。双层PDF文件是指文件内容既
包含文本层,也包含图像层,且其位置上下一一相对应。对于PDF文
件来说,其每一页涉及的内容主要包括:第一上层是对纸质文件进行
扫描获取的原始图像,第二下层是通过OCR软件对图像进行扫描识别
后产生的文字结果。通过上述处理,用户在使用PDF文件的过程中,
看到的是扫描图像,原始版面的公章、签名等可以100%保留,在需要
的情况下,可以对下层的文字信息进行选择、复制、检索等。
2.3 制作方法 PDF(Portable Document Format)文件格式作为
一种特殊的文本格式,是由Adobe公司所开发,该文本格式与其他文
本格式相比,其优点主要表现为:尺寸小、阅读方便,同时便于网络
传播和使用。但是,如果对其进行文本、格式等操作就会变得比较困
难,因为在解码格式方面,PDF格式与Doc格式存在一定的差异,通
过回车符、换行符,以及图片格式等在PDF格式下无法将其直接转换
为Doc文件。具体的解决方式为:
Adobe Reader 6.0 Standard:通过点击菜单栏中的“创建PDF”
按钮,对相应的创建途径进行选择,选择“从文件”,选中需要转换
的文件。
在文件格式转换过程中,通过Acrobat Distiller使得转换更加
轻松,在这种情况下,借助Office 办公软件打开相应的Doc文件,
然后选择“文件”——“打印”中的Acrobat Distiller打印机。
Adobe Acrobat 7.0 Professional: 对于Adobe7来说,通常情
况下需要进行激活处理,用Paradox Key Generator生成,在rar文
档中,经解压后出现一个“Keygen”。 运行文件夹里的
程序,借助该组生成的S/N进行相应的安装处理,完成安装后,需要
重新启动计算机,进入Acrobat界面,在操作界面上选择弹出菜单列
表中的“Activate Option”,并单击“Activation by telephone”
按钮, 在弹出Acoabat中,产生Activation code,这时,Paradox
Key Generator程序将会被执行,在界面产生的S/N及Activation
code中输入Paradox Key Generator,同时取得Authorization code,
并手工输入。
利用Office2003的转换工具:首先使用Adobe Reader打开需要
转换的PDF文件,同时对文件菜单中的打印进行选择,按照
“Microsoft Office Document Image Writer”设置“打印机”的“名
称”,确认按照MDI格式将该PDF文件设为虚拟打印文件。对于
“Microsoft Office Document Image
Writer”项,如果在“名称”设置的下拉列表中没有找到,在这
种情况下,说明安装Office 2003时没有安装该组件,这时对其进行
更新和安装,需要借助Office 2003安装光盘中的“添加/删除组件”。
通过运行Microsoft Office Document Imaging,打开保存的MDI文
件,在工具栏中选择将文本发送到Word菜单,然后选中弹出窗口中
的“在输出时保存图片板式不变”,经过确认后,系统会自动提示“必
须在执行此操作前重新运行OCR,这可能需要一些时间”,最后按确
认键即可。
3 PDF技术在档案管理数字化的作用
PDF技术使档案数字化管理给搜索、查找、即时阅读带来的便捷
是毋庸多言的,能够简化并极大提高管理的质量和效率。许多纸质或
其他实物档案,由于年月已久,只要动一动就会散裂或尘化,损毁风
险极大,通过PDF技术数字化采集图片、视频、尺寸、材质、介绍、
文字描述等内容就可以在未来相当长一段时期保证原档的完好性,并
且便于向需要的人提供参考。
随着PDF技术的发展,档案数字化管理技术实现了长足的发展,
同时随着技术的不断创新,其工作方式、管理模式必将出现新的变革。
在一定程度上利用先进的技术对档案进行数字化管理,进而对档案进
行多元化、网络化管理,同时转变档案的管理模式。在对档案进行管
理的过程中,以保管、利用档案实体为重点,同时以档案信息的数字
化存储为核心,使得档案管理走向数字化、规范化、网络化。
参考文献:
[1]郭金光.双层PDF技术及在档案数字化中的应用[J].陕西档
案,2013(02).
[2]周锦云.档案管理系统的设计与实现[J].电子科技大学,2013
(03).
[3]熊雨前,徐红轮
(03).
.PDF技术及应用[J].数字与微缩影像,2011


发布评论