2024年8月14日发(作者:)

新性研究

旧报纸是研究近现代历史的重要文献

但由

于自身年代和用纸等主客观原因

很多旧报纸没

能很好保存

,

有的损坏,有的发黄变脆

甚至一翻

就碎

有些旧报纸因属于孤本

弥足珍贵,但却无

法提供给大众和研究人员

满足其使用需求

随着

计算机技术和互联网的不断发展

新时代和新技

术为藏用并举

远程使用旧报纸提供了可能

数字

J

旧报纸翻拍的图

化成为必然趋势

数字化加工旧报纸的深度一般分为

3

个层次

:

数字化基础工作

进行载体转换

处理成数字图

像;

数字化篇章信息著录

在数字图像的基础上

进行标题文字识别

在数字图像基础上进行全

文识别和版面还原

旧报纸转换为数字图像

,

如果

有微缩胶片

,

则优先采用扫描胶片的方式

对于幅

面较大的旧报纸

,

则需采用扫描仪进行转换

这种

方式不但需要昂贵的大幅面扫描仪

而且扫描过

程需要拆包压平,对旧报纸造成损害。

因此

采用

单反相机进行翻拍更加简单易行

笔者在审核采用单反相机进行翻拍的

60

种近

2000

册珍贵的旧报纸数字图片时发现

图片

质量的控制对版面信息标识

标题和全文数字化

有重大影响

旧报纸翻拍图片的质量是后续标引

和识别的基础

本文从旧报纸翻拍实践出发

,

针对

常见的图像质量问题

,

制定图像分辨率

白平衡

^

量控^

厦门科

2/2021

图片亮度

清晰度

几何畸变和色彩还原等标准遥

通过标准化翻拍环境

旧报纸整理

单反相机设

拍照和图像数据审核流程

,

为翻拍图片质量验

收提供依据,并以此作为操作规范

,

形成旧报纸翻

拍的统一图片质量标准

本文分为

3

部分

第一部分描述翻拍旧报纸

的环境及翻拍流程

;

第二部分说明翻拍过程的图

像质量控制指标;第三部分进行总结

翻拍环境及流程

为了提高翻拍质量和一致性

稳定可控的翻

拍环境是基础

采用固定翻拍架(

如图

1

所示

以控制旧报纸翻拍环境的亮度

色温

减少环境变

化干扰

因此,参考高清新闻演播室的灯光方案,

翻拍时采用色温为

5600K

的光源

控制旧报纸上

的亮度不低于

6001ux

具体翻拍流程如下

W

创新性研究

1

翻拍架

1

.

旧报纸整理

馆藏梳理:把要翻拍的旧报纸按报种

出版

顺序一致袁有利于审核校对和从图片溯源到原报

或原合订本

从效率

统一性的角度考虑

报纸采

时间整理好

,

便于补漏

,

保证数据的完整性

;

整:拍摄前先查看旧报纸质量

,

清洁旧报纸

,

把粘

在旧报纸上面的书虫

、碎片小心处理掉

有折角折

用单双面同一台相机分开拍摄

目录下建立

01

02

子目录

审核的时候再合并成册

文件名由系

统自动生成

不手工改动数据

,

确保图像顺序与报

皱的先做平整处理

有破损的垫上同色系牛皮纸袁

纸顺序完全一致

翻拍过程中碰到漏拍

重拍的问

目的是不叠字

,

达到最佳的图片质量

2.

相机设置

后期审核的时候再进行删除

插入

最后合并

成册

4.

版面审核

为了达到更好的图像质量

采用全画幅单反

相机和

50mm

固定焦距镜头

减少镜头变形

,

提高

把拍摄好的图片按格式分开

JPGNEF

CR2

,

分别对两个格式图片进行统一命名

,

锐度;由于环境光源固定为单色温

5600K

,

将白平

衡设置为手动

色温

5600K

与环境灯光一致

圈采用景深与衍射平衡较好的

F8

,

避免景深太小

或衍射引起的模糊

感光度设为

ISO100

,

减少相

看每一拍的

JPG

图像

审核是否有漏拍

重拍

模糊

倾斜

阴影

遮盖及拍摄不全等情况

注后

,

让拍摄人员进行补拍

重拍

进行图片比对

,

再进行图片删除

插入

替换

,

最后再重命名

机传感器的底噪

快门采用自动快门,测光采用均

匀测光

手动对焦

相机输出图片格式为

JPG

合并图片成册

完成电子图片的预处理

RAW

,

JPG

采用最精细模式减少压缩损失,

RAW

图像输出的特点是没有经过数码相机的预处理

,

图像信息是传感器原始信号

为后期处理提供了

图片质量控制指标

图片质量控制即图片质量标准确定及检查

,

旧报纸翻拍质检工作要求对旧报纸翻拍输出的图

像数据和版面信息进行检查

标引

做到一致的效

标弓

I

包含报纸的种类

版面基本信息等

白平衡

亮度

降噪

清晰度

色调曲线等调整工

不同品牌的单反相机的

RAW

文件采用不同

后缀名

佳能相机

RAW

文件后缀是

CR2

CR3

尼康的

RAW

后缀名为NEF

o

对翻拍的图片

涉及拍摄图像分辨率

清晰

畸变和色彩等技术参数,采用量化客观标准和

3.

开始拍照

保证数码相机每一拍和原报或原报合订本的

主观判断

,

以保证报纸完整准确地呈现给读者

观标准含图片清晰度

亮度

白平衡

完整性及畸

厦门科

2/2021

W

创新性研究

变等

主观判断含色彩准确度

色彩饱和度

版面破

1.

图片分辨率

边角裁

10%

后分辨率尽量满足

300dpi

输出要

折皱及遮盖等

通过调整拍摄环境

,

优化相机设

,

让翻拍的旧报纸尽可能接近原报色彩,让读者

电脑查看时

,

有更好的视觉体验

一版图片分辨率为

5792X8688

边角裁剪

10%

的原因有

中心成像质量高

镜头边角有暗角

/

亮度

衰减

,

相机高度需根据报纸幅面做调整

,

在保证拍

翻拍过程中碰至啲问题主要有以下几点

物遮盖

,

破旧报纸有碎纸片

书虫等异物文字遮盖

;

装订遮盖边缘拍摄不全

;

折皱遮盖

,

报纸折皱

摄完整画面的情况下尽量放低以保证图像的有效

像素

;

相机一定要平行于报纸

避免图像变形

文字遮盖;

手影拍摄

由于翻页过快拍摄到手指

或身体遮住光源

,

导致图片阴影等;

报纸多拍

拍问题

可采取的措施是

每一本报纸在翻拍前先

把页面上遮盖的异物小心去除

提前用折皱压板进

行平整处理

在破损的报纸下面垫上同色系纸

2.

手动白平衡

在阳光

阴霾的天气及室内各种灯光下

人们

所看到的白色物体颜色恒为白

因为人的大脑可以

侦测并且更正这样的色彩改变

进行自我适应

是相机不具有自适应功能

,

需要利用白平衡进行校

免下面一张报纸文字跟当前报纸文字混在一起

,影

响阅读

拍摄的时候把握节奏

避免拍到手指或因

自动白平衡会由于旧报纸偏黄而出现误判

据翻拍架光源色温

把相机白平衡设置为手动模

拍摄人员挡住灯光造成阴影

边缘装订遮盖的把装

订线拆开再拍摄

每一张照片对应一个编号

进行简单版面信息

色温设为

5600K

与光源色温一致

避免白平衡

偏差

如果不知道灯光的准确色温

也可以采用自

动白平衡

,

让相机拍白纸自动计算色温

,

再运用到

旧报纸拍摄

标引,便于以后网上查阅

最后

清点文献的册数,

按种类

年月顺序装箱

,

贴上标签

上架

完成文献

提取的全部程序

3.

图片亮度

旧报纸一般为黑色字和偏黄背景

采用自动曝

以下提出图片质量控制指标

,

在实践中能够很

好地满足不同批次的拍摄要求遥

图片灰度直方图背景亮度分布最大值接近

110

,

主观显示与原始报纸较一致

如图

2

所示

r~]

平購显示

叼文件信息

EXIF

偌息

叼亶方图

®

!i^l

.

q

貝鐵

4

a

x

0

64

__

12L

生獴蹲,對彈胶女並暗是•診

紙■還人

爭:牡甲声

E

d

2

图片亮度直方图

__

_

~

»

亠-

■亠

A

j

I

-M-

hD

r

r

4.

图片清晰度

按原始尺寸放大图片

旧报纸中间和边缘都

5.

图片几何畸变

如图

3

所示

桶形

/

枕形畸变小于2%

清晰不模糊

厦门科

2/2021

创新性研究

正常物体

枕型畸变

桶型畸变

1

®

3

几何畸变示意图

6.

图片色彩还原

参考文献

[1]

肖红

槐燕.民国报纸数字化实践中的质检问题探析

[J].

图书馆学研究,2017(07):61-78+87

发黄的旧报纸中有些内容采用套印突出宣传

重点

为了精确还原色彩

,

采用拍摄

24

标准色卡

,

通过识别色块产生配置文件进行校正

通过以上对单反相机各参数的正确设定

,

可以

拍出质量合格

批次统一的图像

进行标引遥

[2]

李彦杰

沈志伟.数字工作流程中的图像处理

[J].印刷技

术,

2019(04):20-26

通过上述步骤

,

可以做到旧报纸翻拍质量有标

准可依

,

方便拍后检查

,

保证质量一致可控

,

方便推

广到不同批次的旧报纸

在不同地方实现翻拍。

核完成的图片上传到指定服务器

,

按照编码规则统

一重命名

,

打上水印

,

根据不同使用需要转换不同

尺寸,做好文件的存档备份

,

建设简单的数据库

把翻拍好的旧报纸分类装箱贴上标签密集存放

结论

笔者通过审核翻拍的

60

多种近

2000

册旧报

,

制定出检查单

拍摄规范及审核标准

,

用于不同

批次数字化推广

,

避免返工

获得了良好效果

多数旧报纸长期保存在书库中

藏而不用

,

为读者所知

数字化完成后

,

可以通过宣传

,

让读

者及时了解资源的特色及检索方法

主动对读者

进行培训

努力提高读者通过网络利用资源的操

作技能

此外

在尊重知识产权保护版权的前提下,

增强开放性

,

适当开放使用限制

,

尽可能让用户可

以通过网络随时随地利用资源

对于提高资源的

利用率

充分实现资源的社会价值

具有十分重要

的意义

(作者单位

厦门大学图书馆)

厦门科

2/2021