2024年8月14日发(作者:)
新性研究
旧报纸是研究近现代历史的重要文献
,
但由
于自身年代和用纸等主客观原因
,
很多旧报纸没
能很好保存
,
有的损坏,有的发黄变脆
,
甚至一翻
就碎
。
有些旧报纸因属于孤本
,
弥足珍贵,但却无
法提供给大众和研究人员
,
满足其使用需求
。
随着
计算机技术和互联网的不断发展
,
新时代和新技
术为藏用并举
、
远程使用旧报纸提供了可能
,
数字
J
旧报纸翻拍的图
化成为必然趋势
。
数字化加工旧报纸的深度一般分为
3
个层次
:
①
数字化基础工作
。
进行载体转换
,
处理成数字图
像;
②
数字化篇章信息著录
。
在数字图像的基础上
进行标题文字识别
;
③
在数字图像基础上进行全
文识别和版面还原
。
旧报纸转换为数字图像
,
如果
有微缩胶片
,
则优先采用扫描胶片的方式
。
对于幅
面较大的旧报纸
,
则需采用扫描仪进行转换
。
这种
方式不但需要昂贵的大幅面扫描仪
,
而且扫描过
程需要拆包压平,对旧报纸造成损害。
因此
,
采用
单反相机进行翻拍更加简单易行
。
笔者在审核采用单反相机进行翻拍的
60
多
种近
2000
册珍贵的旧报纸数字图片时发现
,
图片
质量的控制对版面信息标识
、
标题和全文数字化
有重大影响
,
旧报纸翻拍图片的质量是后续标引
和识别的基础
。
本文从旧报纸翻拍实践出发
,
针对
常见的图像质量问题
,
制定图像分辨率
、
白平衡
、
^
质
量控^
厦门科
枝
2/2021
图片亮度
、
清晰度
、
几何畸变和色彩还原等标准遥
通过标准化翻拍环境
、
旧报纸整理
、
单反相机设
置
、
拍照和图像数据审核流程
,
为翻拍图片质量验
收提供依据,并以此作为操作规范
,
形成旧报纸翻
拍的统一图片质量标准
。
本文分为
3
部分
:
第一部分描述翻拍旧报纸
的环境及翻拍流程
;
第二部分说明翻拍过程的图
像质量控制指标;第三部分进行总结
。
翻拍环境及流程
为了提高翻拍质量和一致性
,
稳定可控的翻
拍环境是基础
。
采用固定翻拍架(
如图
1
所示
)
,
可
以控制旧报纸翻拍环境的亮度
、
色温
,
减少环境变
化干扰
。
因此,参考高清新闻演播室的灯光方案,
翻拍时采用色温为
5600K
的光源
,
控制旧报纸上
的亮度不低于
6001ux
。
具体翻拍流程如下
。
W
创新性研究
图
1
翻拍架
1
.
旧报纸整理
①
馆藏梳理:把要翻拍的旧报纸按报种
、
出版
顺序一致袁有利于审核校对和从图片溯源到原报
或原合订本
。
从效率
、
统一性的角度考虑
,
报纸采
时间整理好
,
便于补漏
,
保证数据的完整性
;
②
平
整:拍摄前先查看旧报纸质量
,
清洁旧报纸
,
把粘
在旧报纸上面的书虫
、碎片小心处理掉
。
有折角折
用单双面同一台相机分开拍摄
,
目录下建立
01
、
02
子目录
,
审核的时候再合并成册
。
文件名由系
统自动生成
,
不手工改动数据
,
确保图像顺序与报
皱的先做平整处理
。
有破损的垫上同色系牛皮纸袁
纸顺序完全一致
。
翻拍过程中碰到漏拍
、
重拍的问
目的是不叠字
,
达到最佳的图片质量
。
2.
相机设置
题
,
后期审核的时候再进行删除
、
插入
。
最后合并
成册
。
4.
版面审核
为了达到更好的图像质量
,
采用全画幅单反
相机和
50mm
固定焦距镜头
,
减少镜头变形
,
提高
把拍摄好的图片按格式分开
(
JPGNEF
或
CR2
)
后
,
分别对两个格式图片进行统一命名
,
查
锐度;由于环境光源固定为单色温
5600K
,
将白平
衡设置为手动
,
色温
5600K
与环境灯光一致
;
光
圈采用景深与衍射平衡较好的
F8
,
避免景深太小
或衍射引起的模糊
;
感光度设为
ISO100
,
减少相
看每一拍的
JPG
图像
,
审核是否有漏拍
、
重拍
、
颠
倒
、
模糊
、
倾斜
、
阴影
、
遮盖及拍摄不全等情况
。
标
注后
,
让拍摄人员进行补拍
、
重拍
,
进行图片比对
后
,
再进行图片删除
、
插入
、
替换
,
最后再重命名
,
机传感器的底噪
;
快门采用自动快门,测光采用均
匀测光
,
手动对焦
。
相机输出图片格式为
JPG
和
合并图片成册
,
完成电子图片的预处理
。
RAW
,
JPG
采用最精细模式减少压缩损失,
RAW
图像输出的特点是没有经过数码相机的预处理
,
图像信息是传感器原始信号
,
为后期处理提供了
图片质量控制指标
图片质量控制即图片质量标准确定及检查
,
旧报纸翻拍质检工作要求对旧报纸翻拍输出的图
像数据和版面信息进行检查
、
标引
,
做到一致的效
果
。
标弓
I
包含报纸的种类
、
版面基本信息等
。
白平衡
、
亮度
、
降噪
、
清晰度
、
色调曲线等调整工
具
。
不同品牌的单反相机的
RAW
文件采用不同
后缀名
,
佳能相机
RAW
文件后缀是
CR2
或
CR3
,
尼康的
RAW
后缀名为NEF
o
对翻拍的图片
,
涉及拍摄图像分辨率
、
清晰
度
、
畸变和色彩等技术参数,采用量化客观标准和
3.
开始拍照
保证数码相机每一拍和原报或原报合订本的
主观判断
,
以保证报纸完整准确地呈现给读者
。
客
观标准含图片清晰度
、
亮度
、
白平衡
、
完整性及畸
厦门科
枝
2/2021
W
创新性研究
变等
,
主观判断含色彩准确度
、
色彩饱和度
、
版面破
1.
图片分辨率
边角裁
10%
后分辨率尽量满足
300dpi
输出要
损
、
折皱及遮盖等
。
通过调整拍摄环境
,
优化相机设
置
,
让翻拍的旧报纸尽可能接近原报色彩,让读者
电脑查看时
,
有更好的视觉体验
。
求
,
一版图片分辨率为
:
5792X8688
。
边角裁剪
10%
的原因有
:
中心成像质量高
,
镜头边角有暗角
/
亮度
衰减
,
相机高度需根据报纸幅面做调整
,
在保证拍
翻拍过程中碰至啲问题主要有以下几点
:
①
异
物遮盖
,
破旧报纸有碎纸片
、
书虫等异物文字遮盖
;
②
装订遮盖边缘拍摄不全
;
③
折皱遮盖
,
报纸折皱
摄完整画面的情况下尽量放低以保证图像的有效
像素
;
相机一定要平行于报纸
,
避免图像变形
。
文字遮盖;
④
手影拍摄
,
由于翻页过快拍摄到手指
或身体遮住光源
,
导致图片阴影等;
⑤
报纸多拍
、
漏
拍问题
。
可采取的措施是
,
每一本报纸在翻拍前先
把页面上遮盖的异物小心去除
,
提前用折皱压板进
行平整处理
,
在破损的报纸下面垫上同色系纸
,
避
2.
手动白平衡
在阳光
、
阴霾的天气及室内各种灯光下
,
人们
所看到的白色物体颜色恒为白
,
因为人的大脑可以
侦测并且更正这样的色彩改变
,
进行自我适应
。
但
是相机不具有自适应功能
,
需要利用白平衡进行校
免下面一张报纸文字跟当前报纸文字混在一起
,影
响阅读
。
拍摄的时候把握节奏
,
避免拍到手指或因
正
。
自动白平衡会由于旧报纸偏黄而出现误判
。
根
据翻拍架光源色温
,
把相机白平衡设置为手动模
拍摄人员挡住灯光造成阴影
。
边缘装订遮盖的把装
订线拆开再拍摄
。
每一张照片对应一个编号
,
进行简单版面信息
式
,
色温设为
5600K
,
与光源色温一致
,
避免白平衡
偏差
。
如果不知道灯光的准确色温
,
也可以采用自
动白平衡
,
让相机拍白纸自动计算色温
,
再运用到
旧报纸拍摄
。
标引,便于以后网上查阅
。
最后
,
清点文献的册数,
按种类
、
年月顺序装箱
,
贴上标签
,
上架
,
完成文献
提取的全部程序
。
3.
图片亮度
旧报纸一般为黑色字和偏黄背景
,
采用自动曝
以下提出图片质量控制指标
,
在实践中能够很
好地满足不同批次的拍摄要求遥
光
,
图片灰度直方图背景亮度分布最大值接近
110
,
主观显示与原始报纸较一致
,
如图
2
所示
。
r~]
平購显示
叼文件信息
叼
EXIF
偌息
叼亶方图
⑥
®
!i^l
.
q
貝鐵
4
老
a
x
0
64
__
12L
生獴蹲,對彈胶女並暗是•診
紙■還人
;
爭:牡甲声
E
加
“
d
士
—
・
图
2
图片亮度直方图
■
■
■
■
■
__
一
_
—
~
»
亠-
■亠
A
j
I
-M-
hD
r
r
•
4.
图片清晰度
按原始尺寸放大图片
,
旧报纸中间和边缘都
5.
图片几何畸变
如图
3
所示
,
桶形
/
枕形畸变小于2%
遥
清晰不模糊
。
厦门科
枝
2/2021
弋
创新性研究
正常物体
枕型畸变
桶型畸变
1
®
图
3
几何畸变示意图
6.
图片色彩还原
参考文献
[1]
肖红
,
槐燕.民国报纸数字化实践中的质检问题探析
[J].
图书馆学研究,2017(07):61-78+87
发黄的旧报纸中有些内容采用套印突出宣传
重点
。
为了精确还原色彩
,
采用拍摄
24
标准色卡
,
通过识别色块产生配置文件进行校正
。
通过以上对单反相机各参数的正确设定
,
可以
拍出质量合格
、
批次统一的图像
,
进行标引遥
[2]
李彦杰
,
沈志伟.数字工作流程中的图像处理
[J].印刷技
术,
2019(04):20-26
通过上述步骤
,
可以做到旧报纸翻拍质量有标
准可依
,
方便拍后检查
,
保证质量一致可控
,
方便推
广到不同批次的旧报纸
,
在不同地方实现翻拍。
审
核完成的图片上传到指定服务器
,
按照编码规则统
一重命名
,
打上水印
,
根据不同使用需要转换不同
尺寸,做好文件的存档备份
,
建设简单的数据库
。
把翻拍好的旧报纸分类装箱贴上标签密集存放
。
结论
笔者通过审核翻拍的
60
多种近
2000
册旧报
纸
,
制定出检查单
、
拍摄规范及审核标准
,
用于不同
批次数字化推广
,
避免返工
,
获得了良好效果
。
多数旧报纸长期保存在书库中
,
藏而不用
,
鲜
为读者所知
。
数字化完成后
,
可以通过宣传
,
让读
者及时了解资源的特色及检索方法
,
主动对读者
进行培训
,
努力提高读者通过网络利用资源的操
作技能
。
此外
,
在尊重知识产权保护版权的前提下,
增强开放性
,
适当开放使用限制
,
尽可能让用户可
以通过网络随时随地利用资源
。
对于提高资源的
利用率
,
充分实现资源的社会价值
,
具有十分重要
的意义
。
(作者单位
:
厦门大学图书馆)
厦门科
枝
2/2021


发布评论