(档案数字化流程图)
档案数字化是档案信息化建设重要内容,包括档案整理和档案数字化,是使档案信息资源能准确、方便、快捷地提供利用,使档案信息资源得到共享,以满足单位或社会对档案利用的需求。
1、档案扫描
档案扫描要根据纸质档案原件的实际情况、数字化目的、数字化规模、计算机网络和存储条件等选择相应的扫描设备,进行相关参数的设置和调整。
①色彩模式
扫描色彩模式分为彩色、灰度、黑白。
色彩模式会对图像大小产生影响。在不考虑压缩等其他影响因素的情况下,三种色彩模式扫描的图像大小的关系可简单表述为:24位彩色图像大小是8位灰色图像的3倍,黑白图像的24倍。
色彩模式还会对图像清晰度产生影响。对于影像清晰、档案原件色彩简单、对比强烈的原件,如白纸黑字的普通打印文件,在其他条件均调到最佳的情况下,采取三种色彩模式扫描的图像清晰程度差异不明显。而对于影像不够清晰,或档案原件色彩丰富,以及对比不够强烈的原件,采取彩色模式扫描的图像,在展现档案原件细节、清晰程度等方面要明显优于灰度模式或黑白模式扫描的图像。
因此,一般要求全部采用彩色模式进行扫描。在实际的数字化过程中,各单位要根据数字化成果应用要求、实际可承受的存储容量以及原件情况等因素,来确定色彩模式参数。页面中有红头、印章或插有照片、彩色插图、多色彩文字等的档案,应采用彩色模式进行扫描。页面为黑白两色,并且字迹清晰、不带插图的档案,也可采用黑白二值模式进行扫描。页面为黑白两色,但字迹清晰度差或带有插图的档案,也可采用灰度模式扫描。
②分辨率
分辨率是指单位长度内图像包含的点数或像素数,一般用每英寸点数(dpi)表示。分辨率对扫描图像大小和清晰程度以及扫描时长都有直接影响。扫描图像分辨率越高,所占用的扫描时间越长,文件也会越大,图像清晰程度越好。但是,分辨率在调高到一定程度时,分辨率的增加并不会明显改善清晰程度,而其所需的存储空间则会明显增加。因此,实际工作中,应根据可接受的图像大小和清晰程度的具体情况来选择合适的分辨率。
在现有技术条件下,综合考虑不同档案部门基础条件的差异,一般要求扫描分辨率个小于200dpi.如文字偏小密集,清晰度较差时,建议扫描分辨率不小于300dpi.如有计算机输出缩微摄影(COM)仿具复制、印刷出版等其他用途时,可根据需要调整扫描分辨率,需要进行COM输出的档案,扫描分辨率建议不小于300dpi;需要进行高精度仿真复制的档案,扫描分辨率建议不小于600dp;需要进行印刷出版的档案,可结合档案幅面、印刷出版幅面、印刷精度要求等选择合适的分辨率。
③存储格式
纸质档案数字化图像应存为 TIFF、JPEG、JPEG2000 等通用格式,压缩率的选择可根据实际应用的需求而定。
TIFF 可以实现对图像的无压缩存储,能保持原有图像的颜色和层次,但占用存储空间很大。JPEG是一种有损压缩格式,在采用较高压缩率的同时能获得较好的图像质量;JPEG具有调节图像的功能,允许用不同的压缩比例对文件压缩,方便在图像质量和文件大小之间找到平衡点,其应用也非常广泛。目前各类浏览器均支持JPEG这种图像格式。JPEG2000 既支持无损压缩,也支持有损压缩。JPEG2000在相同图像质量条件下可以获得比JPEG更高的压缩比,而且能够实现图像的渐进传输。
2、图像处理
图像处理包含图像拼接、旋转与纠偏、裁边、去污、图像质量检查等工作。
“装潢者,书之司命也”(明·周嘉胄《装潢志》)正如装裱之于书画,好的图像处理甚至可以弥补扫描的缺陷。需要的是耐心细致的工匠精神。
国家档案局还颁布了《录音录像档案数字化规范》(DA/T62-2017),与《纸质档案数字化规范》一样在2018年1月1日开始实施。从这里我们可以看到“消灭存量”的工作正在全面加快速度。在存量档案数字化工作中,我们应当积极采用人工处理与自动化处理相结合的方式,提高数字化工作的效率,加快档案数字化工作的步伐,尽快实现“消灭存量”的目标。
(档案数字化加工管理规范)