Page 11 - 事业单位档案数字化管理与实践
P. 11

第一章  纸质档案的数字化管理



               制件光学字符识别(OCR)工作规范》中,将这种数字图像定义为“纸质档案数
               字复制件”。鉴于现有文献资料中大多数依然使用的是“副本”,此处也暂时沿
               袭这一说法。相较副本,数字化成果的范围更广,除了数字图像还包括目录数据、

               元数据、OCR 识别后的文本数据、数字化过程中产生的其他文件等。
                   关于数字档案、电子档案的概念,数字档案和档案数字化副本的关系,学界
               和业界并没有统一说法。大多数学者认为数字档案包括档案数字化副本。例如行
               业标准《数字档案 COM 和 COLD 技术规范》将其定义为“以数字形式存在的档

               案信息资源”,认为其外延涵盖档案数字化副本和电子档案。还有相似观点认为
               数字档案就是指数字档案馆中的所有数字资源,包括电子档案、档案数字化副本
               和数字信息资料。另一方面,也有学者认为两者不存在包含关系,认为数字档案
               仅指那些通过计算机等电子设备直接形成的历史记录。这种观点将数字档案的产

               生过程与数字化过程分开,数字档案的概念更接近电子文件直接归档保存形成的
               原生性电子档案。众多观点的共性是承认数字档案以数字形式存在。他们的区别
               在于对数字档案的种属和外延的认识不同。这里更倾向于认为数字档案是“数字
               形式的档案”,而电子档案是“计算机等设备直接形成的原生性历史记录”,数

               字档案包括电子档案。一方面,数字档案的属概念是档案,而不是资源或文件。
               “档案”概念不同于“档案信息资源”,前者有明确的载体,本质属性是原始记
               录性,具有凭证价值,而后者是脱离载体的信息,具有流动性,有时并不具备凭
               证价值。另一方面,数字档案的产生方式是计算机直接形成或通过传统载体档案

               转化形成。因此,档案数字化副本和电子档案都是数字档案的一部分,而数字格
               式的信息资源不是。

                   二、纸质档案数字化主客体分析


                   (一)纸质档案数字化客体
                   1. 纸质档案的构成与特点
                   中国各级各类档案部门所藏的档案资料浩如烟海,其中纸质档案占据了重要
               地位。这些卷帙浩繁的档案是从古至今人类生产生活的重要见证,也是历史文化

               传承的纽带,是目前档案数字化的主要对象。纸张是其载体材料,主要成分是植
               物纤维;字迹是纸质档案的记录材料,档案能否长期保存与这两者的性质密切相
               关。纸质档案具有轻薄、耐久、不易篡改等优点,但随着档案数量的增长和信息



                                                                                    ·3·
   6   7   8   9   10   11   12   13   14   15   16