Page 33 - 事业单位档案数字化管理与实践
P. 33

第一章  纸质档案的数字化管理



               导致目录数据库的错误率高,具体表现有:题名著录不完整、错别字较多、主题
               词不规范、著录项较少等。以数字化进展较快的北京市为例,规定了案卷目录数
               据库所需的 12 个著录项和文书档案文件目录数据库所需的 16 个著录项。但北京

               数字档案馆的查阅系统只有两个检索项,检索结果也仅能体现 5 个著录项。上海
               市的档案查询系统中虽然提供了 25 个著录项,但有内容的只占三分之一。对于
               没有目录数据库基础的数字化项目来说,由于著录的工作量大,时间紧,而加工
               人员特别是外包公司员工的专业素质不高,在著录过程中若是缺乏耐心,或是对

               著录标准理解不到位,就可能引发追求速度而随意著录、只著录少量必填项、著
               录质量不佳等现象;在已经有目录数据库基础的情况下,若是忽视了核对与整改
               环节,前期著录的错误依然存在,也会影响目录数据库的质量。
                   二是尚未实现多级著录。第十二届国际档案大会确认了现代档案著录的“马

               德里原则”,其中之一便是“反映管理层级原则”,即档案著录要反映全宗、分
               全宗、类别等多级管理层次。多级著录能够完整展现档案特征信息,揭示档案间
               存在的有机联系。这样一来,用户在检索过程中不仅能检索到所需的单份文件信
               息,也能发现与其相关的其他文件,能够帮助调整检索策略,有效提高查全率。

               例如美国国家档案馆网站上的档案目录,详细显示了文件组合、分组合、系列、
               案卷、文件 5 个层级;在检出单份文件时,也会显示其所处层级,每一层级目录
               都可以通过链接访问。
                   现行《档案著录规则》只涉及了案卷、文件级著录,实际上无法充分、详实

               地呈现档案实体的所有管理层级。从数字化工作的实践来看,大多局限在这两个
               层次。部分档案部门实现了全宗、类别、案卷、文件多个层级的著录,也建立了
               案卷、文件级别的目录数据库,但并未直接在检索系统中体现出来。据调查,在
               提供目录检索的 20 家省级档案馆网站中,大多数只能检索到单份文件,无法获

               得上一级的案卷信息。又例如第一历史档案馆,馆内的信息化管理平台有全宗到
               文件的四级目录,但并未与网站同步。这样一来,检索结果无法反映全宗、类别、
               (案卷)、文件之间的逻辑关系,也无法根据单份档案查找同类别或是案卷的其
               他档。有学者以“树木”指代案卷和文件,以“森林”指代全宗和类别,将这种

               情况描述为“只见树木,不见森林”。
                   2. 全文数字化中的质量问题
                   通过全文数字化建立档案全文数据库,是纸质档案数字化的核心内容,也是



                                                                                    ·25·
   28   29   30   31   32   33   34   35   36   37   38