Page 25 - 事业单位档案数字化管理与实践
P. 25

第一章  纸质档案的数字化管理



                   2. 内容分析
                   获奖项目的主题分布可以体现纸质档案数字化进程中,档案界的关注焦点与
               实践重心。分析获奖项目主题,有助于获知已经成熟的关键技术,也有助于从广度、

               深度上发掘新的内容。文章主要从国家档案局网站公布的项目研究报告、获奖单
               位或获奖者发表的学术论文、出版的专著中获知这些项目的具体情况。结合各类
               纸质档案数字化技术与获奖项目主题,将这些获奖成果分为“数字化加工”“数
               据库建设”“数字化成果安全与长期保存”“数字档案馆”和“其他”五大类。

                   第一,关于数字化加工方面的技术研究。数字化加工技术覆盖图像的采集、
               处理还有文字识别等。2001 年以来关于数字化加工的获奖项目有 17 项,占总数
               的 20%。从具体内容上看,由于数字化流程是数字化工作的主体部分,在数字化
               开展前期受到档案部门的重点关注。一开始主要围绕数字化转换的设备、图像的

               存储格式、图像处理软件等方面展开,力求保证数字化加工的质量。例如在本世
               纪初,第二历史档案馆在数字化时,自行研发了扫描、质检和统计软件,以适应
               民国档案数字化的特殊需求。而后,随着档案数字化加工的深入和数字档案检索
               需求,档案部门开始寻求如何有效识别已扫描的数字图像,甚至是特殊类型档案

               的识别。第一历史档案馆与科技企业合作,先后研发了明清档案和满文档案的图
               像识别软件,大大提高了检索查全和查准率。此外,在档案数字化任务量大、时
               间紧的情况下,如何优化加工流程,提高效率也是难点之一。广东省档案局研发
               了免于拆卷的数字化设备,兼具提高效率和保护纸质档案原件两项优势。

                   第二,关于数据库方面的技术研究。经统计,2001 年以来此类项目共有 13
               获奖,占总数的 15%。纸质档案数字化总是伴随着档案数据库的建设,建成目录
               和全文数据库,集中存储、管理和利用数字档案信息,也是档案数字化的重要目
               标之一。一开始由于技术、经费等各方面因素限制,档案部门一般都先建立目录

               数据库。这方面的研究体现在研究目录数据库的结构设计、目录数据的标准和一
               些特殊类型档案著录系统的开发。得益于信息技术大发展和档案部门对数字化工
               作的日益重视,不少档案部门开始探索建立全文数据库,建立目录数据和图像数
               据之间的关联关系。数据库建成后如何完善信息整合与信息检索、如何实现数字

               档案资源的有效利用和共享也是关注的热点问题。
                   第三,数字化成果存储与安全方面的技术,这方面的获奖项目共有 24 项,
               占比为 28%。多年的纸质档案数字化工作积累了大量数字化副本,它们相对传统



                                                                                    ·17·
   20   21   22   23   24   25   26   27   28   29   30