Page 25 - 事业单位档案数字化管理与实践
P. 25
第一章 纸质档案的数字化管理
2. 内容分析
获奖项目的主题分布可以体现纸质档案数字化进程中,档案界的关注焦点与
实践重心。分析获奖项目主题,有助于获知已经成熟的关键技术,也有助于从广度、
深度上发掘新的内容。文章主要从国家档案局网站公布的项目研究报告、获奖单
位或获奖者发表的学术论文、出版的专著中获知这些项目的具体情况。结合各类
纸质档案数字化技术与获奖项目主题,将这些获奖成果分为“数字化加工”“数
据库建设”“数字化成果安全与长期保存”“数字档案馆”和“其他”五大类。
第一,关于数字化加工方面的技术研究。数字化加工技术覆盖图像的采集、
处理还有文字识别等。2001 年以来关于数字化加工的获奖项目有 17 项,占总数
的 20%。从具体内容上看,由于数字化流程是数字化工作的主体部分,在数字化
开展前期受到档案部门的重点关注。一开始主要围绕数字化转换的设备、图像的
存储格式、图像处理软件等方面展开,力求保证数字化加工的质量。例如在本世
纪初,第二历史档案馆在数字化时,自行研发了扫描、质检和统计软件,以适应
民国档案数字化的特殊需求。而后,随着档案数字化加工的深入和数字档案检索
需求,档案部门开始寻求如何有效识别已扫描的数字图像,甚至是特殊类型档案
的识别。第一历史档案馆与科技企业合作,先后研发了明清档案和满文档案的图
像识别软件,大大提高了检索查全和查准率。此外,在档案数字化任务量大、时
间紧的情况下,如何优化加工流程,提高效率也是难点之一。广东省档案局研发
了免于拆卷的数字化设备,兼具提高效率和保护纸质档案原件两项优势。
第二,关于数据库方面的技术研究。经统计,2001 年以来此类项目共有 13
获奖,占总数的 15%。纸质档案数字化总是伴随着档案数据库的建设,建成目录
和全文数据库,集中存储、管理和利用数字档案信息,也是档案数字化的重要目
标之一。一开始由于技术、经费等各方面因素限制,档案部门一般都先建立目录
数据库。这方面的研究体现在研究目录数据库的结构设计、目录数据的标准和一
些特殊类型档案著录系统的开发。得益于信息技术大发展和档案部门对数字化工
作的日益重视,不少档案部门开始探索建立全文数据库,建立目录数据和图像数
据之间的关联关系。数据库建成后如何完善信息整合与信息检索、如何实现数字
档案资源的有效利用和共享也是关注的热点问题。
第三,数字化成果存储与安全方面的技术,这方面的获奖项目共有 24 项,
占比为 28%。多年的纸质档案数字化工作积累了大量数字化副本,它们相对传统
·17·

