Page 137 - 档案统计管理工作创新理论与应用
P. 137
第五章 档案的检索与利用
库建设应当以档案目录数字化为首要任务,然后逐步扩展到档案正本的数字化。
在全文数字化的过程中,档案馆应当根据利用频率和档案的重要程度,递进
式进行全文数字化。先完成利用频率非常高的婚姻档案、退伍军人档案和改制国
有企业的离退休人员档案;先完成民国时期、明清时期的重点档案。
(二)整合资源,增加民生档案的比例
目前,地方档案馆主要职责为存储政府机构的公文资料,对社保、婚姻、拆
迁、房产、计生、环境、林权等民生档案的收集相对薄弱,大多散存于各职能部
门。而与之相对的是现今民众日益觉醒的档案维权需求,实际工作中,因为历史
民生档案的不完备和分散存储,给民众维护自己合法权益带来了许多不便。而民
众个人查档受交通条件制约,也对快速确定档案位置形成了强烈诉求。因此,地
方档案馆在现有条件允许下,不妨尝试增加民生档案种类,并在资料存储中有意
识选择数字化形式,减少馆藏数字化工程量。
(三)根据载体,改善检索方式
随着时代的变迁,档案载体目前已多样化发展,常见的载体有纸张、照片、
胶片、磁带、光碟、软盘等。然而,在目前的技术背景下,文字是最主要的检索
手段,图像和多媒体文件检索往往通过详细的文字描述检索实现,因此,档案馆
应加强对多媒体档案目录的建设,早日实现真正意义上的多媒体检索。例如,在
音视频中做到帧检索、帧定位、帧播放,结合语音检索、图像检索等先进技术,
直接可以检索并定位音视频中的语音内容,或根据某个图片检索出音视频中的响
应人像或物体。同时,及时对特殊载体进行复制更新,如软盘、录像带等载体,
必须及时转录为符合现代技术水平的多媒体资料,以免因硬件淘汰而造成的档案
丢失。
(四)针对实际,开发模糊搜索功能
在检索实践中,查阅人往往存在信息要素的不确定现象,库中存有档案却无
法检出的情况屡屡发生。因此,当利用者输入关键词但没有得到所需结果时,系
统需要进行相应的模糊搜索,提供主题近似的内容或者检索词。同时,尽量兼顾
发文方、文号、关键词、日期、类别等多种信息进行搜索筛选,以改善查询结果,
缩小甄别的范围。这一点,可以面向网络搜索引擎寻求经验。
对电子档案地再应用,主要包括两部分:一是浏览扫描的档案内容,二是对
扫描的档案图像识别后,再利用识别后的文本文字。一般如果需要文本,必须画
123

