Page 139 - 档案学理论发展与创新
P. 139
第四章 新时期档案信息管理工作要点
源、城乡社会记忆信息资源以及档案馆楼宇管理信息资源等海量异构数据进行管
理,这些海量异构数据呈现出急剧增长的趋势,分布范围与领域也愈发广泛。人
工智能在信息检索领域的应用可以使传统的档案信息收集转变为智能的档案信息
检索收集,通过对人类处理数据的思维过程进行模拟,实现海量数据中的智能检
索、推理以及表达,为后续操作提供便利,提高效率。目前,在档案管理工作中,
已经由以往的纸质档案逐步转变为电子档案,并提出了纸质与电子两种档案并行
的制度,这对档案管理工作来说无疑是多了份保障。电子档案信息主要分为文本
类、多媒体类以及数据类等类型。在档案管理工作过程中,可以运用自然语言处
理、模式识别等人工智能技术,对各种电子档案信息进行智能分类处理。文本分
类属于自然语言处理技术范畴,其工作原理主要是通过已经被标注过的文本样本
集合,找到文本属性及其类别两者之间的联系,并通过智能化学习对新文本的类
别进行判断。一种是档案管理工作人员可以通过提前设定好的档案具体分类方法,
智能区分开数据库中文本类电子信息档案的类别;另一种是其可以对网络上存在
的文本类电子信息档案进行智能分类。针对多媒体类的电子档案信息,可以通过
图像、语音以及视频等识别技术来进行智能识别及分类。电子档案信息资源数量
越来越庞大,且种类繁多,致使传统信息检索的不足之处越发被凸显出来,尤其
是检索效率低,无法满足当前档案管理工作的需求,而采用智能检索技术则可以
解决这一问题。与传统信息检索相比,智能检索可以根据用户所输入的关键词,
检索出与之关联性较强的结果,并对检索出的结果按照相关联程度进行排序,这
样可以使用户更加快速地获取到所需信息。智能检索除了检索文本之外,还可以
检索图像、音频以及视频等信息资源,例如需要对文档进行查找时,可以输入相
关语言,人工智能技术会将语音自动转换成文字。其还在档案管理系统当中提供
模糊音识别功能,让搜索更加便利。另外,图片识别也拥有着较大的应用优势,
尤其是对那些时间跨度大且不是非常完整的信息,只要将相关图片输入就可以进
行搜索,从而能够获取到与其内容较为接近的档案信息。随着互联网的迅猛发展,
会有越来越多的多媒体类电子档案信息出现,智能检索将发挥更大的作用。
2. 智能分类与挖掘档案信息
在智能分类档案信息的过程中,智慧档案馆可以按照不同的档案介质运用相
应的关键技术对其进行智能分类。文本档案,运用自然语言处理中的文本分类和
聚类系统,提取关键词标注分类;照片档案,运用自然语言处理中的深度学习技
-127-

