Page 148 - 新时期档案管理理论与实践探析
P. 148
新时期档案管理理论与实践探析
Analysis of Theory and Practice of Archives Management in the New Era
国际档案管理实践领域也对人工智能技术应用进行了探索。Codice Ratio 项
目通过利用人工智能技术和光学字符识别软件(OCR)帮助识别梵蒂冈秘密档案
馆手写卷宗中的文字。项目组成员借助拼图分割的方法,用 OCR 软件将每个单
词进行分割并自动绘制生成不同样式的拼图碎片,之后该项目组引入一群高中生
参与,主要负责对 OCR 软件生成的拼图组合进行判断,告诉软件哪些猜测是正
确的哪些是错误的,锻炼机器的学习能力。当训练到一定阶段后,软件可以独立
拼图并判断字母的位置,对手写字母的判断准确率达到 96%。澳大利亚维多利亚
公共档案馆借助 Nuixe Discovery 工具,利用基于规则的专家系统、统计模型和
深度学习等技术,对维多利亚州政府大量非结构化电子邮件进行鉴定、处置和敏
感性审查。澳大利亚政府财政部门利用微服务架构技术和关联数据技术,按照文
件处置方案对电子邮件进行分类。新南威尔士州档案馆通过文本提取、数据清洗、
文本矢量化、特征提取和分类等过程,实现对本州某一政府部门全部文件的分类
处置,准确率可达 84%。斯坦福大学图书馆研发的 ePADD 软件,通过利用自然
语言处理、自动元数据处理和机器学习等人工智能技术,能够实现对五位当代文
学人物的电子邮件的鉴定、处理和访问。但是该软件目前还不能完全识别出电子
邮件中的机密信息,需要借助人工力量进一步判断。
总的来说,在人工智能技术具体应用和实际成效方面,与其他国家相比,中
国档案管理工作中利用人工智能技术的层次不高,没有真正利用机器学习、深度
学习等人工智能核心技术解决档案管理工作中的重点和难点问题。具体体现在:
重保管而轻利用。即过于重视档案和档案库房的安全管理而忽视了档案管理工作
的重心——分类鉴定以及开发利用,因此对档案管理工作的质量和效率没有明显
的提升,也不能很好地满足档案用户的信息需求。究其原因,主要是中国档案管
理部门及人员对人工智能技术的应用范围认识不清,档案馆的电子文件管理数据
基础和软硬件设施建设有待进一步提高。在人工智能技术应用范围方面,国际档
案管理实践者通过参与并开展多个“人工智能”主题档案管理项目,正确认识到
人工智能赋能档案管理工作的核心在于帮助解决文件分类、鉴定、私密信息审查
以及提供利用等问题,借此推动档案管理实践取得实质性进展。目前,中国真正
利用人工智能技术的档案管理机构和部门较少,已有的几个也是单独探索,力量
薄弱,认识有限。在电子文件管理数据基础方面,人工智能技术的应用对数据质
量的要求比较高,一般需要被处理数据是数字化形式、被清洗、标签化并且保持
·134·

