Page 129 - 新时期档案管理理论与实践探析
P. 129

第四章  大数据在档案管理中的应用




             自动编研平台。档案资源共享平台能够利用大数据技术对来访用户的身份、记录
             等行为进行分析和处理,还可以分析和处理存储行为、搜索方式以及位置信息等,
             通过对这些结构化信息以及非结构化信息的分析处理,可以从中提炼出用户的隐

             性诉求。三是大数据技术可以应用在档案信息资源的服务挖掘上。档案管理中应
             用大数据信息处理技术,能够全面地实现档案信息智能检索服务、档案信息决策
             服务、档案信息定制与定题服务的目标。大数据技术还可以凭借其强大的计算功
             能,为用户利用档案资源提供及时通信的在线帮助和智能数字档案馆等交互功能。

             这样一来,不但加强了档案知识交流中心的功能,而且还给用户提供了非常现代
             化的服务体验。

                 一、数据挖掘技术在档案管理中具体应用


                 (一)档案信息的收集
                 数据挖掘的第一步工作就是先要对相关的档案库中的数据信息给予分析,以
             打造出全新的描述方法,去描述已知的数据集合的类型或者说是建立其有关概念
             模型,紧接着按照模型和需要测试的样本对象作对比测试,假如某个模型几经测

             试最终获得较高的准确性,那么则可以把这个模型作为标准,对各种对象进行合
             理分类,所以说信息收集步骤是基础,是档案的其他个性化功能实现的前提。例
             如,档案管理者在网上向使用者发布了相关调查问卷,而且将问卷输入数据库。
             档案数据库应该有使用者个人信息,如姓名、学历等基本情况的描述。一旦有新

             用户的信息输入数据库里,则程序自动会对新用户的档案情况及未来的可能需求
             情况给予分类,以此来确定给用户提供哪种需要的服务。因此,档案信息的收集
             是为档案的分类、预测等个性化服务提供基础的。
                 (二)档案的分类与预测

                 数字挖掘技术的分类分析方法,主要是运用挖掘系统数据库里有关于属性分
             析功能把对象总体地区分成各种类别的工作过程。具体流程为:在存在不同特征
             的一群数据中选出已经分好类的训练集,在该训练集上运用数据挖掘分类的技术,
             建立分类模型,对于没有分类的数据进行分类。数字挖掘分类技术运用到档案管

             理中,可以做到从用户信息中,提取出最原始的查询信息,并分类总结使用者的
             特点。例如,使用者通过网页访问我们的档案馆,那么该技术就会自动保留使用
             者的访问情况,并结合使用者的身份信息与其搜索的情况综合进行分类。使用者



                                                                                 ·115·
   124   125   126   127   128   129   130   131   132   133   134