Page 43 - 大数据时代计算机信息处理技术研究
P. 43
第二章 大数据时代计算机信息处理存在的问题及优化
容准确度进行鉴证。
(2)数据分类
档案管理内容众多,从业者先要根据类型不同进行档案数据分类,但传统人
工分类方式需要花费诸多人力与时间,且出错率较高,工作效率较低。在计算机
技术应用后,可创建决策树算法,依据特定规则开展数据分类和整理,便可在短
期内高效完成档案分类工作,促进工作效率提升。在计算机技术应用中,以海量、
不同类数据为对象,将其整合成训练集,纳入未分类档案中,将带有不同属性的
档案分类整理后连接起来。此举可帮助借阅者更快找到所需内容,准确调取。在
借阅者调取任意档案内容后,还会自动弹出与之相关的推荐内容,也就是类似的
档案集,达到智能信息推荐的目的。上述数据分类可帮助用户尽快找到自己所需
信息,不但节约了时间,还可提高效率,促进档案价值的充分发挥。
(3)数据传输
在大数据基础上,计算机挖掘技术不但可用于数据挖掘,还可使传输中常见
的不统一、不完整等问题得以解决,通过创建统一的数据信息网,可使档案馆内
信息实现高速传输,确保全国各地用户都可在登录该档案馆平台后,随时随地调
取所需信息,真正实现了档案数据互联互通,使信息调取更加轻松自如,数据应
用更加便捷高效。此环节是在决策树结构的支持下开展,该结构是根据不同指令
要求的箭头,为数据传输指明方向,用户在输入所需查询信息的关键词后,在关
键词的引导下可使档案管理资源传输到相应地点。
(4)数据检索
该环节的主要流程如下:首先,创建数据库,将档案资源汇总到数据库内;
其次,由档案管理者检索所需调取的信息,并寻找最终答案,依靠相应数据分析
计算,将搜索结果按照使用频率排列;最后实施针对性的挖掘、归纳、整理,选
出与调取需求相符合的数据。还可采用遗传性检索方式,将其与大数据技术结合
起来,使档案信息得到精准获取。在实际应用中,将遗传性数据特征作为筛选条
件,明确资料的差异性,在大数据遗传算法的支持下,使档案数据得到科学管控
和有效开发,做到长期稳定信息检索,且可随时升级使用。
3. 应用效果
在大数据视域下,计算机应用技术引入档案管理后,使档案馆的信息管理效
率明显提升,档案调取过程更加顺畅,支持档案资源的高速重复调取,能够更加
·35·

