Page 139 - 基于大数据的英语翻译精准教学及实现路径
P. 139
第三章 大数据技术在翻译教学中的应用
据进行有效连接,从而实现对实时数据、结构化数据和非结构化数据的采集、融
合和存储;二是,科学运用分布式存储系统,例如 HBase 和 HDFS 分布式系统,
实现对各类数据的存储,提高查询和管理功能;三是,根据分析、管理和应用的
需求,提供图式计算、实时计算等算法,实现对大量数据的采集、挖掘、分析和
应用;四是,根据学校的教育教学的决策需求和发展需求,提供相应的数据分析
法、数据计算法和挖掘模型等。
1. 数据采集层
教育数据一般包括与教学、科研、就业等相关的业务管理数据和教学过程中
产生的教学视频、图画、文档等数据以及教学和学习过程中产生的实时行为数据。
教育大数据平台在采集数据的过程中,一般采集各业务管理系统中产生的数据和
实时行为数据这两种。其中在采集业务管理系统中产生的数据时,一般通过批量
导入、公开接口处理和直接读取数据库记录的方式来实现;在采集实时数据的时
候是依靠 Agent 技术才得以实现;对于图像、音频等数据采集是通过图像识别技
术来实现的。
2. 数据存储层
数据存储层是在 Hadoop 技术的基础之上利用服务器硬件和 Hadoop 分布式
计算框架而构建的能提供 Hive,HBase 等大数据服务,同时还能完成高吞吐、高
容错和高可靠的数据分析挖掘任务,并具有高扩展性和高可靠性的分布式系统。
它可以满足和实现不同的存储方式和数据结构的教育大数据的采集和存储要求,
从而为数据挖掘层提供有效的基础保障。
3. 数据挖掘层
数据挖掘层主要是对教学管理进行分析、挖掘和应用,具体包括的内容有学
生行为分析、学习分析、专业分析、教学分析和科研分析等。主要涉及的技术有
以下两个方面:第一,根据新的数据挖掘需求,设计出新型的挖掘模型;第二,
利用数据挖掘的功能,对教育大数据在应用过程中遇到的主要问题进行有效地
解决。
4. 应用层
对数据进行分析和挖掘就是为了发现数据的应用价值,而应用价值只有在实
际的应用过程中才能充分体现出来。从学生角度来讲,通过对学生的知识掌握情
况、心理状况、学习和生活状况以及综合素质等数据进行深度的分析和挖掘,可
131

