Page 30 - 基于大数据的英语翻译精准教学及实现路径
P. 30
基于大数据的英语翻译精准教学及实现路径
Accurate English Translation Teaching and Implementation Path Based on Big Data
3. 突出数据挖掘技术的知识发现模式
大数据作为一种新兴研究范式在教育领域得以推广应用,在某种层面上也
是统计学中“大数定律”(又称“伯努利大数定律”)科学性的反映,即在随机
事件的大量重复中事物会呈现出必然规律,由此通过分析足够多的随机数据来探
寻教育规律成为教育大数据研究的基本原理。大数据研究的核心技术是数据挖掘
(Data Mining)或数据库知识发现(Knowledge Discovery in Database)。人们通
过机器学习、学习分析、聚类分析、社会网络分析等能挖掘出教育关键特质,发
现现象背后隐藏的教育规律,从而达到知识发现的目的。较之以文本分析、内容
分析、问卷调查、访谈和行动研究等探寻知识机理的传统教育研究,数据挖掘是
大数据时代获取知识的重要手段。一方面,大数据能为教育研究提供众多工具支
持。如可用 Google Sheets、EDM Workbench 等清理、组织和创建数据;用 Rapid
Miner、SPSS 等对数据集进行分析建模和模型验证;用 Tableau、D3.js 等进行可
视化的社会网络分析。另一方面,大数据提供了多样的数据挖掘技术。丰富的数
据挖掘工具实现了大数据分析技术、处理技术、分布式计算技术和可视化技术的
融合,但数据挖掘“并不过分依赖于严格的逻辑推理,而是大量采用‘黑箱’方
法和本质上是探索性的方法”,如数据分析中常用的遗传算法、神经网络、判别
分析、回归分析、决策树方法、模糊集方法等,使人们能基于趋势、时间、频率、
偶发、周期和系统变量等进行数据分析,而这些是无法通过传统线性数据分析得
出的,这就为探清隐藏数据背后的知识系统提供了支持。
大数据时代,多样的数据挖掘工具和分析技术使教育研究走向智能化,数据
成为一种基础性、可利用的再生资源。研究者能反复利用这些教育数据并进行再
开发,用数据弥合教育大数据研究中理论假设的不足;同时人们利用数据挖掘技
术还能将现实世界转化为数字化的镜像世界,并用多种算法提取镜像世界特征,
从而达到知识发现和知识管理目的。由此可见,教育大数据研究范式表征了一种
数据和算法共同驱动的知识发现模式。较之以理论假设驱动、知识验真为主的传
统教育研究,教育大数据研究“利用统计学、机器学习等方法从掌握的数据中提
取隐含在数据背后、人们事先不知道,但存在潜在效用、能被人理解的信息和知
识”,不断发现新知识或探究新的知识结构,形成了“理解问题领域—理解数据—
数据准备—数据挖掘—评估新知识—使用新知识”的知识发现流程,挑战了传统
教育研究中“选择问题—提出假设—验证假设—得出结论”的知识验真流程,这
22

