Page 20 - 基于大数据的英语翻译精准教学及实现路径
P. 20
基于大数据的英语翻译精准教学及实现路径
Accurate English Translation Teaching and Implementation Path Based on Big Data
以上作用的发挥需要两大基础:一方面需要更加系统的语言大数据基础设施建设,
让语言大数据能够同社会经济数据联动;另一方面要进一步加强大数据立法,特
别是将语言数据纳入立法体系之中,规范语言数据的生产、使用和应用。
2. 企业等商业组织的语言治理
企业等商业组织是语言治理数据化的重要参与者和责任主体,由于大数据时
代语言数据的生产主要以社交媒体应用、互联网信息服务和 AIGC 为主,企业应
在国家数据治理的法治框架下,进一步完善具体的语言数据治理方案。与其他类
型大数据相比,语言大数据大致上是由人通过计算机中介交流(以智能手机应用
为代表)产生,负载了较多与个人有关的信息。基于语言大数据的挖掘,能够刻
画用户画像和行为模式。在法治框架下,须明确哪些语言数据是私人信息应该受
到隐私保护,哪些语言数据可以用于商业化开发和应用,未来应建立相关的行业
标准以进一步加强规范。以 ChatGPT 为代表的语言大模型未来将生成大量类似
人类自然语言的内容。其内容是否包含虚假信息?是否符合社会文化价值观?是
否能够规避历史虚无主义等价值问题?一方面要求各高科技企业在模型训练中,
强化人工标注监督和对抗机器学习,让 AI 模型能够规避特定的话语输出;另一
方面,AI 生成语言应该进行用户识别和版本限制,比如针对未成年人学生等群体,
开发教育版或设置相应权限,以避免技术不成熟对语言教育过程带来的负面影响。
3. 教育教学中的语言治理
随着 ChatGPT 等生成式人工智能的发展,未来大数据、人工智能等应用在
语言教育中将扮演重要角色。回顾语言教学技术的发展历程,大致可以分为 3 个
时期。从 20 世纪八九十年代提出的计算机辅助教学,到 2000 年前后基于信息技
术和课堂的教学模式,再到 2010 年前后以慕课为代表的翻转课堂教学模式。由
于语言具备大数据的一系列特征,大数据或将成为语言教学技术的重要创新点,
具有广阔的应用空间。
首先,在大数据和机器学习技术的加持下,语言教学或将从过去的“一对多”
向“千人千面”转变。无论是电子教材还是慕课教学,都是一套标准化内容面向
多个不同学生。教学过程中,学生产生的海量语音、语句等数据尚未内化成为教
学过程的一部分。得益于大数据技术的迭代和机器学习的特性,未来大数据加持
下的语言教学可以具备交互性,将不同学生产生的教学数据纳入大数据教学系统
中,进行模型调参,形成“千人千面”的教学内容和教学过程。由于数据的可远
12

