Page 117 - 软件工程与项目管理
P. 117
第三章 计算机视觉与大数据
执行固定程序的观念来看待复杂系统,实际上大模型像人脑一样是个复杂系统,
其信息处理过程并不是执行固定的程序。即使是在推理阶段,由于采用概率性推
理,执行过程也存在随机性。相同的问题也可能生成不同的答案,结果必然有不
确定性。哥德尔不完备性定理表明,完备性和一致性不能同时满足。LLM 的“幻
觉”是系统不一致性的表现,泛化能力是完备性的表现。从这个角度看,“幻觉”
是由于追求泛化能力造成的。LLM 的泛化能力和“幻觉”是一个硬币的两面,我
们需要在与“幻觉”共存的环境下发展人工智能。
二、大数据应用中的数据分级管理
随着数据的增加,数据管理成为确保数据持续开发应用面临的主要阻碍,
如何有效管理数据成为关键。2022 年 7 月,国家网信办公布了对滴滴公司的行
政处罚决定书,标志着我国对数据安全的重视程度和保护力度正在持续加大。为
加大对数据安全的保护,国家相继出台了诸多法律法规,以规范数据保护,并在
《国家安全法》中提出了数据分级分类保护机制,为数据分级分类保护提供了法
律基础。在大数据应用过程中,数据分级保护的目的不仅在于规范数据保护的形
式和方法,更是通过规范数据的管理技术和水平实现数据更加高效的使用,切实
促进相关行业及个体有序使用、开发数据。
(一)数据分级管理的背景及发展趋势
1. 数据分级管理的研究趋势
大数据应用过程中的数据分级分类最早出现在 2002 年。随着计算机技术的
日益成熟,数据挖掘成为热点,随之而来的就是对于数据的分级分类概念的提出。
2006 年之后数据分级分类成为热点。2019 年之后关于数据分类的研究呈爆发式
增长,表明数据的分级分类管理已成为当下大数据发展应用的关键。
从当下数据分级分类的研究侧重点来看,注重对数据应用层面的安全、治理
以及挖掘方面的分级分类,涉及的学科较多。从相关的法律政策来看,为实现数
据的分类分级保护,中央研究制定了一系列宏观政策文件,指导建立数据配置管
理体系,健全数据要素市场,营造良好的数字生态圈。2018 年,国务院办公厅
发布了《科学数据管理办法》,明确了科学数据的分级分类。2020 年,国务院
出台了《关于构建更加完善的要素市场化配置体制机制的意见》,意见就政务数据、
企业商业秘密和个人数据在市场中的流通应用过程中的分类分级做了特别规定。
107
107

