Page 115 - 软件工程与项目管理
P. 115

第三章 计算机视觉与大数据



            蒸汽机、飞机等重大发明都是先实现功能后来才研究发现其结构原理的,计算机
            和人工智能走的路也一样。几十年来,神经网络模型一直比不过图灵模型,在学
            术界受到排挤。但有一批学者坚持不懈,终于让结构主义取得了一次初步胜利,
            神经网络模型开始显示它的威力。
                 3. 大模型的重要标志是机器涌现

                 智能在 AlphaFold 2 实现蛋白质结构预测和 GPT4 令人惊奇的功能中,机器
            猜想都发挥了关键作用,这说明大规模的机器学习神经网络已涌现出某种程度的
            认知智能,大模型的核心特征是“涌现”功能。神经科学家 Terrence Sejnowski 这

            样描述 LLM:“达到了一个阈值,就好像一个外星人突然出现,可以用一种奇
            怪的方式与我们交流。”也有人比喻大模型就像毛毛虫变成蝴蝶,幼虫代表训练
            模型的数据,蝴蝶代表着从数据中创造的 AI。大模型是否具有涌现和理解能力,
            对这个问题学术界还没有形成共识。2022 年,在一项针对自然语言处理的调查中,
            受访者被询问是否同意以下说法:根据文本训练的生成模型,在给定足够的数据

            和计算资源的情况下,能够在某种非琐碎的意义上理解自然语言。在 480 名受访
            者中,51% 同意,49% 不同意。有些学者认为,LLM 所谓的“涌现”行为是度
            量标准引起的“海市蜃楼”,一旦改变指标进行测试,所谓的“涌现”特性就会

            消失。不同学者对涌现的理解可能不同,涌现未必要看性能测试曲线上是否有突
            变的拐点。过去的人工智能做不到的事情,今天的大模型可以做到,从宏观上看
            就是涌现了一些意想不到的新功能,如机器翻译、计算机生成文艺作品、新材料
            的发现、全自动设计 CPU 芯片等。可以说,大模型已经具有一定的理解和创造
            能力。

                 冯·诺伊曼的遗作《自复制自动机理论》指出,自动机理论的核心概念在
            于复杂性,超复杂的系统会涌现出新的原理。他提出了一个重要的概念——复杂
            度阈值。突破了复杂度阈值的系统,因在数据层的扩散和变异作用而不断进化,

            从而可以做很困难的事情。现在的神经网络模型有成千上万亿个参数,可能已接
            近冯·诺伊曼讲的复杂度阈值。复杂度阈值并不等于模型的规模,智能也不等同
            于复杂性。需要深入研究如何准确定义和测量复杂性、智能与复杂性是什么关系
            以及如何理解和预测涌现行为。机器理解不同于人的理解。机器翻译可以不懂语
            义,AI 天气预报可以不懂气象理论,这可能是一种新颖的“理解”形式,一种

            能够实现预测的理解形式。我们需要开发新的基准和探索方法,以深入了解不同


                                                                                    105
                                                                                    105
   110   111   112   113   114   115   116   117   118   119   120