Page 111 - 软件工程与项目管理
P. 111

第三章 计算机视觉与大数据



            但是,客观世界本质上具有不确定性。从根本上讲,解决很多复杂问题的关键在
            于消除不确定性,只能用数据来消除不确定性。例如,大气物理学已经有很多理
            论,有很多精确的偏微分方程,但天气预报的效果始终不尽如人意。华为的盘古
            和 Deep Mind 的 Graph Cast,通过理解海量气候数据中的复杂模式来进行预测,
            不是通过物理方程的计算来预报天气,其预报精度和速度都超过传统的数值天气

            预报。这一事实表明,数据是人类认识复杂世界的基本途径。
                 2. 以数据为中心,还是以模型为中心
                 在人工智能发展历程中,数据和模型哪一个更重要,这个问题一直存在争议。

            这两年大语言模型发展势头很猛,争议也更加激烈。谷歌大脑的创始人吴恩达认
            为,在过去十年中,人工智能最大的转变是向深度学习的转变,神经网络架构问
            题已经基本解决,今后十年会转向以数据为中心。现在更有效的方法是固定神经
            网络架构,寻找改善数据的方法。以数据为中心的 AI 是一门对成功构建 AI 系统
            所需的数据进行系统工程的学科。对于许多实际应用来说,拥有 50 个精心设计

            的样本就足以向神经网络解释你想让它学习什么,比如缺陷检查系统。在许多根
            本不存在巨大数据集的行业中,必须将重点从大数据转移到好数据。
                 图灵奖得主杨立昆(leCun)的看法则完全不同,他认为大多数人类知识与

            语言无关,基于自监督的语言模型无法获得关于真实世界的知识,这些模型在本
            质上是不可控的。我们需要学习一个具备常识推理与预测能力的世界模型,而世
            界模型是 AI 大模型未来最理想的道路。很显然,杨立昆的观点是重点发展新的
            模型,而不是在数据上下功夫。对技术发展方向的选择不完全是一种学术判断,
            甚至代表了一种信仰。当神经网络模型受到学术界普遍排斥的时候,Hilton 等一

            批学者毫不动摇,坚信神经网络模型与人脑有一定的相似性。正是因为这一份信
            仰,神经网络才得以大翻身。在神经网络模型取得巨大成功的今天,科技界对大
            模型的前途仍然存在两种针锋相对的预判。以 Open AI 公司为代表的一方认为,

            只要扩大模型和数据的规模、增加算力,未来的大模型很可能会涌现出目前没有
            的新功能,呈现更好的通用性。另一种观点认为,目前的大语言模型不可能实现
            通用人工智能,必须研究新的智能模型和通用 AI 技术。
                 许多学者对 ChatGPT 等大模型的规模与性能的关系做了研究。一方面,要
            提高 LLM 的性能,数据量、模型参数和计算量都要数量级地同步提升。也就是

            说,目前 LLM 的代价很高。另一方面,究竟多大的模型是必需的,对于这一问


                                                                                    101
                                                                                    101
   106   107   108   109   110   111   112   113   114   115   116