Page 205 - 电子工程中智能化技术运用
P. 205
第五章 电子工程技术与应用
等众多改进版相继提出,以至于出现了 X-of-Thought 的广义思维链的概念,用于
增强思维链推理过程,通过添加验证、问题分解、利用外部知识、投票和排名等
提高推理效率。例如,通过分解大语言模型推理的中间步骤,验证其中错误,结
合在线检索和事实核查等技术进行错误纠正以优化推理结果,这种类似于人类思
维过程的方法被称作自我一致性(Self-consistency)方法。此外,对于大语言模
型其他方面的技术进展,还包括拓展上下文窗口、多语种微调优化、大语言模型
能力多样化评估等。
3. 大语言模型应用
虽然 ChatGPT 以来大模型的研发热度高涨,但落地应用仍然是大模型当前
面临的重要问题,这与其研发投入并不匹配。大语言模型最直接的应用是生成式
问答,但由于大模型推动的自然语言处理研究范式的变化,许多传统任务如信息
抽取、智能写作、机器翻译、文档摘要等也朝向大模型驱动的范式发展。本节从
智能问答、信息抽取和智能写作三个方面展开介绍。
(1)智能问答
大模型应用方面进展明显的是智能问答,比如训练领域大模型用于领域问答,
以及结合本地知识库、知识图谱、检索等纳入外部知识的方式进行问答,典型项
目如 LangChain,更加适用于面向领域化应用的知识密集型问答任务。业界目前
的研究经验表明,结合本地知识库检索的大模型问答,仍然是大模型领域化落地
的最直接有效的途径。由于大模型知识的局限性和幻觉问题以及用户对自身数据
安全性的考虑,通用的基础大模型通常无法满足实际的业务需求。检索增强生成
(Retrieval Augmented Generation,RAG)技术通过检索获取相关的知识,将其
融入提本(Prompt),使大模型通过参考上下文的知识给出合理回答。RAG 的
工作原理可以理解为“检索 + 生成”,前者主要利用向量数据库的高效存储和检
索能力,通过融合相似性检索和全文检索等多种检索方式,召回问题相关的目标
知识;后者则利用大模型的能力和 Prompt 工程,将检索召回的知识作为上下文
提供给大模型,生成最终答案。
(2)信息抽取
信息抽取是自然语言处理中一个非常传统且应用广泛的任务,主要包括实体、
事件、关系等信息要素的抽取,用于结构化处理和查询分析等场景。在预训练模
型时代,要达到较高的信息抽取准确率一般需要先标注数以万计的高质量数据,
193

