网站首页
手机版

罗格斯大学团队提出思想链概念,提高大模型的算数推理能力

更新时间:2024-06-09 15:17作者:小乐

近日,美国罗格斯大学博士生金明宇及其团队通过引入思想链(CoT)的概念,提高了大型语言模型(LLM)在算术等复杂推理任务上的性能。推理、常识推理、符号推理等。

图片|金明玉(来源:金明玉)

CoT 的原则是通过提供推理过程的示例来教会模型处理推理,详细说明导致最终答案的每个步骤。这种提示方法可以有效教会模型不要急于完成推理过程,而是逐步解决问题。这与人类自然解决问题的方式一致,即将复杂的任务分解为更简单、更易于管理的步骤。与直接将输入映射到输出的指令跟踪模型不同,CoT 将中间推理步骤合并到导致最终输出的线索中。这种方法在涉及常识、算术和符号推理的任务中显示出显着的性能改进。 CoT 通过将复杂的推理分解为逐步的过程来促进工作流程,帮助模型按顺序解决问题的每个部分,这对于深思熟虑的推理任务至关重要。研究发现,CoT 提示对于较大的模型特别有效,当模型参数达到至少100 亿时,性能开始显着提高,在1000 亿参数时观察到最明显的好处。然而,较小的模型似乎并没有从CoT 中受益那么多,通常会产生平滑但不合逻辑的推理链,从而导致错误的结果。在研究过程中,研究团队还发现,大型模型的推理能力与推理步骤数之间存在绝对的线性关系。演示中的推理步骤越多,模型在推理或逻辑问题上的准确性就越高。这个能力可以解决一些问题,比如人们在设计提示时不注意步骤等。这种方法可以让人们更加规范地设计提示,从而改善大型模型的推理步骤。 CoT 的工作原理是将复杂的推理任务分解为更小、更易于管理的步骤,模仿人类解决问题的方式。这种分步过程对于需要详细和细致理解的任务特别有益,例如算术推理、常识推理和符号推理。它通过鼓励模型不仅得出答案,而且还显示得出该结论所采取的路径,从而提供决策过程的透明度。此外,CoT 示例中提供的模型推理能力与推理步骤数之间的线性关系是一个重要发现。这种关系表明,随着提示中推理步骤数量的增加,模型在推理或逻辑任务中的准确性也会增加。这对提示的设计方式有影响,并表明更加结构化和分步的方法可以提高法学硕士在复杂推理中的表现。然而,CoT的应用并非没有挑战。虽然它在任务性能方面提供了相当大的改进,但它需要仔细的平衡。此外,使用太多步骤使模型过载可能会使模型混乱或导致收益递减。同时,CoT 的有效性也部分取决于所提供示例的质量。推理步骤越清晰、越符合逻辑,模型就能更好地学习并将这种推理应用于新问题。而这不仅有助于更准确地解决问题,还有助于以人类可以理解的方式解释模型的推理。在研究过程中,团队还发现增加推理步骤数量可以线性提高性能。这一发现解决了该领域之前的一个问题:缺乏标准化的提示设计方法。有了CoT,人们现在有了一个框架可以为复杂的推理任务创建更有效的提示。这种增强的解决数学问题的能力可以帮助用户更好地解决数学问题。此外,CoT 可以通过允许搜索引擎理解和处理多步骤查询来增强搜索引擎的功能,从而不仅为用户提供答案,还为用户提供这些答案背后的推理。

最近,arXiv[1]上发表了一篇相关论文,标题为《推理步长对大型语言模型的影响》(The Impact of Reasoning Step Length on Large Language Models)。金明宇为第一作者,美国新泽西理工学院杜梦楠教授为通讯作者。

图|相关论文(来源:arXiv)

金明宇说:“但是我们需要了解cot 的一些基本性质,才能确认它是否能够帮助其他人的研究。目前我们对cot 的研究还不够系统,我们觉得应该给出更多的基础见解。” ”未来,研究团队计划研究大模型内部来解决这个问题,即分析LLM推理的长推理步骤和短推理步骤,以及大模型内部的神经元过程。他们的最终目标:他们希望确定较长的推理步骤是否与更广泛的神经元参与相关。因此,他们打算使用可视化技术来分析长推理和短推理之间的激活模式。参考:1.https://arxiv.org/abs/2401.04925 操作/排版:何晨龙

为您推荐

聊一聊罗格斯大学!那些你不知道的秘密?

罗格斯大学是一所著名的公立研究型大学,也是新泽西州规模最大的高等学府,主校区位于新泽西州新布朗斯维克市。该校成立于1766年,创始时称为王后学院(Queen’s College)的罗格斯大学是美国第八所高等教育学院,也是九所殖民地学院之一。

2024-06-09 15:17

亚洲学生最多的美国大学——罗格斯大学(罗格斯大学qs美国排名)

亚洲学生最多的美国大学Top10!!!No.10California State University, Fullerton地理位置:Fullerton, CA亚洲学生数量:7,483加州州立大学富尔顿分校是位于加利福尼亚州富尔顿的一所公立

2024-06-09 15:16

罗格斯大学新伯朗士威校区:高考成绩与申请建议,罗格斯大学新泽西分校

罗格斯大学新伯朗士威校区:高考成绩与申请建议1. 高考成绩与申请罗格斯大学新伯朗士威校区接受高考成绩作为申请条件之一。具体来说,学校会公布符合面试条件的高考分数标准,并在中国进行面试录取。此外,罗格斯大学还提供了几种不同的录取要求:无需托福

2024-06-09 15:16

罗德岛+藤校布朗大学,双学位本科BRDD,选课由你说了算!,罗德岛大学入学条件

布朗大学+罗德岛,有一个双学位的本科项目BRDD。我们曾经介绍过布朗大学+罗德岛的双硕项目(Brown-RISD MAster of Arts in Design Engineering)。藤校大U+艺术顶校的双硕项目,一年学制,就能同时g

2024-06-09 15:15

美国大学留学 院校:罗德岛大学(University of Rhode Island)(美国罗德岛有什么大学)

美国大学留学专家推荐官方网站:http://www.leqiaoedu.com/goods.php id=1763学校名称:罗德岛大学(University of Rhode Island)学校图片:学校概况罗德岛大学(University

2024-06-09 15:15

罗德岛设计学校相当于中国什么等级的大学?,罗德岛设计学院vs伦敦艺术

罗德岛设计学院位于美国最小的州-- 罗德岛州 (Rhode Island) 的首府普罗维登市Providence ( 50,000~ 249,999 人)。普罗维登市(Providence) 为美国艺术家聚集最多的城市,位于美国东岸,距离纽

2024-06-09 15:14

加载中...