研究者用ChatGPT证明数学定理，3年内AI会赶超数学家？

更新时间：2024-06-11 09:06作者：小乐

·越来越多的数学研究人员正在关注人工智能对该领域的影响，在各种研讨会上进行辩论，并使用不同的人工智能工具来尝试回答数学问题。

·数学是机器学习能做什么或不能做什么的试金石。推理是数学过程的本质，也是机器学习中尚未解决的关键问题。神经网络以某种方式直观地辨别数学真理，但逻辑上的“为什么”却远不那么明显。

加州理工学院和麻省理工学院的研究人员发表论文，使用大型语言模型来证明数学定理。

近年来，人工智能似乎在数学领域取得了进展，尽管大型语言模型最初被认为并不特别适合数学推理。

上周，NVIDIA数学家Jim Fan转发了加州理工学院和麻省理工学院研究人员使用ChatGPT证明数学定理的论文，称数学中的AI Copilot（副驾驶）时代已经到来，人工智能将能够发现数学定理将来。本文构建了基于大语言模型的定理证明器，为解决大语言模型错觉的缺点开辟了新途径。

日前，数学家、菲尔兹奖得主陶哲轩表示，他最近在解决数学问题时“使用了GPT-4”。 “它为我提供了问题的最终解决方案。接下来我只需要继续计算即可。”就是这样。”为了给更多研究人员提供参考，他发布了自己与GPT-4的聊天记录。

如今，越来越多的数学研究者开始关注人工智能对该领域的影响。他们在各种研讨会上进行辩论，并使用不同的人工智能工具来尝试回答数学问题。根据《纽约时报》最近对一些数学家的采访，他们正在努力应对人工智能的最新变革力量。数千年来，数学家已经适应了逻辑和推理的最新进展。他们准备好迎接人工智能了吗？

数学家和计算机科学家齐聚一堂

两千多年来，数学家欧几里得的著作一直是数学论证和推理的典范。卡内基梅隆大学逻辑学家杰里米·阿维加德在接受采访时表示：“众所周知，欧几里得学派是从近乎诗意的‘定义’开始的。” “然后，他当时的数学就建立在这个基础上，使用基本概念、定义和先验定理来证明事物，使得后续的每一步都‘清楚地遵循’前一步。”阿维加德说，有些人抱怨欧几里得。一些“明显”的步骤并不明显，但系统仍然有效。

但到了20 世纪，数学家不再愿意将数学建立在这种直观的几何基础上。相反，他们开发了正式系统—— 个精确的符号表示、机械规则。最终，这种形式化使数学能够转化为计算机代码。 1976 年，四色定理（指出四种颜色足以填充地图，因此没有两个相邻区域具有相同的颜色）成为第一个通过计算证明的主要定理。

现在，人工智能来了。 2019 年，曾经在谷歌工作、现在在湾区一家初创公司工作的计算机科学家Christian Szegedy 预测，计算机系统将在10 年内赶上或超过人类最优秀数学家解决问题的能力。去年他将目标年份修改为2026年。

普林斯顿高等研究院数学家、2018 年菲尔兹奖获得者阿克谢·文卡特什(Akshay Venkatesh) 目前对使用人工智能不感兴趣，但他热衷于谈论它。 “我希望我的学生意识到他们所处的领域将会发生很大的变化，”他在去年的一次采访中说道。最近，他补充道：“我并不反对深思熟虑、有意地使用技术来支持我们人类的理解。但我坚信，注意我们如何使用它是至关重要的。”

今年2月，Avigard参加了在加州大学洛杉矶分校纯粹与应用数学研究所举办的“机器辅助证明”研讨会。这次聚会吸引了一群不同寻常的数学家和计算机科学家。此次研讨会的主要组织者是陶哲轩，他曾在博客中表示，2026年人工智能将与搜索和符号数学工具相结合，成为数学研究中值得信赖的共同作者。陶指出，直到最近几年，数学家们才开始担心人工智能对数学美学和他们自己的潜在威胁，圈内成员现在正在提出这些问题并探索“打破禁忌”。

帮助解决数学问题的小工具

如今，在饮食、睡眠和锻炼方面优化人们生活的小工具很常见。 “我们喜欢给自己添加一些东西，让事情更容易完成。”人工智能小工具也可以对数学做同样的事情。

一种这样的数学小工具被称为证明助手或交互式定理证明器。数学家将证明一步步转换成代码，然后由软件程序检查推理是否正确。验证积累在库中并成为其他人可以查阅的动态参考。阿维加德说，这种“形式化”为今天的数学奠定了基础，“就像欧几里得对数学的编纂和排序的尝试为他那个时代的数学奠定了基础一样。”

最近，开源的证明辅助系统Lean备受关注。 Lean 是由计算机科学家Leonardo de Moura 开发的，他当时在微软工作，现在是亚马逊的计算机科学家。精益使用自动推理，由所谓的“老式人工智能（GOFAI）”提供支持，这是受逻辑启发的符号人工智能。到目前为止，精益社区已经验证了一个翻转球体的定理和一个有助于统一数学领域的关键定理。

但证明助手也有缺点：它经常抱怨不理解数学家输入的定义、公理或推理步骤，因此它被戏称为“证明抱怨者”。福特汉姆大学数学家希瑟·麦克白(Heather Macbeth) 表示，所有这些抱怨都让研究变得麻烦，但提供逐行反馈的能力也使该系统对教学有用。

今年春天，麦克白设计了一门“双语”课程：她把黑板上提出的每一个问题都翻译成讲义中的精益代码，学生用精益和常规语言提交作业答案。 “这给了他们信心，”麦克白说，因为他们会立即收到关于证明何时完成以及每一步是对还是错的反馈。

自从参加洛杉矶研讨会以来，约翰·霍普金斯大学数学家艾米丽·里尔(Emily Riehl) 使用实验证明助理来形式化她之前与合著者发表的证明。验证结束时，她说：“我对这个证明的理解确实非常深刻，比我以前理解的要深刻得多。”

约翰霍普金斯大学的数学家艾米丽·莱尔（Emily Leal）一直在使用实验证明助理程序。

卡内基梅隆大学计算机科学家、亚马逊学者Marijn Heule 使用另一种自动推理工具，他称之为“强力推理”，或者更专业地说，是一种可满足性问题解决器。他说，只要编写精心编写的代码来说明您想要找到哪个“奇异物体”，超级计算机网络就会“搅动”搜索空间并确定该实体是否存在。

还有一组使用机器学习的工具，可以合成大量数据并检测模式，但不擅长逻辑、逐步推理。谷歌的DeepMind 设计了机器学习算法来解决蛋白质折叠和国际象棋获胜等问题。在《自然》杂志上的一篇2021 年论文中，一个团队将他们的成果描述为“通过人工智能引导人类直觉取得进步”。数学的发展”。

前谷歌计算机科学家、现在在湾区创业的宇怀“托尼”吴概述了一个更雄心勃勃的机器学习目标。在谷歌，吴探索了支持聊天机器人的大型语言模型如何帮助数学。该团队使用的模型是根据互联网数据进行训练的，然后使用大型数据集（例如数学和科学论文的在线档案）进行微调。吴在研讨会上说，当被要求用日常语言解决数学问题时，名为Minerva 的专业聊天机器人“非常擅长模仿人类”。该模型在高中数学测试中取得了比普通16 岁学生更好的成绩。吴说，他设想一名“自动化数学家”最终拥有“自己解决数学定理的能力”。

计算机科学家Yuhuai “Tony” Wu 设想了一个“自动化数学家”—— 通用研究助理，具有“自行解决数学定理的能力”。

数学是试金石

数学家们对这些颠覆性创新给予了不同程度的关注。

哥伦比亚大学的迈克尔·哈里斯表示怀疑，他因学习数学和国防工业之间潜在的目标和价值观冲突而感到困扰。在最近的一份时事通讯中，他指出，在美国国家科学院组织的——“人工智能辅助数学推理”研讨会上，其中一位演讲者是博思艾伦咨询公司的代表，博思艾伦咨询公司是一家为情报机构和军方承包商提供服务的咨询公司。哈里斯希望能够有更多关于人工智能对数学研究的影响的讨论。

DeepMind 合作者、悉尼大学的Geordie Williamson 在美国国家科学院聚会上发表讲话，鼓励数学家和计算机科学家更多地参与此类对话。在洛杉矶的研讨会上，他引用了改编自乔治·奥威尔1945 年文章《你和原子弹》的一段话开始演讲。威廉姆森说：“鉴于我们所有人都可能在未来五年内受到深刻影响，深度学习并没有像预期的那样产生那么多讨论。”他将数学视为机器学习能做什么或不能做什么的试金石。推理是数学过程的本质，也是机器学习中尚未解决的关键问题。

威廉姆森在接受采访时表示，在他与DeepMind 合作的早期，该团队发现了一个简单的神经网络，可以预测他非常关心的数学量，而且它的预测“准确得离谱”。威廉姆森很难理解其中的原因，但无法理解，DeepMind 的其他人也无法理解，而这将成为定理的基础。与欧几里得一样，神经网络以某种方式直观地辨别数学真理，但逻辑上的“原因”却远不那么明显。

在洛杉矶研讨会上，一个突出的主题是如何将直觉和逻辑结合起来。但威廉姆森观察到，人们没有动力去理解机器学习的黑匣子。 “这是科技领域的黑客文化，如果它在大部分时间都有效，那就太好了，”他说。但这种情况让数学家们并不满意。

他补充说，试图了解神经网络内部发生的事情会引发“令人着迷的数学问题”，而寻找答案为数学家提供了“为世界做出有意义的贡献”的机会。

上一篇：阿多诺式《塞尔达传说》，特斯拉文斯基式林克

下一篇：女白领为美步入诊所，却从此人间蒸发，近1年后残忍真相才被揭开

加载中...

美国留学

研究者用ChatGPT证明数学定理，3年内AI会赶超数学家？

为您推荐

世界上最美的方程（世界上最美的衣服）

亿万富翁布隆伯格为何复制不了特朗普的成功？，布隆伯格资产

20所「吃住最糟糕」的美国大学！不管怎么骂，条件永远那么差……

阿多诺式《塞尔达传说》，特斯拉文斯基式林克

女白领为美步入诊所，却从此人间蒸发，近1年后残忍真相才被揭开

佛罗里达州立大学，中国学生最青睐的留学院校

热门文章

热门推荐

最新文章