Claude给出“巧妙简洁”证明,AI数学能力内卷已偏离实用边界

Anthropic工程师Sholto Douglas近日披露,其大语言模型Claude Mythos在无额外引导下,独立完成了对Erdős单位距离猜想的证明,并输出了一份被其团队评价为“巧妙而简洁”的推理过程。该猜想由著名数学家Paul Erdős于1946年提出,困扰学界逾七十年,直到今年初才由OpenAI的研究系统首次给出计算机辅助证明。如今,Claude在极短时间内实现了更精简的解法,直接引发“AI在数学发现领域已严重超前”的行业讨论。

从技术细节看,Claude Mythos的证明并非简单复制OpenAI版本。据Douglas描述,模型在推理中避免了大量冗长枚举,转而采用了一种基于几何代数对称性的新颖框架,将原本需要数百行演算的逻辑压缩为不足五十步。这种“重构式创新”与人类数学家的思维方式高度相似——不依赖暴力搜索,而是通过发现深层结构来简化问题。值得注意的是,Claude并未针对该猜想进行过专门训练,其知识储备完全来自通用预训练数据。这一现象暗示,当前大规模语言模型在逻辑链组合与符号推理上可能已经越过了一个关键阈值:它们开始能够“重新发现”数学中的简洁之美,而不仅仅是复述已知解法。

将视角拉回行业竞争,这场“证明竞赛”揭示了一个更深层趋势。OpenAI与Anthropic几乎在同一时间点攻克同一难题,且后者的解法质量更高,说明AI的数学能力已不再是个别实验室的独门优势,而是快速扩散为通用能力储备。但问题随之而来:当两个AI都能比人类更快地给出Erdős猜想证明时,行业是否应该继续将“解更难数学题”作为能力标杆?从实用角度看,数学研究不仅需要证明存在性,更关注证明能否转化为可理解的知识结构。Claude的“巧妙简洁”虽然令人惊叹,但其推导过程是否完全可解释、能否被人类数学家轻松验证,仍是未知数。目前,所有大模型在数学推理中都存在“幻觉”风险——看似正确的证明可能隐藏着逻辑漏洞。因此,与其说这是能力过剩,不如说是功能性盲点的暴露:AI在形式化推理上的激进进步,与验证工具的滞后之间形成了尖锐矛盾。

对从业者而言,这一事件应该被视为一个重新校准期望的契机。一方面,它证明了大模型在符号操作和抽象推理上的潜力远超预期,未来或可辅助人类攻克更复杂的猜想(如黎曼假设)。另一方面,这也警示我们不能将AI的数学能力直接等同于科研生产力。真正的数学发现需要可复现、可交流、可扩展的证明体系,而当前模型往往产出“孤立的闪光点”。建议研究机构在推进AI数学能力的同时,优先投资于自动化验证工具和推理可溯源框架,而非盲目追求“更漂亮”的证明。毕竟,如果AI产出的结果连自身都难以解释,那么这种“超前”就只是空中楼阁。