OpenAI攻克数学猜想？AI自主推理破壁，智能体能力天花板被炸开

openinstall运营团队｜

2026-05-22｜ look

139

penAI通用推理模型自主推翻80年Erdős单位距离猜想，菲尔兹奖得主称"毫不犹豫推荐顶刊接收"。当AI能在数万步推理链中保持零幻觉，商业场景中Agent自主决策的归因盲区正急剧膨胀——深度链接与全渠道统计如何兜底？

一个困扰数学界近80年的猜想，真的被AI自己推翻了？菲尔兹奖得主Tim Gowers的原话近乎惊悚——"如果你是一位数学家，请确保自己已经坐稳了"。2026年5月20日，OpenAI正式宣布其内部通用推理模型在无任何人类干预的前提下，自主推翻了Paul Erdős于1946年提出的平面单位距离猜想。这不仅是AI首次独立解决数学核心领域的著名开放问题，更是一个强烈的信号：当模型能在数万步逻辑链条中保持零幻觉、跨领域调取代数数论重武器完成"降维打击"，那些依赖人类点击行为作为数据入口的商业归因体系，正在面临同样量级的颠覆。

OpenAI攻克数学猜想

80年铁壁：Erdős猜想的几何直觉与数学困局

1946年，匈牙利传奇数学家Paul Erdős提出了一个连小学生都能听懂的问题：在二维平面上放置n个点，其中距离恰好等于1的点对最多能有多少对？记为u(n)。

Erdős猜想的几何直觉与数学困局

直觉给出的答案看起来非常合理：把点排成正方形网格，每个格子的边长都是1，大约能产生2n对距离为1的点对。Erdős本人也倾向于这种直觉，他正式提出猜想——u(n)的增长不会超过n^{1+o(1)}，也就是比线性快不了多少。为了激励后人，Erdős甚至为这道题设立了现金奖励。

这条猜想的力量在于它的几何合理性：正方形网格天生就是最高效的单位距离堆积方式，每个节点有四个邻居，对称性达到最大，任何变形都会引入误差、减少对数。近80年间，数学界的尝试始终在这个框架内打转：Erdős用高斯整数（形如a+bi的复数）构造的缩放网格将下界推至n^{1+C/log log n}，但这只是对数级别的微调，指数始终是1加一个趋近于0的尾巴。

指数始终是1加一个趋近于0的尾巴。

上界方面，1984年Spencer、Szemerédi和Trotter给出了O(n^{4/3})的上限，此后40年无人撼动。哪怕陶哲轩等天才在相关结构上做了诸多微调，天花板纹丝不动。下界与上界之间巨大的鸿沟，让这道题成了组合几何领域最令人挫败的开放问题之一——在每一份关于Erdős的综述中都被提及，却从未被攻克。

从几何到数论：AI的跨界降维打击

真正让整个数学界倒吸凉气的，不是AI找到了一个反例，而是它找到反例的方式。

OpenAI的模型没有沿用经典几何技巧。它将问题与一个看似毫不相关的领域联系起来——代数数论，研究代数数域中整数扩张的因式分解等概念的学问。

传统构造依赖高斯整数提供的对称性来排布网格点。模型敏锐地察觉到，高斯整数的对称性还不够"压榨"出极限的单位距离，于是将几何构想推向了一个人类从未敢想的极端：它构建了具备更丰富、更高维对称性的代数数域扩张，替代了简单的高斯整数结构。在这些高维对称空间中，能够产生远比人类已知网格多得多的"单位长度差"。

更关键的是，为了证明这种复杂数域在数学上确实存在，模型极其熟练地调用了无限类域塔（Infinite Class Field Towers）和Golod-Shafarevich理论——这些是代数数论皇冠上的明珠，即便是专门研究数论的人类专家，要将它们天衣无缝地组合在一起也需耗费数年心血。而一个通用推理模型，在解决一个初等几何问题时，自发地完成了这次跨域调用。

普林斯顿大学组合数学泰斗Noga Alon亲眼看到内测模型的解答时，被这种"优雅且聪明"的手法深深震撼。菲尔兹奖得主Tim Gowers在配套论文中称其为"AI数学的里程碑"，并表示"如果这是人写的论文，我会毫不犹豫建议顶刊接收"。

n^{1.014}：性质上的差异而非数量上的

模型生成的文档共约125页，分为两篇独立论文。第一篇由OpenAI研究员Lijie Chen借助模型计算支持完成，构造了原始反例。第二篇是19页的配套论文，由九位顶尖数学家共同签署，将证明翻译成"human-readable"形式并逐步验证。

完整提示词指令

普林斯顿大学数学教授Will Sawin随后连夜精细化推导，将模型证明中的改进指数δ明确取到0.014。翻译成具体数字：用一百万个点，按正方形网格排布大致得到两百万对单位距离；用新代数方法，大约多出1.33百万对。看似只是几个百分点，但随着n增大，增长持续分化——对于一百亿个点，多项式优势就达到数量级层面。

普林斯顿大学数学教授Will Sawin随后连夜精细化推导，并确认该结果

0.014的改进看似微小，但它是多项式级的，不是对数级的。这意味着单位距离对的数量增长严格快于任何受正方形网格启发的构造。这是性质上的差异，不是数量上的。下界与上界之间的差距自1984年以来首次缩小，而且是自下而上地缩小。

$代数数论降维打击离散几何，正方形网格n^{1+o(1)}被代数数域扩张n^{1.014}多项式级超越$

七个月前的翻车与这次的谨慎

OpenAI在信任问题上学到了惨痛教训。2025年10月，前VP Kevin Weil曾在X上宣称GPT-5解决了10个此前未解的Erdős问题——结果那些只是文献中已有的解法，引发业内广泛嘲讽。维护Erdős问题网站的Thomas Bloom公开批评那是"严重的失实陈述"，Weil的帖子在数天内被删除。

这一次，OpenAI明显更谨慎。发布成果的同时附上了九位数学家的背书声明，包括当初最猛烈批评者Thomas Bloom。模型也不是专门为数学设计的系统——它是与驱动ChatGPT和Codex同类架构的通用推理模型，只是作为评测先进模型能否参与前沿研究的一部分，被投入了一批Erdős问题，这道题恰好是其中之一。

OpenAI研究员Sebastian Bubeck的一句话透露了内部流程："这听起来太好了以至于不像真的。我是说，就在几个月前我们才把这个转化为形式化证明。"模型几个月前就产出了证明，而形式化验证阶段持续到召集了一个小型数学评审组。在每一个步骤被检查完之前，没有任何发布。

自主推理破壁：从数学到商业场景的冲击波

一个通用推理模型能在数万步逻辑链条中保持零幻觉，跨领域调取远距离工具完成"降维打击"——这对数学界是里程碑，对商业世界同样是一枚深水炸弹。

数学证明是全人类逻辑思维最严苛的试金石：定义不允许半点含糊，每一个中间步骤都可以被严格验证，长达数十页的论证只要有一处逻辑断裂就瞬间崩塌。当AI在这种最严苛场景下通过了检验，它在不那么严苛的商业场景中的自主决策能力就不言而喻了。

OpenAI在官方公告中明确指出：能够在复杂推理链中保持连贯性、跨越不同领域连接想法、找到研究人员可能未曾探索的路径——这些能力同样适用于生物学、物理学、材料科学、工程和医学。

而对我们更直接的冲击在于：当AI能在无人干预下独立完成80年未解的超复杂多步推理，它在商业场景中自主替用户执行交易、选购、导航的能力就更加毋庸置疑。OpenAI研究员Noam Brown评论道："不到一年前，前沿AI模型还处于IMO金牌水平。我预计这种进步速度将持续。"——IMO金牌是聪明高中生四小时可解的题目，而现在是80年无人能解的开放问题。

Agent自主决策：归因链路的系统性断裂

当推理能力从"回答问题"跃迁到"替人办事"，一条隐秘但致命的商业断裂带正在形成。

在传统互联网流量模型中，用户从看到广告到下载App、从搜索引擎点击链接到完成购买，每一个步骤都留下了可追踪的行为脚印：UTM参数、点击ID、Referer头、Cookie标识。归因体系的底层假设是——每一个关键动作背后，都有一个真实的人类在屏幕前点击。

但通用推理模型的能力跃迁正在瓦解这个假设。当Agent能够自主执行复杂的多步推理链，它同样能自主完成"帮用户找到最优惠的价格并下单""帮用户比较三个App的功能差异并选择安装""帮用户追踪商品降价并在最佳时机购买"。这些场景中，用户不再点击链接、不再浏览网页、不再手动输入搜索词——AI在后台静默完成一切，人类只看到最终结果。

这条断裂带的本质是：从"人类点击→行为参数→归因"的显性链条，坍缩为"人类意图→AI代理执行→结果呈现"的隐性链条。中间的行为参数——那些UTM标签、点击ID、来源渠道标识——在AI代理的虚拟执行环境中被系统级地抹除。

AI通用推理模型自主代执行导致前端归因参数被系统级抹除的截断漏斗模型

这与OpenAI模型推翻Erdős猜想的结构如出一辙：80年来数学家以为正方形网格是最优解，但AI发现了人类从未看到的隐秘通道；同样，十年来互联网行业以为"用户点击→参数传递→归因统计"是最优路径，但AI自主决策正在开辟一条绕过所有参数传递节点的暗道。

工程实践：深度链接如何穿透Agent归因黑洞

面对Agent自主决策带来的参数丢失，传统的解决方案——在URL里拼接UTM参数、在落地页里埋点、在SDK回调里抓取Referer——全部失效。因为Agent不是在浏览器里点击链接，它是在API层面直接调用服务。

这意味着归因防线必须从"前端抓取"下沉到"端云对账"。openinstall的深度链接技术提供了一种穿透Agent归因黑洞的确定性路径：当Agent通过API调用拉起App时，深度链接在Intent层面捕获启动参数，将调用来源、意图类型和上下文信息封装进加密的参数包体，在App首次冷启动时由SDK引擎自动核销出意图快照——不依赖前端URL、不依赖浏览器Cookie、不依赖用户手动操作。

AI通用推理模型自主代执行导致前端归因参数被系统级抹除的截断漏斗模型

更进一步，当Agent的自主决策跨越多个设备和平台（比如手机上布置任务、电脑上完成执行），单端SDK的归因能力同样会出现盲区。openinstall的全渠道统计通过统一ID路由空间，为每次调用签发携带加密签名的动态Token，兼容人类点击与Agent代执行两种模式，将跨屏流转的意图流量串联成完整的归因链路。

关键在于，这套机制与Agent的执行方式无关——无论是人类在浏览器中点击，还是AI在API层面静默调用，深度链接和全渠道统计都在底层协议层捕获参数，不依赖于任何特定的前端行为模式。就像OpenAI的通用推理模型不依赖于任何特定数学领域的专用训练一样，归因基建也不应依赖于任何特定的用户行为模式。

openinstall深度链接穿透AI Agent归因黑洞，确定性参数捕获修复归因链路

这件事和开发/增长团队的关系

面向开发团队

当Agent自主推理能力持续跃迁，App被拉起的方式正在从"用户点击→浏览器跳转"转向"AI代执行→API直接调用"。开发者需要确保自己的App能同时兼容两种调用模式：传统的URL Scheme和Intent Filter仍然需要，但更要为API层面的程序化调用预留参数接收通道。openinstall的传参安装方案在App分发关键切入点将裂变参数直接封装进包体空白字节区，App首次冷启动时SDK自动对撞核销，实现了零摩擦的确权——无论调用来自人类点击还是Agent代执行。

面向运营团队

当AI能自主完成80年未解的超复杂推理，它替用户做购买决策、App选择的能力只会更强。运营团队需要重新理解"流量来源"的定义：过去是"哪个渠道带来的点击"，未来是"哪个Agent代表用户做了选择"。归因报表中"自然量"激增可能不是品牌自发增长的信号，而是Agent代执行绕过了所有追踪参数的结果。部署全渠道统计底座，将Agent流量从"自然量"中剥离出来，是精准评估推广ROI的前提。

传统归因方案与全渠道智能路由底座在Agent跨屏流转场景下的效能对比矩阵

常见问题FAQ

解决Erdős问题的OpenAI模型到底是什么模型？

OpenAI官方明确表示这是一个内部通用推理模型，不是像AlphaProof那样的数学专用系统，也不是针对该问题专门设计的定制模型。它与驱动ChatGPT和Codex的同类架构相同。确切名称未公开，商业名称可能在未来几个月内公布。Noam Brown确认"它不是数学专用系统，是通用推理模型"。

0.014的改进这么小，为什么说它是"性质上的差异"？**

0.014是多项式指数，不是对数修正。n^{1.014}与n^{1+o(1)}的差异在于：前者的指数严格大于1一个不依赖于n的量，后者的附加项随n增大趋于0。这意味着新构造的单位距离增长严格快于任何基于正方形网格的方法，无论n取多大。这是质变而非量变。

AI自主推理能力增强，对App归因有什么直接影响？

当AI能自主完成复杂多步推理，它在商业场景中替用户执行任务（搜索、比价、购买、下载App）的能力同步增强。这些代执行行为绕过了传统的点击→跳转→参数传递归因链路，导致前端归因参数大面积丢失，App安装被误归为"自然量"。部署深度链接和全渠道统计可在协议层穿透Agent执行环境，兜底归因准确性。

行业动态观察

Erdős猜想的被推翻只是开始。Gil Kalai在他的博客上已列出候选：distinct distances问题、Erdős关于和与积的猜想、Plünnecke-Ruzsa的sumsets问题——这些都是表述初等而证明困难的经典问题，在精神上与刚被解决的问题相似。如果通用推理模型在数学领域的攻坚速度持续，24个月后通过API以较低成本可及的模型解决科研级问题将成为常态。

对归因行业而言，AI推理能力的每一步跃迁都意味着Agent自主执行场景的扩张，以及传统归因盲区的同步扩大。当下正是归因基建从"前端抓取时代"向"端云对账时代"迁移的窗口期——在Agent大规模接管用户决策之前，部署深度链接和全渠道统计的确定性归因底座，是捍卫增长主权的关键一步。

正如Thomas Bloom所感叹的："AI正在帮助我们更全面地探索那座历经数个世纪才得以巍然耸立的数学大教堂；在这些宏伟的穹顶之下，还有多少未被看见的奇迹，正在侧翼等待着被唤醒？"——对数学如此，对商业归因体系的重构亦然。

文章标签：全渠道统计深度链接

上一篇:
Anthropic首度盈利？AI实验室跑通闭环，企业服务生态进入洗牌期
 下一篇:
AI助手"马维斯"正式上工？腾讯全面打响桌面智能体遭遇战