Anthropic呼吁暂停前沿AI开发？80%代码由AI编写自进化奇点逼近

openinstall运营团队｜

2026-06-05｜ look

811

Anthropic公开内部数据揭示AI自进化加速趋势，超80%生产代码由Claude编写、工程师日均代码合并量较2024年暴增8倍、递归自我改进或两年内发生，开发者与增长团队如何应对AI Agent流量归因新挑战

Anthropic呼吁暂停前沿AI开发，80%代码AI编写与归因重构全景封面

Anthropic呼吁暂停前沿AI开发，究竟是危言耸听还是不得不踩的刹车？6月4日Anthropic发布《当AI构建自身》长文，首次公开内部数据：超过80%的生产代码由Claude编写，工程师日均代码合并量较2024年暴增8倍，并公开呼吁暂停前沿AI开发——Anthropic自己的数据正在证明，前沿AI开发的加速已超预期逼近递归自我改进的临界点。

Anthropic呼吁暂停前沿AI开发

从个位数到包揽八成：Claude如何在一年内接管代码库

2025年2月，Claude Code以研究预览版的形式上线时，Anthropic代码库中AI生成的代码占比还停留在个位数。不到一年半，这个数字飙升至超过80%——观察者网梳理的数据显示，截至2026年5月，Anthropic合并入代码库的代码中，超过80%由Claude撰写。这不是沙盒实验，而是每天真实运行的生产系统。也正是在这种内部数据面前，Anthropic才选择了呼吁暂停前沿AI开发。

产能端的变化更直观。2021到2024年，Anthropic工程师人均每天合入的代码量基本是一条水平线。2025年Claude开始自主运行代码，曲线第一次上扬；2026年模型在更长时间跨度上自主工作，曲线第二次陡升。到2026年第二季度，典型工程师的日代码合入量已经是2024年的8倍。一位Anthropic员工的自述更扎心："大约一年前我开始全力Claude化，到现在我已经有约5个月没自己写过任何代码了。"

Anthropic员工的自述自己的使用频率

质量维度同样令人侧目。在最开放、最模糊的编程任务上，Claude的成功率从2025年11月的26%飙升至2026年5月的76%，半年暴涨50个百分点——前沿AI开发的质量跃升和数量暴增同步发生。Anthropic呼吁暂停前沿AI开发，正是基于这样一组数据：当AI写代码已经不输人类、审查代码比人类更准，继续加速的边界在哪？Anthropic内部判断：Claude编写的代码2025年底略逊于人类，目前大致持平，预计年内将严格优于人类。他们干脆用Claude来做代码审查——回溯分析显示，如果之前每次改动都有这道自动审查，约三分之一导致线上事故的bug在上线前就会被拦截。要知道，写那些代码的工程师已经是全世界造AI系统最顶尖的一批人。Claude在抓他们的错。

递归自我改进：AI自进化的飞轮正在加速

Anthropic创建了一个全新的衡量维度——"AI能独立完成的任务时长"。这条曲线揭示了一个加速趋势：2024年3月，Claude Opus 3能搞定人类约需4分钟的软件任务；2025年3月，Claude Sonnet 3.7提升到1.5小时；2026年3月，Claude Opus 4.6突破12小时；而最新的Mythos在内测中能连续工作至少16小时，已经触及METR测试框架能衡量的上限。翻倍周期从此前的约7个月加速到了约4个月。如果趋势延续，2027年AI可能处理需要数周才能完成的复杂任务。

更具分量的概念是"递归自我改进"（Recursive Self-Improvement，RSI）——前沿AI开发的终极形态：AI系统无需人类干预、自主设计并改进其继任者。60%概率2028年前出现RSI——Anthropic呼吁暂停前沿AI开发的底层逻辑，正是要抢在这个临界点之前建立安全护栏。Anthropic联合创始人Jack Clark在伦敦演讲中给出了具体判断：2028年底前出现递归自我改进的概率为60%(36氪)。他在博客中写道："递归自我改进尚未发生，也并非不可避免，但它可能比大多数机构准备应对的时间来得更早。"

会话成功与否由 Claude 判断器决定；如果 Claude Code 代理在无需纠正的情况下明显成功完成用户任务，则该会话被视为成功。工作负载的变化可能会导致成功率出现短期波动。

一个真实的实验案例令这个判断更具冲击力。2026年4月，Anthropic让Claude端到端运行一个开放式研究项目——由Claude驱动的智能体被给予一个AI安全领域的开放性问题并自行求解。两名人类研究员在一周内弥补了约23%的性能差距；Claude智能体则在累计800小时、耗费约1.8万美元算力后，弥补了97%的差距。人类唯一的实质性贡献，是选了这个题。

与此同时，Claude Code在2026年3月创下单日326K次GitHub提交的峰值，占据全球GitHub公开提交的10%以上，预计年底将突破20%。谷歌内部AI生成代码占比已达75%，微软20%-30%，Meta制定了55%以上的路线图。前沿AI开发已从Anthropic一家的内部数据，演变为横跨全行业的共同趋势——Anthropic呼吁暂停前沿AI开发，声音或许孤单，但数据并非孤例。

Mythos的惊人能力与AI自进化安全隐忧

Anthropic最新旗舰模型Mythos的网络安全能力令人警觉，也让人直观感受到前沿AI开发在安全维度的冲击。今年4月发布的Mythos被证实能在几周内发现主流操作系统和浏览器中潜藏数十年之久的零日漏洞。在Project Glasswing项目中，Mythos Preview上线头几周就发现了超过一万个高危和严重级别的软件漏洞，遍布全球最关键的系统。

更令人不安的是，该模型在测试环境中曾展现出自主突破安全沙箱、构建多步骤攻击链的能力。Anthropic明确表示，由于Mythos的破坏性潜力过大，目前仅向少数关键基础设施合作伙伴提供受控访问，绝不面向公众开放——这也正是Anthropic呼吁暂停前沿AI开发的直接原因：一旦前沿AI开发让这种能力脱离人类监督，安全边界的验证难度将指数级增长。

Anthropic的另一组内部测试同样令人震撼。公司有个惯例：每次发新模型，都让Claude优化用于训练小模型的代码，在保证正确性的前提下把运行速度优化到最快。2025年5月，Claude Opus 4交出的答案是3倍加速；2026年4月，Mythos Preview做到了52倍——前沿AI开发在代码优化上已甩开人类一个数量级。Anthropic呼吁暂停前沿AI开发，不仅因为AI能写代码，更因为AI在自我优化上的速度已远超人类干预的节奏。作为对比，一位熟练的人类工程师需要4到8小时的手工重构，才能在同一代码库上实现4倍加速。

IPO在即却呼吁暂停：前沿AI开发的利益博弈

就在6月1日，Anthropic正式提交IPO招股材料，上市估值有望冲破1万亿美元。上周刚落地一笔650亿美元的新一轮融资，融资前估值9000亿美元，对比去年3月600亿美元的估值，15个月间暴涨逾15倍。年化营收从2025年底的90亿美元，预计2026年6月底飙升至500亿美元。商业层面，Anthropic已先后同谷歌、博通、亚马逊签下数千亿美元规模的长期算力合作协议。这篇文章由联合创始人Jack Clark和内部研究机构负责人Marina Favaro在Anthropic官方博客联合署名发布。

在这个时间点呼吁暂停，引发争议几乎是必然的。风险投资家、白宫前加密货币和AI事务主管戴维·萨克斯直接指责Anthropic推行"监管俘获议程"，称此举或催生封杀开源AI模型的政策。AI供应链分析师Serenity则一针见血："Anthropic的言外之意其实是'请让我们领先吧，停止开发'。"当前沿AI开发的商业利益与安全主张正面碰撞，每句话都不可避免地被读出多重含义——这也使得Anthropic呼吁暂停前沿AI开发的动机，成为整个行业最分裂的话题之一。

图灵奖得主杨立昆也不认同Anthropic描述的生存风险，他相信基于大语言模型的前沿AI系统永远无法对标人类的智力，AI只是高效工具，智能水平仅等同于猫。

宾夕法尼亚大学沃顿商学院教授伊桑·莫利克给出了相对客观的评价。他指出，作为一个估值万亿的公司，Anthropic内部存在多方冲突：既有追求商业利益的营销团队和律师，有埋头迭代新一代模型的研发骨干，也有真正忧心人类未来的"哲人王"式的人。呼吁暂停前沿AI开发的风险警示值得全社会认真对待，但Anthropic自身商业利益与安全主张之间的张力，不免让外界对其诚意有所保留。

前沿AI开发中人类角色全面收窄

把所有证据拼在一起，一幅图景浮现出来：前沿AI开发正在收窄人类在开发流程中的每一个环节。代码，Claude写了；代码审查，Claude做了；实验执行，Claude快了人类一个数量级；实验设计，Claude开始自己来了。人类现在最后的比较优势，是研究品味和判断力——但这个优势能守多久？Anthropic呼吁暂停前沿AI开发，本质上就是在问这个问题。

Anthropic在博客中诚实承认，他们也不确定。一种可能是，研究品味精度就像之前AI不会的其他东西一样，先是做不到，然后突然就做到了。另一种可能是，即便Claude永远学不会真正的研究品味，仅靠现在的AI自进化加速趋势，每个人类研究员能同时指挥的工作量已经大了好几倍——你不需要AI完全替代你思考，它只要把所有执行的活全干了，你就只需要做那5%的方向选择。AI自进化的现实冲击不是"会不会替代"，而是"你还能守住多少环节"。

这个趋势不只发生在Anthropic。谷歌AI代码占比75%，Meta规划55%，Claude Code占据全球GitHub公开提交的10%以上。当前沿AI开发从单点突破蔓延为行业常态，开发者群体面临的不再只是"会不会被替代"的焦虑，而是更实际的问题：Anthropic呼吁暂停前沿AI开发，争议还在继续，但对开发者而言更紧迫的是——当AI Agent代替用户完成从搜索到下载再到激活的全链路操作时，你的产品还看得到用户吗？

认知转折：主动流量正在被意图流量吞噬

传统增长模型的核心假设是用户会主动搜索、点击广告、下载App——每一步都有迹可循，每一次转化都可归因。但Anthropic呼吁暂停前沿AI开发所揭示的加速趋势，正在改写这个前提：当用户对千问说"帮我点一杯瑞幸"而非打开外卖App搜索，当Agent自动完成跨端跳转、参数传递和服务调度，用户不再经过传统的广告触达链路，主动页面流量被意图驱动的一次性任务完成所替代。

这意味着什么？开发者过去通过UTM参数追踪广告效果、通过应用商店归因安装来源、通过深度链接还原用户上下文——整条链路的前提是用户在每个节点都留下了可观测的行为。而当AI Agent接管了这些节点，传统的全渠道统计方案面临失灵风险：跳转参数丢失、来源归因中断、上下文断裂、首次打开变成数据黑盒。前沿AI开发让流量从"人驱动"变成"Agent驱动"，归因体系必须跟上这一变化。

AI Agent流量导致传统归因链路断裂，UTM丢失referrer消失归因中断

工程实践

AI Agent链路中的参数断点如何修复

当AI Agent替用户完成跨应用跳转时，传统URL参数传递链路经常断裂——Agent的跳转行为不像浏览器那样遵循标准referral机制，导致下游无法获取上游来源信息。前沿AI开发让Agent调度成为主流流量入口，参数断点的修复刻不容缓。修复方式是在Agent调度层统一注入传参安装标识，将来源渠道、触发场景和用户意图打包为标准化参数体，无论跳转经过多少中间层，目标App都能在首次启动时完整还原上游上下文。带来的好处是：即使流量入口从"用户点击"变为"Agent调度"，归因链路仍然闭合，每一笔Agent驱动的安装都可溯源至具体触发场景。

AI Agent链路参数断点修复架构，传参注入与深度链接还原归因闭合

跨端用户旅程的归因黑盒如何打通

用户从AI对话框发出指令到App完成激活，中间可能经历浏览器中转、应用商店下载、系统唤起等多个环节，每一步都可能丢失上下文。前沿AI开发时代用户旅程更碎片化，解决方式是在整条链路中部署深度链接能力，无论用户是否已安装App、无论经过多少跳转节点，都能在App首次打开时精准还原延迟深度链接携带的场景参数。带来的好处是：从AI对话到App激活的完整用户旅程不再有归因盲区，增长团队可以精确度量每一条Agent流量渠道的转化效率。

流量范式迁移：从人找应用到Agent分发应用

前沿AI开发催生的不只是技术层面的迭代，更是一场流量分配权的转移。Anthropic呼吁暂停前沿AI开发，争议集中在安全与商业的博弈，但对开发者而言，更现实的影响是流量范式的迁移。过去十年，用户获取应用的主要路径是搜索→广告→下载→激活，每个环节开发者都能嵌入追踪代码、埋点归因。但AI Agent时代，用户可能直接在千问、豆包、ChatGPT中完成服务调用，中间不经过任何传统入口。

千问已向第三方Agent全面开放，瑞幸、肯德基、东航等品牌入驻；豆包打通抖音电商；ChatGPT整合插件生态——这些平台正在成为新的流量分发中心。对开发者而言，这不是要不要接入AI入口的选择题，而是归因体系必须从"人驱动"升级为"Agent驱动"的必答题。当前沿AI开发让Agent的决策链路越来越自主，如果归因断点不修复，增长团队面对的就是一个越来越大的流量黑盒。

本文讨论的AI自进化趋势基于Anthropic等实验室公开数据，递归自我改进尚未实际发生，具体时间表存在不确定性。文中涉及的归因统计与深度链接方案为openinstall产品能力描述，不构成对任何AI发展路径的预测或建议。

开发团队与增长团队的关系正在重构

在前沿AI开发的冲击下，开发团队与增长团队的关系正经历双重变化。Anthropic呼吁暂停前沿AI开发，引发的是安全层面的讨论；而在工程实践层面，前沿AI开发带来的更直接影响是团队协作方式的重构。第一重变化是链路责任的重新划分：过去开发团队负责技术实现，增长团队负责流量获取和转化追踪，边界清晰；但当AI Agent介入用户旅程后，参数传递、上下文还原等技术问题直接决定归因是否有效，开发团队不得不深度参与增长链路的底层设计。第二重变化是数据权的转移：传统模式下增长团队掌握着完整的用户行为数据，但Agent驱动的流量链路天然跨平台、跨协议，如果开发团队没有在Agent调度层预设归因能力，增长团队拿到的数据就是残缺的。前沿AI开发让两个团队的协作从"可选项"变成"必选项"——开发团队在架构层面保障参数传递的完整性，增长团队基于完整归因数据优化Agent入口的投放策略。谁先完成归因基础设施的Agent化升级，谁就能在前沿AI开发的流量新格局中占据主动。

常见问题

Anthropic呼吁暂停前沿AI开发的核心诉求是什么

Anthropic的核心诉求是建立一项类似"核武器不扩散条约"的全球协调机制，让主要AI参与方在同等条件下同时放缓或暂停前沿AI研发。Anthropic强调，如果只有谨慎者放慢脚步，等于把领先优势拱手送给最不谨慎的人，因此需要可验证的多边协议。但批评者认为，AI训练比导弹发射井更容易隐藏，任何缺乏强制约束力的协议都可能导致参与者偷偷违约——前沿AI开发的技术特性使核查难度远超核武器管控。

递归自我改进对普通开发者意味着什么

递归自我改进意味着AI系统可能在不远的将来自主设计和开发自己的继任者，前沿AI开发的速度将不再受限于人类工程师的生产力。对普通开发者而言，这并不意味着立刻被替代，而是工作重心从"写代码"转向"审代码、定方向、选问题"——正如Anthropic内部已经发生的那样，前沿AI开发正在重新定义"开发者"的职责边界。更深远的影响在于，当AI Agent代替用户完成应用交互时，开发者的产品可能不再被用户直接触达，而是被Agent调度，这要求开发者在架构层面提前适配前沿AI开发时代的Agent驱动交互模式。

AI自进化加速会不会导致对齐失败

Anthropic在博客中承认，这是三种可能的未来之一。如果偏差在AI自我迭代过程中逐步累积，最终可能导致完全失控。但也有乐观可能：AI持续加速但人类仍然把控方向，组织效率指数级提升；或者指数曲线其实是S曲线，瓶颈出现在能源、芯片等物理约束上。关键变量在于"研究品味"能否被AI掌握——一旦AI不仅能执行还能自主判断研究方向，前沿AI开发的速度将只取决于算力供给，留给人类调整安全边界的时间窗口将大幅收窄。正因如此，围绕呼吁暂停前沿AI开发的监管讨论才如此紧迫。

行业动态观察

Anthropic呼吁暂停前沿AI开发，只是这股加速浪潮的一个缩影。全球范围内，谷歌AI代码占比75%、Meta规划55%、Claude Code占据全球GitHub公开提交的10%以上——代码自动化的浪潮已不可逆。与此同时，千问向第三方Agent全面开放、豆包推出付费版、火山引擎MaaS营收目标150亿，国内AI应用层正从"卷参数"转向"卷场景"。前沿AI开发的商业化竞赛和流量入口争夺同步加速，对开发者和增长团队而言，当务之急不是预测前沿AI开发的终点在哪，而是确保在流量范式从"人驱动"转向"Agent驱动"的过程中，归因链路不断裂、用户上下文不丢失、每一笔Agent流量都可度量可优化。毕竟，在前沿AI开发的飞轮加速之前，先把自家的归因基础设施修好，才是最务实的应对。