万员工用Claude干活?企业Agent渗透正在制造归因盲区

当全球前两大工业集团在同一周内向合计超过32万名员工全面部署AI Agent,企业Agent渗透是否已经制造出传统归因体系无法穿透的盲区?行业头部企业的选择给出了清晰答案。2026年5月19日至20日,日立与百时美施贵宝(BMS)先后宣布与Anthropic达成战略合作,将Claude AI平台嵌入从药物研发到社会基础设施的全业务链路。同一周,OpenAI联创Andrej Karpathy正式加入Anthropic预训练团队,任务直指"用Claude改进Claude"。当Agent不再是工具而是组织级基础设施,从广告点击到应用安装的每一步用户行为都可能由AI代为执行——而你的归因系统,根本分不清这次安装是人的意愿还是Agent的决策。企业Agent渗透正在以前所未有的速度重塑数字分发秩序,传统归因链路正在这股浪潮中被逐段截断。

Karpathy入局:AI改进AI的闭环正式合拢
5月19日深夜11点,Andrej Karpathy在X上发了四句话,宣告加入Anthropic。这条帖子一小时内浏览量接近300万。Karpathy写道:"我已加入Anthropic。我认为未来几年大语言模型的前沿发展将尤为重要。很高兴能加入这个团队,重返研发工作。同时,我依然对教育事业充满热忱,计划适时恢复相关工作的推进。"
从CS231n到Vibe Coding:一个能用一个词改变行业的人
要理解这次加入的分量,先要理解Karpathy的稀缺性在哪里。
1986年生于斯洛伐克,15岁移民加拿大。本科在多伦多大学选修了深度学习之父Geoffrey Hinton的课程,随后在斯坦福师从李飞飞攻读博士。期间他创建了计算机视觉课程CS231n——从2015年的150名学生增长到2017年的750人,全部视频公开上网,成为全球工程师自学深度学习的入门首选。 这个课程至今仍是AI教育领域的标杆,无数从业者正是通过这套视频踏入了深度学习的大门。
2015年,他成为OpenAI创始研究科学家。 2017年被马斯克挖至特斯拉担任AI高级总监,主导自动驾驶纯视觉方案。同年他在Medium发表"Software 2.0",提出神经网络权重就是新的代码、数据集就是新的源代码——这个框架重塑了整个行业对"什么是编程"的认知。
2022年离开特斯拉后,他在YouTube创建"Neural Networks: Zero to Hero"系列,频道突破百万订阅。开源项目micrograd、nanoGPT代码量极少,却被称为"可运行的教科书"。他的GitHub上22万星标的CLAUDE.md仓库,本身就是一句可以写进招股书的技术叙事。
2025年2月,他在X上造出了"Vibe Coding"一词——"完全顺应直觉,拥抱指数级增长,忘掉代码本身的存在"——随后被柯林斯词典选为年度词汇,引发了关于SaaS公司生死存亡的广泛讨论,数百亿美元市值随之蒸发。
TIME在2024年将他列入"AI领域最具影响力100人"。他在X上拥有250万粉丝。正如X用户@sa_vatsa所评论的:"Andrej给人的感觉从来不像一个AI网红,更像是这个领域的公共解读者。他翻译现实,而不是兜售立场。"
Autoresearch:用最强的锤子改进锤子本身
Karpathy加入Anthropic的具体任务,指向一个明确方向:用Claude加速预训练研究本身。
预训练是大模型获得核心知识和能力的基础阶段,也是算力消耗最密集的环节。据Anthropic向TechCrunch确认,Karpathy将组建团队,探索让Claude自主发现更优训练架构、数据配比和实验方向的方法——也就是"AI改进AI"的路线。
这并非凭空而来。今年3月,Karpathy曾做过一个实验:将一个AI编程智能体接入一个小型语言模型,让它无监督运行两天,自主测试和调整训练代码。经过700次实验、20项自主发现的优化后,他表示同样的调整应用到更大模型上,训练时间缩短了11%。他将这个方法称为"autoresearch",该项目随后成为GitHub热门项目,这套方法也被称为"Karpathy Loop"。
他在Anthropic要做的,正是将这套思路系统化、规模化。预训练团队负责人Nicholas Joseph在X上写道:"他将建立一个团队,专注于用Claude加速预训练研究本身。我想不出还有谁比他更适合做这件事——期待我们一起构建的东西!!"
TechCrunch评价称,"Karpathy是少数能在LLM理论与大规模训练实践之间架起桥梁的研究者之一。"
三年三人单向流动:OpenAI的人才虹吸效应
更值得注意的是人才流向的结构性信号。三年内,三位OpenAI核心人物全部单向流入Anthropic:
-
2024年5月,OpenAI前对齐负责人Jan Leike加入Anthropic;
-
2024年8月,OpenAI联合创始人John Schulman跟进;
-
2026年5月,Karpathy加入。
三年,三位核心人物,全部单向流入Anthropic,没有任何可比的反向案例。

与此同时,OpenAI的战略重心已明显转向平台化——相继收购Chat.com、io Products、Windsurf等,节奏越来越快,金额越来越大。对于一个想"回归研发"的研究者而言,Anthropic"以研究质量取胜"的路线,显然更有吸引力。
据Business Insider报道,Anthropic的估值在二级市场近期已超过1万亿美元,超越OpenAI。Anthropic目前正在以约9000亿美元估值洽谈300亿美元新一轮融资。据新智元援引Polymarket数据,交易者给Anthropic在6月底拥有最佳AI模型的概率定价为65%,而OpenAI为4%。
X用户@Shashank评论道:"Anthropic开始看起来像2000年代中期的皇家马德里,把所有AI传奇人物和CTO都招进来当技术成员。Anthropic正在打造一支绝对的超级战队。" @Balu0X则表示:"天哪,太疯狂了,完全没想到。Anthropic正在赢得AI竞赛。" @HegsethWarDesk用户表示,"Anthropic发展势头良好,我认为在未来三四年内他们会超越OpenAI。"
Anthropic为什么非要招他
Anthropic的招募动机可以分几层来看。
技术层面:Anthropic的算力预算无法与微软支持的OpenAI或坐拥TPU的谷歌正面竞争。它必须找到用更少算力训出更好模型的方法。Karpathy同时具备预训练理论深度、大规模工程经验和对AI辅助研究的直觉,三者兼备的人极少。
人才信号层面:每一个Karpathy级别的加入,都在降低下一个顶级人才加入的心理门槛。人才吸引人才,飞轮自转。
IPO叙事层面:Karpathy是AI领域公众辨识度最高的技术人物之一——百万YouTube订阅,年度词汇造词者,GitHub上22万星标的仓库。他的名字出现在员工名单上,本身就是一句可以写进招股书的话。
但据新智元分析,最深层的价值可能是Anthropic没有明说的:Karpathy定义范式的能力。他在Anthropic做的任何技术探索,都会通过他的推文、博客和YouTube视频公开传播。当他用他特有的方式给正在发生的事情命名时,Anthropic就自然成为那个范式的原产地。招了一个顶级预训练研究者,附带获得了行业最有影响力的技术叙事者。
BMS:3万员工全面接入,企业Agent渗透从对话工具到业务节点
5月20日,百时美施贵宝宣布与Anthropic达成战略合作,将Claude部署至全球超3万名员工。据,此次部署将让逾3万名BMS员工,在研究、临床开发、制造、商业及企业职能等各个领域,均能使用Claude的人工智能功能。三大优先方向被明确划定:
第一,软件与AI开发加速。 工程与数据科学团队将使用Claude Code进行开发,通过标准化企业级能力的构建和部署方式,释放长期困在断连系统中的数据与专业知识。
第二,工作流程自动化。 在药物研究、临床试验、制造及商业运营中嵌入AI智能代理。具体覆盖:肿瘤学、血液学、神经科学和免疫学领域的靶点识别与优化;临床研究报告与患者安全叙述的撰写;根本原因调查及批次放行决策;整合现场洞察以促进与医疗专业人员互动。
第三,系统整合。 Claude将与BMS涵盖科学、临床、监管及商业数据的内部系统深度整合。
在具体应用领域上,BMS划定了清晰的业务版图:
-
研究领域:支持肿瘤学、血液学、神经科学及免疫学等领域的靶点识别与优化。
-
药物开发:协助撰写临床研究报道、患者安全叙述及监管申报文件。
-
制造环节:应用于根本原因调查及批次放行决策。
-
商业职能:利用该技术整合现场洞察,以促进与医疗专业人员的互动。
BMS执行副总裁兼首席数字与技术官Greg Meyers明确表示,合作核心在于"通过智能代理能力与创新速度,连接各大系统并赋能员工,从而加速创新成果"。此次合作是BMS三年AI投资的延伸——该公司仍持续推行多供应商AI策略。但与之前对话式工具的本质区别在于:Agent不再是被动响应的聊天窗口,而是主动执行业务流程的节点。此次合作标志着BMS在部署AI方式上的重大演进——从定义第一波企业应用浪潮的对话式工具,转向代理化能力,并将其融入支撑科学研究和全球运营的日常工作流与系统中。
值得注意的是,Anthropic的竞争对手OpenAI也已与该行业的关键领头羊达成了合作。OpenAI曾于2024年宣布与生物技术巨头Moderna达成协议以实现业务流程自动化,并于今年早些时候与Wegovy的制造商诺和诺德达成交易以加速药物研发。生命科学赛道正在成为AI巨头争夺企业级部署的关键战场。
日立:29万员工"Customer Zero",企业Agent渗透进入社会基础设施
5月19日,日立宣布与Anthropic达成战略合作,目标覆盖约29万名员工的全业务流程。据,日立计划成为全球最大的Claude企业级采用者之一,合作规模远超BMS。此次合作旨在全面强化日立的"Lumada 3.0"商业模式,并在社会基础设施等关键领域加速"物理AI"的安全与无缝部署。
"Customer Zero"方法论:先验证再复制
日立的策略极具方法论价值。公司将内部应用定位为"Customer Zero"——先在自身业务中验证AI的实际效果,再将经验和数据沉淀转化为面向客户的解决方案能力。Hitachi计划优先在软件开发、办公效率提升以及硬件维护与运营自动化等领域扩大AI应用。同时,公司还将与Anthropic共同推进人才培养项目,计划让约10万名员工在日常工作中使用AI。
HMAX + Claude:社会基础设施的Agent化升级
在外部业务方面,合作重点指向社会基础设施。Claude的代码生成与分析能力将结合日立的系统工程能力,提升电力、交通、制造、金融等行业的系统开发和运维水平。"HMAX by Hitachi"将引入Claude的推理能力,支持以自然语言进行设备管理,并通过算法优化维护流程。Hitachi表示,这将有助于进一步扩大AI在关键任务场景中的应用范围。
双方合作还覆盖网络安全领域。Hitachi旗下专业组织"Cyber CoE"将与Anthropic协同,强化网络攻击检测与响应体系。按照Hitachi的设想,AI的应用不应局限于业务自动化,还将进一步延伸至运维与安全一体化的现场系统。
Frontier AI Deployment Center:百人起步,目标三百
组织层面,双方将设立全球性组织"Frontier AI Deployment Center",统筹北美、欧洲和亚洲地区的联合项目推进。初期规模约100人,将由Anthropic的应用AI负责人以及Hitachi在IT、OT、产品和安全领域的专家共同参与,后续目标扩大至300人。这个组织规模本身就说明:企业Agent渗透已经不是试点项目,而是需要专职团队推进的集团级战略。
此次合作也呼应了日本大型IT企业持续加深与Anthropic合作的趋势。Anthropic今年4月曾宣布与NEC合作——NEC成为日本企业中首家获得Anthropic全球合作伙伴资格的公司,并已向集团3万名员工部署Claude Code。
NEC先行与行业加速:企业Agent渗透的量级跃迁
NEC的先行布局为日立的合作提供了参考模板。这意味着,仅在过去两个月内,公开宣布将Claude部署至企业级规模的员工总数已超过35万——NEC 3万、BMS 3万、日立29万——而这还只是Anthropic一家的数据。OpenAI同期也已与Moderna和诺和诺德达成类似合作。

企业Agent渗透的加速度远超预期。从2024年的"对话式工具试点",到2025年的"特定场景部署",再到2026年5月的"全集团全业务流程覆盖"——Agent正在从辅助工具进化为组织的基础设施层。当几十万员工每天通过Agent执行业务流程时,Agent产生的数字行为量级已经足以对整个数字广告生态的归因数据造成系统性影响。
当Agent替人行动:归因链路从起点就断了

当3万名BMS员工用Claude Code执行开发任务,当10万名日立员工在日常工作中让AI代理处理流程——这些Agent执行的每一次API调用、每一次页面访问、每一次下载和安装,在归因系统的视角下都表现为一个"正常的用户行为"。但问题在于:这个行为的发起者不是人,而是AI。
传统归因模型的底层假设是:曝光→点击→安装→激活,每一步都由同一个人类用户主动完成。的核心逻辑正是基于这一假设,通过统一的身份标识将跨端行为缝合到同一条漏斗链路中。但当企业Agent渗透到工作流的每一个环节时,这个假设正在被逐层击穿:
第一层断裂:Agent代点击。 用户对Agent说"帮我找最好的预算管理App",Agent浏览、比较、点击广告链接、跳转应用商店、触发下载。归因系统记录到一个点击事件和一次安装事件——但点击的发起者是Agent,安装的受益者是人类,两者的身份标识不一致。在的场景下,参数从H5页面向App端的传递依赖用户主动点击行为触发,而Agent代点击时,这个参数传递链路的因果关系已经断裂。
第二层断裂:Agent代安装。 Claude Code在开发流程中可能批量拉取SDK、下载测试包、触发安装验证。3万名开发者的Claude Code每天可能产生数以万计的"安装事件",这些事件在广告效果监测系统中表现为真实激活,但实际上是自动化测试流量。的一键拉起能力在此场景下同样面临挑战:当拉起请求由Agent发起而非用户主动触发时,场景还原的语义基础不复存在。
第三层断裂:Agent代决策。 当HMAX用Claude的推理能力优化电力系统的维护流程时,Agent不仅执行操作,还在做出决策——选择哪个供应商、调用哪个API、下载哪个补丁。这些决策驱动的数字行为,在归因系统中完全无法追溯至原始的人类意图。
归因盲区的核心不是"Agent流量算不算真量",而是整个归因链路在Agent介入后从起点就失去了因果关联。你看到的不是数据偏差,而是数据脱锚。
工程实践:在Agent渗透环境中识别真实用户意图
面对企业Agent渗透制造的归因盲区,工程层面的应对需要从两个维度展开。
维度一:全渠道统计的身份解析升级。 传统的依赖设备指纹和归因匹配来缝合跨端行为。在Agent渗透环境中,需要引入"行为发起者"维度——区分一次安装是由人类直接触发,还是由Agent代为执行。具体方案是在SDK层面增加Agent行为标记:当应用检测到请求来自已知的AI Agent(如Claude Code的API调用特征),主动在归因数据中标注来源类型。这不是排除Agent流量,而是让归因系统能够区分不同来源的转化路径,避免将Agent代执行的测试安装与人类主动下载混为一谈。

# Agent感知归因标记示例
# 在SDK层面识别Agent行为并标记归因来源类型
def classify_install_source(request):
"""三元归因分类:人类直接操作 / Agent代执行 / 黑产伪造"""
# Agent行为特征检测
agent_signatures = [
"claude-code", # Claude Code SDK调用
"anthropic-api", # Anthropic API客户端
"autoresearch", # Karpathy Loop自动化研究
]
user_agent = request.headers.get("User-Agent", "")
is_agent = any(sig in user_agent.lower() for sig in agent_signatures)
# CTIT分析
ctit = request.install_time - request.click_time
ctit_seconds = ctit.total_seconds()
if is_agent:
# Agent代执行:CTIT通常均匀且可预测
return "AGENT_MEDIATED", "agent_workflow"
elif ctit_seconds < 1.0 or is_mass_pattern(request.ip):
# 黑产伪造:超短CTIT或IP集中
return "FRAUDULENT", "bot_fraud"
else:
# 人类直接操作
return "HUMAN_DIRECT", "organic"
维度二:CTIT风控的Agent流量识别。 中的CTIT(Click-To-Install-Time)分析,传统上用于识别自动化伪造流量——如果点击到安装的时间间隔异常短或呈现机械性分布,即判定为可疑。但企业Agent的安装行为同样会呈现自动化特征:批量触发、时间间隔均匀、设备指纹高度一致。关键区别在于:黑产伪造流量是为了骗取广告费,Agent安装是真实业务流程的副产品。因此CTIT风控需要从"二元判断(人/机)"升级为"三元判断(人/Agent/黑产)",在反作弊过滤中增加Agent流量的识别与分类维度,避免将企业客户的正常Agent行为误判为黑产攻击。
Agent感知归因:不是排除流量,而是还原因果链
需要强调的是,Agent感知归因的目标不是将Agent流量标记为"无效"然后排除。企业Agent渗透是真实的业务趋势——3万BMS员工用Claude干活是事实,不是作弊。归因系统的任务是在Agent介入的环境中,依然能够还原"哪个广告素材推动了人类用户的真实决策"这条因果链。当Agent替人执行了下载动作,归因系统需要知道这次下载的原始驱动力来自哪条广告、哪个渠道、哪次曝光——而不是将Agent执行的安装与人类主动安装混为一谈后,得出失真的渠道效果评估。
这件事和开发团队的关系
对开发团队而言,企业Agent渗透意味着SDK集成和埋点设计需要增加Agent行为识别层。如果你的App面向企业用户,Claude Code等Agent工具可能已经在批量访问你的下载页面和API接口。SDK需要在初始化阶段检测运行环境是否包含Agent特征,并在归因上报中增加来源类型字段。这不是额外的开发负担,而是归因数据准确性的必要保障——否则你看到的"安装量飙升"可能只是某家药企的Claude Code在做SDK兼容性测试。
这件事和运营团队的关系
对运营团队而言,企业Agent渗透制造的最直接冲击是渠道效果数据的可信度正在下降。当你看到某渠道的安装量突然增长30%,你无法判断这是素材优化带来的真实增长,还是某家企业部署了Agent后产生的副产品流量。运营需要要求归因系统提供"Agent流量占比"维度的数据看板,在做渠道预算分配时,将Agent流量从转化率计算中分离出来,避免基于失真数据做出投放决策。
常见问题FAQ
企业Agent代执行的安装算不算有效转化?
取决于你的定义。如果"有效转化"的标准是"人类主动下载并使用",那么Agent代执行的安装不算。如果标准是"最终产生了人类使用行为",则需要追踪Agent安装后是否有人类后续激活。关键不是下定义,而是归因系统必须能区分这两类流量,让你自己判断——而不是在不知情的情况下将两者混为一谈。企业Agent渗透正在让"什么算一次真实转化"这个问题变得前所未有的复杂。
我们没有面向企业用户,企业Agent渗透和我们有关吗?
有关,而且比你想的更近。当Hitachi的29万员工开始在日常工作中使用Claude,这些Agent可能访问你的网站、点击你的广告、下载你的App——哪怕你做的是C端产品。Agent的行为不受你的目标用户画像约束,它会按照指令去搜索和执行,可能在你完全不知情的情况下产生归因噪音。企业Agent渗透的影响范围不限于企业市场,它正在渗透整个数字生态的归因底座。
CTIT风控会不会把Agent流量误判为黑产伪造?
在现有的二元风控体系下,极有可能。Agent安装的CTIT分布特征(时间间隔均匀、设备指纹一致)与黑产自动化流量高度相似。这正是CTIT风控需要从"人/机"二元判断升级为"人/Agent/黑产"三元判断的原因。否则,你可能在反作弊报告中看到"可疑流量激增",而真实情况只是企业客户在用Agent测试你的SDK。误判的代价不仅是数据失真,更可能是错误切断一个真实的企业客户渠道。
行业动态观察

企业Agent渗透只是归因盲区的第一波。当AI Agent从企业内部走向消费者端——当普通用户也开始让Siri、Gemini Spark或Claude代为浏览、比较和下单——归因系统面临的将不再只是"企业流量噪音"的问题,而是"用户"这个概念本身的解构。一次下载的发起者可能是人类的一句语音指令,执行者是Agent,受益者是同一人类,但行为链路上的每一次HTTP请求都由Agent发出。归因系统需要在"意图"和"执行"之间建立新的映射关系,这不仅是技术问题,更是整个数字广告行业对"什么是转化"的根本性重新定义。
日立计划将内部Agent部署经验转化为面向客户的解决方案——这意味着企业Agent渗透将从企业内部走向社会基础设施。当电力系统、交通网络和制造产线中的每一个维护决策都由Agent执行时,归因不再只是广告行业的问题,而是整个数字化社会的感知基础设施问题。那些在2026年5月就意识到归因链路正在断裂的团队,将是最早开始重构归因体系的团队。
openinstall运营团队
2026-05-21
5
闽公网安备35058302351151号