Gemini Spark开启自主时代?Google I/O引爆的Agent分发入口洗牌
Google I/O 2026核弹级发布:Agent分发入口的全栈成型
Gemini Omni:一句话改写真实世界,视频创作平民化的核弹
大会全场焦点落在全新多模态AI系统Gemini Omni之上。这不是对现有视频生成模型的迭代,而是一个全新物种——谷歌DeepMind首席技术官科雷·卡武克库奥卢特意把它和Veo做了明确区分:"Veo是一个文本到视频的模型,而Gemini Omni是一个真正的多模态输入、多模态输出模型。"它能够接受文本、图像、音频和视频的任意组合作为输入,并在同样的模态上生成输出,所有处理在一个统一模型里完成,而非拼凑多个系统。

现场演示的震撼程度超出了大多数人的预期。第一段演示中,用户上传了一段户外散步短片,输入指令"把背景换成黑洞吞噬场景",Gemini Omni在保持骑行者和自行车运动轨迹完全不变的情况下,把整个环境替换成了黑洞吞噬的科幻场景。紧接着用户说"改成赛博朋克风格",画面风格随即切换。第二段演示,一段小提琴手的演奏视频被直接"传送"到雪山背景中,连运镜角度都能随对话指令实时调整。第三段演示更具科学深度——模型利用定格粘土动画精准解释了"蛋白质折叠"的概念,对重力与流体力学的理解已经渗透到了分子层面。

这种"一言变世界"的能力,直接将高门槛的后期制作与动画特效技术平民化。Omni首发即接入YouTube Shorts供创作者免费Remix影片,并支持用户创建个人"数字分身(Avatar)"来自动生成视频内容。好莱坞特效师与传统片商的生存空间遭到暴力挤压。
但争议同样猛烈。当虚拟与现实的边界被彻底抹平,AI生成内容的真假鉴别成为社会级问题。Google宣布所有Omni生成的影片都会强制嵌入SynthID隐形数字水印与C2PA内容凭证,用户可以通过搜索或Chrome浏览器右键一秒验证真伪。谷歌还宣布OpenAI、Kakao和ElevenLabs也将采用SynthID标准,该技术已应用于超过1000亿张图片和视频。然而,当"全自动化造假"的门槛降到零,这种事后防御能否阻挡假新闻海啸,依旧存有巨大疑问。值得关注的是,在OpenAI年初为释放算力而放弃视频生成工具Sora的背景下,谷歌此时推出Gemini Omni,是对自身基础设施实力的一次公开展示。
Gemini 3.5 Flash:中端碾压旗舰,Agent分发入口的"工作马"
如果说Omni是谷歌的愿景宣言,那Gemini 3.5 Flash就是Agent分发入口的引擎。皮查伊将它描述为谷歌内部的"游戏规则改变者",用起来"令人难以置信的愉悦"。他给出了一个直观的对比:Gemini 3.5 Flash的整体表现,全面超过了四五个月前还是谷歌顶级旗舰的Gemini 3.1 Pro。皮查伊的原话是:"Gemini 3.5 Flash比Gemini 3.1 Pro更好。它的性能能达到前沿模型的大约九成,速度快4倍,在Antigravity平台上甚至能快到12倍,而成本只有前者的三分之一到一半。"

具体数据更加震撼。输出速度方面,Gemini 3.5 Flash达到每秒289个token,是其他同类前沿模型的4倍。在Artificial Analysis的智能与速度指数图上,Gemini 3.5 Flash占据了右上角目前没人能触及的位置。基准测试成绩同样硬核:Terminal-Bench 2.1得分76.2%,GDPval-AA达到1656 Elo,MCP Atlas达到83.6%,CharXiv推理得分84.2%。一个定位中端的模型全面碾压上一代旗舰,这在行业中并不多见。

价格更是刀法精准。Gemini 3.5 Flash定价为每百万输入token 1.5美元、每百万输出token 9美元。横向对比,Claude Sonnet 4.6的输入价格是3美元、输出是15美元,Gemini 3.5 Flash整体定价低了40%到50%。皮查伊算了一笔账:谷歌头部大客户每天处理约1万亿个token,如果把其中80%的工作负载切换到Flash,一年能省超过10亿美元。Abacus.AI首席执行官Bindu Reddy公布的测试数据也印证了这一趋势——Gemini 3.2 Flash在编码与推理能力上已达到GPT-5.5约92%的水准,但运行成本却低15至20倍。
皮查伊用一句话总结了这个转变:"你不再需要在质量和速度之间二选一了。"这句话背后是谷歌的战略选择:它要的不是模型本身的利润,而是以模型为入口,撬动整个Agent分发入口的生态。Gemini 3.5 Pro正在内部测试,预计下个月推出。卡武克库奥卢明确了模型更新节奏:大约每六个月一次。一个每六个月就能用三分之一成本超越前代旗舰的模型,意味着企业在制定技术路线图时不能再拿静态眼光来评估性价比。
搜索框25年最大改版:从吐链接到长应用,分发入口的质变
谷歌搜索产品负责人莉兹·里德在台上说了一句话:"这是自我们那个标志性搜索框首次亮相以来最大的升级。"沿用了超过四分之一世纪的Google搜索框迎来了历史性改版。升级至Gemini 3.5 Flash的AI Mode不再只是吐出冷冰冰的网页链接,而是演变成能处理文字、图片、档案、视频、甚至Chrome分页内容的超级入口。

输入端的变化只是前奏,输出端的质变才真正改变了一切。谷歌把Antigravity 2.0背后的智能体编程能力注入搜索,推出了Generative UI(生成式用户界面)。Gemini 3.5 Flash拿到用户的问题后,会从零开始规划回答方案,输出交互式界面而非传统链接列表。大会演示了一个案例:用户在搜索框里输入关于Gyroid图案的问题,搜索结果不再是传统的十条蓝色链接,而是一个可以旋转三维结构、查看不同截面形态的交互式可视化页面,整个过程不用跳转到其他网站。另一个案例中,用户随手抛出复杂的周末行事历要求,搜索引擎在数秒内启动背后的编码代理,直接在画面上生成专属的"Mini App"互动界面,自动串联Gmail、相片和行事历。
这种颠覆性改动背后隐藏着巨大的商业争议。当网民留在Google原生界面就能解决天体物理学问答、订机票或规划行程,根本不需要再点击进入第三方网站。过去网站赖以为生的SEO生态恐将彻底崩溃。谷歌将全球流量据为己有,变相切断了内容创作者与中小企业的生存命脉。AI概览(AI Overviews)月活已超过25亿,AI模式(AI Mode)月活突破10亿,查询量每季度翻倍。当搜索不再是"搜"而是"做",传统网站的流量模型正在被从根部瓦解。
Gemini Spark:7×24小时替你干活替你花钱,AI管家还是数字监狱?
Gemini Spark是这场I/O大会最核心的产品发布,也是Agent分发入口从概念走向落地的关键节点。据确认,Gemini Spark是一个7×24小时运行在谷歌云专用虚拟机上的AI。即使你关了设备,它也能在后台继续工作。Google Labs和Gemini应用副总裁乔什·伍德沃德用了一个极具画面感的描述:"当你使用它时,几乎感觉就像你把东西甩到身后,Spark会接住它并完成工作。"

Spark深度集成了Gmail、文档、表格和幻灯片,同时通过MCP深度连接了超过30款主流第三方应用——Adobe、Asana、Dropbox、Lyft、OpenTable、Uber、Zillow、Zocdoc全在列表上。这意味着Spark不是一个在单一App里运转的助手,而是一个能跨平台串联行动链条的自主智能体。它可以自主翻阅用户上个月的银行账单,精准捕捉隐藏的连续扣费订阅;也可以实时检索全家人的邮件与日程,在清晨自动生成家庭日常简报。
但Spark最引发争议的功能,是它获得了代理消费的权力。谷歌同步推出了Agent Payments Protocol(AP2),允许用户给智能体设定支付边界——指定哪些品牌、设置消费上限、限定哪些商家。伍德沃德用了一个巧妙的比喻:"我们团队认为这很像给一个青少年第一张借记卡。会有各种限制和约束,这也是我们设计Spark的方式。"目前用户需要在交易执行前批准,AP2同时提供永久的数字凭证记录以备退货和争议。但据,流出的服务描述中写道Spark"may do things like share your info or make purchases without asking"——这意味着AI代理未来可能具备自主下单与自主资料分享能力。且截至目前谷歌尚未发布Spark专属隐私政策。
配合Spark发布的还有两项新服务:一是全天候监控网络的信息智能体,可以主动追踪用户关注的价格、股票或话题变化并及时提醒;二是基于谷歌钱包的Universal Cart(AI通用购物车),横跨搜索、Gemini App、YouTube和Gmail,支持跨不同电商网站统一管理和结算。Nike、Target、Walmart、Sephora等大型零售商已接入首批结算功能。Universal Cart的背后是Universal Commerce Protocol开放标准,亚马逊、Meta、微软、Salesforce和Stripe均已采纳。
一批受信任的测试者本周拿到了Spark的访问权限。下周,Gemini Spark将向美国Google AI Ultra订阅用户推出测试版。AI Ultra是谷歌同步推出的新订阅套餐,月费100美元,面向开发者、技术负责人和高级创作者,提供Antigravity优先访问权、更高使用限制和Omni Flash访问权。原250美元的顶级Ultra降到200美元,Pro维持19.99美元。Spark今年夏天还将入驻Chrome浏览器,在任何网页上都能直接调用。Android 17的状态栏中也嵌入了Android Halo视觉指示器,以微妙的光圈动画显示Agent的实时工作状态。
Antigravity 2.0:93个子代理12小时造操作系统,开发范式的核弹
六个月前Antigravity还只是一个编码环境,现在它已经被改造成"用于开发和管理自主AI智能体团队的平台"。卡武克库奥卢指出,团队"和我们的智能体开发平台Google Antigravity一起开发了Gemini 3.5 Flash",Flash的速度、工具使用、长上下文推理和代码生成能力,都针对开发者在平台上的工作负载做了专门优化。

大会现场展示了一个极端工程案例:利用Gemini 3.5 Flash协调93个子代理并行工作,仅花费12小时、耗资不足1000美元API费用,便从零编写出完整操作系统核心,更成功自动补写驱动程序来运行游戏《DOOM》。不到一分钟就能自动盲写2000行代码的恐怖速度,意味着初级程序员的技术壁垒在一夜之间被彻底摧毁,"Vibe Coding"时代正式宣告技术平权的残酷到来。
Antigravity 2.0以独立桌面应用的形式出现,同时提供命令行和SDK。开发者可以同时调度多个智能体:一个写网站代码,一个生成品牌素材,第三个规划产品架构,这些智能体并行干活、统一管理。一同推出的还有托管智能体和CodeMender。托管智能体通过一次API调用就可以在隔离的Linux环境中启动,进行推理、使用工具和执行代码。CodeMender是一个安全智能体,利用Gemini的高级推理能力自动发现并修复关键代码漏洞。卡武克库奥卢认为,当智能体系统写的代码越来越多时,这种能力是必不可少的。
支撑这一切的是一个正在加速的数据飞轮。今年3月,开发者在Antigravity上每天处理约0.5万亿个token。到5月中旬,这个数字飙升到超过3万亿,大约十周内增长了六倍。皮查伊称之为"一个强大的反馈循环,它让我们能够持续改进3.5系列模型"。375家以上的外部客户各自处理超过1万亿token。
但竞争压力同样巨大。科技记者Alex Heath引述多位消息人士指出,Google DeepMind内部对AI编码竞争感到高度焦虑,尤其是Anthropic旗下Claude系列在过去一年已逐渐成为开发者社群的主流选择。Google内部频繁使用的Antigravity推出4个月仅取得约6%的开发者采用率,与Claude Code及Codex相比市场影响力仍有差距。XDA实测也指出,在相同任务下Claude Code能准确理解复杂创意需求,但Antigravity生成结果明显较粗糙。AI编程已从工程师工具扩大至产品经理、设计师等非技术族群——OpenAI Codex与Claude Code已能让用户通过自然语言生成原型程序,甚至直接将Figma设计稿转换成前端代码。Google目前尚未推出足以主导此市场的产品。
第八代TPU双芯战略与1900亿基建:Agent分发入口的算力底座
Agent分发入口的运转需要史无前例的算力支撑。谷歌首次推出"双芯片策略":专门用于大规模预训练的TPU v8t,以及针对高并发推理极限优化的TPU v8i。TPU v8t单个Pod可塞下9600颗芯片,集群总算力121 ExaFLOPS,较上一代提升约3倍,性价比提升2.7倍。集群可扩展至百万级芯片,将大模型训练周期从数月压缩至数周。

更根本的突破在于底层软件栈。通过JAX与Pathways的深度重构,谷歌成功在全网范围内实现跨越多个物理站点的协同训练,在全球范围内无缝串联起超过100万个TPU。模型训练不再受限于单一巨型数据中心的物理围墙。这种技术突破直接瓦解了过去堆砌单体机房的军备竞赛。
负责推理的TPU v8i则主打低延迟,推理性价比提升80%,大缓存设计显著减少内存访问延迟。谷歌在过去27年搜索工程中提炼的核心信条在这颗芯片上体现得淋漓尽致:在AI时代,延迟依然决定着应用的生死。TPU v8i在推理执行的每一个微小步骤上都进行了硬件级加速,为上层智能体的实时响应提供了可能。
皮查伊透露,谷歌2026年的资本支出预计在1800亿到1900亿美元之间,是四年前310亿美元的差不多六倍。谷歌模型API每分钟处理大约190亿个token,自有产品每月处理超过3200万亿个token。这种级别的基建投入,是Agent分发入口能够7×24小时不间断运转的物理保障。
三强格局:谷歌押注分发入口,对手拼模型智能
谷歌在I/O大会上没有拿出一个让行业惊叹的"最强模型",但做的事情更实际也更有野心。竞对方面,Anthropic正以惊人速度聚拢人才与技术叙事——Polymarket数据显示,交易者给Anthropic在6月底拥有最佳AI模型的概率定价为65%,而OpenAI仅为4%。Anthropic估值在二级市场近期已超过1万亿美元,超越OpenAI,目前正在以约9000亿美元估值洽谈300亿美元新一轮融资。英国AI安全研究所(AISI)近期测试指出,Anthropic的Mythos是首个同时通过两项高强度网络安全测试的AI模型,而GPT-5.5仅通过其中一项。AISI甚至坦言,目前评测框架已逐渐跟不上最新模型能力演进速度。Anthropic同步发布Opus 4.7 Fast模式,并将Claude Code额度提高50%。OpenAI近期替Codex加入ultrafast模式,速度提升2至3倍,并推出企业转移补贴方案。
但谷歌的战略并非单纯追赶AI编码工具,而是押注更大规模的多模态AI生态。科技评论人士Haider指出,谷歌真正的优势在于其拥有Android、Gmail、搜索与Chrome等10亿级分发入口。一旦Spark全面部署,用户邮件、行程、购物与浏览数据都将成为Gemini未来训练的重要数据来源。这种结合分发平台与AI Agent的模式,被认为是OpenAI与Anthropic短期内难以复制的竞争优势。当Spark在Chrome浏览器和Android状态栏中无处不在时,Agent分发入口不再是一个独立产品,而是一种操作系统级的存在。
从Agent分发入口到归因链路的三层断裂
当谷歌把搜索框变成Mini App生成器、让Spark 7×24小时替用户跨端执行任务、用Universal Cart横跨多个电商完成闭环结算,一个被忽视的系统性风险正在浮出水面:Agent分发入口的崛起,正在从三个层面同时撕裂传统的安装归因链路。

第一层断裂:意图替代点击。 当Spark替用户监控收件箱并自动处理问题,当信息智能体替用户追踪价格变动并触发提醒,用户本身并没有发起任何点击行为。传统归因模型的第一环——"用户点击广告或链接后安装App"——在这个场景下直接消失了。安装行为可能由Agent的自主决策触发,而非人类的主动意图,这意味着点击到安装之间的因果关系链被彻底切断。
第二层断裂:搜索内化流量。 当AI Mode直接在搜索结果页生成交互式Mini App和Generative UI,用户不再需要跳转到第三方网站。过去一个用户从Google搜索→点击广告链接→跳转H5中间页→跳转应用商店→安装App的完整归因链路,现在被压缩成了"搜索框内直接完成"。UTM参数、referrer信息、广告跳转标记——这些传统归因赖以运转的前端追踪信号,在搜索内化的场景下全部归零。
第三层断裂:参数清洗。 当Agent代替人类在不同应用和网站之间导航时,它不会像人类浏览器那样携带cookie、referrer和UTM参数。Spark通过MCP协议直接调用Adobe、Uber、Zillow等第三方应用的API完成任务,这条路径完全绕过了传统Web跳转链路。深度链接参数、标记、渠道归因代码——在Agent的API直连模式下全部被清洗掉。
三层断裂叠加的后果是:当Agent分发入口成为主流流量通道,传统前端追踪体系将面临系统性失灵。企业看到的不再是"哪个渠道带来了多少安装",而是一片归因黑洞。
工程实践:分发入口被Agent接管后,归因体系如何重建

面对Agent分发入口带来的归因链路断裂,工程层面的应对思路需要从"前端追踪"转向"后端确权"。核心在于两个能力的重建。
第一,从跳转工具升级为场景还原协议。 传统深度链接解决的是"点击链接→打开App→跳转到对应页面"的线性场景。但在Agent分发入口下,用户可能从未发起过点击——安装由Spark的推荐触发,或由搜索Mini App的内嵌引导完成。此时需要的是服务端延迟深度链接能力:当App被安装并首次启动时,通过设备指纹对撞(IP+UA+屏幕分辨率等多维快照)在云端完成H5来源与App实例的匹配,将Agent分发入口中丢失的来源参数在服务端补全。这种"先安装、后归因"的异步匹配机制,是穿透Agent分发入口归因黑洞的第一道防线。
第二,从单点追踪升级为多源交叉归因。 当传统UTM和referrer在Agent分发入口中全面失效,归因系统必须同时接入多个数据源——广告平台回调、应用商店来源、搜索引擎智能体调用日志、MCP协议交互记录——并通过概率匹配模型将分散的触点数据拼合为完整归因链路。关键在于,当Agent分发入口带来的安装无法通过单一信号归因时,全渠道统计系统需要通过时间窗口对齐、设备指纹比对和转化路径重建,还原出"用户在Spark推荐下安装"或"搜索Mini App引导安装"的真实来源。
这两项能力的底层逻辑是一致的:不再依赖前端信号(因为前端信号已被Agent清洗),而是通过后端数据对撞和多点交叉验证来重建归因链路。
行业前瞻提示:目前Agent分发入口的归因重建仍处于工程探索阶段,延迟深度链接与全渠道统计的异步匹配方案已在成熟广告归因场景中验证,但针对Agent自主决策触发安装的归因链路,行业尚无统一标准。本节所述方案为基于现有技术能力的推演路径。
这件事和开发/增长团队的关系
面向开发团队: 当Agent分发入口成为新的流量入口,应用架构需要适配"无前端跳转"的安装场景。开发者需要在App首次启动时主动触发延迟深度链接的匹配请求,而不是等待前端URL参数传入。同时,应用需要为Agent调用场景提供结构化的API端点——当Spark通过MCP协议调用你的服务时,你的系统需要能在服务端记录这次交互并将其纳入归因链路,而非仅仅在App端统计DAU。
面向增长团队: 当搜索流量被AI Mode内化、当Agent推荐替代了传统广告点击,增长团队需要重新定义"渠道"的含义。过去按UTM来源划分的渠道模型,在Agent分发入口下不再适用。增长团队需要建立多源归因看板,将Agent分发入口作为一个独立的流量类别进行监控和优化,同时关注系统给出的跨端归因数据,才能在Agent分发入口时代依然掌握真实的获客成本和渠道ROI。
常见问题FAQ
Gemini Spark是什么?和普通的AI助手有什么区别?
Gemini Spark是谷歌在2026 I/O大会上发布的7×24小时云端个人AI代理。与普通AI助手"你问我答"的被动模式不同,Spark在后台持续运行,即使你关闭设备也不会停止。它能自动读邮件、追踪日程、跨平台完成任务,甚至通过AP2协议获得代理消费权力。本质上,Spark是Agent分发入口从概念走向消费级产品的标志。
Agent分发入口对App安装归因有什么影响?
影响是系统性的。当AI Agent替用户执行操作时,传统归因依赖的"用户点击→跳转→安装"链路被三层断裂:意图替代点击(Agent自主决策)、搜索内化流量(用户不离开Google生态)、参数清洗(Agent直连API绕过Web跳转)。这导致前端追踪信号全面失效,需要通过服务端延迟和重建归因链路。
搜索框生成Mini App后,传统网站还有流量吗?
这是I/O大会最敏感的问题。当AI Mode直接在搜索结果页生成交互式应用,用户不再需要点击进入第三方网站。AI概览月活已超25亿,AI模式月活破10亿。过去网站依赖SEO获取流量的模式正面临根基性动摇。对于App开发者而言,场景也需要从"搜索引擎→网站→应用商店"的旧路径,转向适配Agent分发入口的新归因架构。
行业动态观察
谷歌在I/O 2026上释放的信号极为明确:AI竞赛的核心战场已从"谁的模型最聪明"转向"谁的Agent分发入口最无处不在"。Omni负责感知,Spark负责执行,Antigravity负责开发,搜索框负责分发——四层架构各司其职,底层由TPU双芯和1900亿美元基建托底。这种全栈Agent分发入口的模式,是OpenAI和Anthropic在短期内无法复制的。
但风险同样显著。Spark"未经询问即完成购买"的能力引发隐私与安全双重忧虑;搜索框内化流量正在摧毁一个运行了25年的SEO生态;Antigravity在开发者端的竞争力仍落后于Claude Code。谷歌拥有最广的分发入口,但入口的宽度能否转化为Agent生态的深度,取决于用户对自主智能体的信任能否建立。
对于归因行业而言,Agent分发入口的崛起是一个不可逆的结构性变量。当AI代理成为用户与数字服务之间的默认中介,前端追踪体系必须完成从"追点击"到"追意图"的范式迁移。后端指纹对撞、多源交叉归因、
openinstall运营团队
2026-05-21
8

闽公网安备35058302351151号