自主智能体来了?谷歌Gemini Spark让AI替人干活,分发入口遭遇洗牌

自主智能体来了?这一颠覆性的交互范式已在Google I/O 2026大会现场完成首秀,谷歌Gemini Spark正以不可逆的姿态让AI替人干活,分发入口遭遇洗牌。北京时间2026年5月20日凌晨,谷歌CEO桑达尔·皮查伊(Sundar Pichai)在山景城海岸线剧场向数千名开发者宣布:"我们已坚定地迈入Gemini智能体时代。"Gemini Spark——这款运行在Google Cloud专用虚拟机上的24小时全天候个人AI代理,是这场范式跃迁的核心载体。它不是你打开才响应的聊天机器人,而是你合上笔记本电脑、锁屏手机后仍在后台默默干活的"数字分身"。当Gemini应用月活用户从4亿飙升至9亿、AI Mode搜索月活突破10亿、谷歌每日处理Token从4800亿暴涨至3.2千万亿,这不再是技术演示的数字游戏——9亿用户背后串接的Gmail、YouTube、Chrome与搜索构成的生态系,正在把"规模"本身变成这场Agent竞赛的护城河。当AI被授权代为处理邮件、金钱与购物,分发入口从"用户主动点击"变为"智能体代为决策",传统"页面点击→App下载→激活"的归因链路正在被一条全新的Agent意图流量路径取代。在这场由Gemini Spark标志的交互范式洗牌中,第三方App开发者必须思考:当AI替人干活的洪流席卷9亿用户,自己的跨端归因链路还能不能独立存活?
Gemini Spark:不是聊天机器人,是运行层
皮查伊对Gemini Spark的定义毫不含糊:"你在Gemini应用中的个人AI代理,协助你处理数字生活中的大小事,在你的指示下代你采取行动。"这段话的关键不在"协助",而在"代你"——Spark的设计目标不是回答问题,而是替你执行操作。
与所有现有AI助手最本质的区别在于运行模式。Spark运行在Google Cloud的专用虚拟机上,这意味着它不依赖用户设备在线。你合上笔记本电脑、把手机放进口袋,Spark仍在后台持续工作——监控邮件、整理待办、生成报告、追踪日程。用Josh Woodward(Gemini应用与Google Labs副总裁)的话说:"即便闔上筆電或鎖定手機螢幕,它依然會在背景持續運作。"
这种"常开式"(always-on)架构在AI产品史上尚属首次大规模商用落地。据报道,Spark基于Gemini 3.5模型构建,运行在Antigravity agent harness之上。它不是新模型,而是一个把谷歌既有AI能力组装成"能在Google Workspace内动手做事"的执行层。从架构视角看,Spark是把Gemini从"对话层"拉到了"运营层"——从"你问它答"变成"它看着办"。

三大模块:Tasks、Skills、Schedules——Spark如何替你干活
Spark的操作体系由三个核心模块构成,每个模块对应不同粒度的自动化需求。
Tasks(任务) :连动Google Workspace执行单次任务。用户说一句话,Spark拆解为多步操作并在跨应用间执行。官方演示中最典型的场景是:请Spark汇总所有邮件回复,追踪每位参与者携带的物品,自动向尚未回复的邻居发送后续邮件,并在Google Sheets中创建实时追踪表。更日常的例子是:请Spark分析每月信用卡账单,揪出隐藏费用或新增订阅项目。
Skills(技能) :让用户教Spark反复执行的客制化动作。这是Spark最精巧的设计之一。用户可以让Spark读过自己写过的50封邮件,整理成个人写信风格指南,存成"ghostwriter"这个Skill。未来Spark代拟邮件时,会自动调用这个Skill,按你的风格写作。或者让Spark关注来自孩子学校的邮件、记录特定事项的截止日期,自动彙整成每日摘要同步寄给自己和另一半。Skills的本质是把"人训练AI"从自然语言对话升级为可复用的工作流模板。
Schedules(调度) :依时间或条件自动触发。每周一早上9点扫描收件箱、整理上周重点邮件、给出本周优先待办清单,并在行事曆中预留深度工作时段——这就是一个典型的Schedule。它不需要你记住该做什么,Spark自己会在设定的时间点启动。
值得注意的是安全边界。Google强调,Spark不会主动读信,所有动作须由用户下指令触发。涉及花钱、寄信等高风险操作前,Spark会先询问用户确认。所有Google Workspace连接默认关闭,需用户手动开启。这种"用户授权+高风险确认"的分层控制,是Google在便利与隐私之间划出的第一道线。

Gemini 3.5 Flash:Agent时代的默认工作马
支撑Spark及多数Agent功能的底层模型,是同日发布的Gemini 3.5 Flash。据披露,3.5 Flash在编码与Agent任务的多项基准测试中超越了自家上代旗舰Gemini 3.1 Pro。
核心数据:Terminal-Bench 2.1(编码能力)76.2% vs 3.1 Pro的70.3%;GDPval-AA(真实世界Agent任务)1656 Elo vs 1317 Elo,跃升约342点;MCP Atlas(大规模工具使用)83.6% vs 78.2%;CharXiv Reasoning(多模态理解)84.2%。输出Token速度达289 tokens/秒,是其他前沿模型的4倍以上。定价$1.50/$9.00每百万Token,比3.1 Pro便宜约40%。
这组数字的重点不只是"模型变快"。对Agent产品来说,速度直接决定用户是否愿意把任务交给AI。如果Agent需要拆解任务、读取多个资料源、调用工具、再产出结果,模型反应太慢就会让体验崩掉。Google把3.5 Flash放在Spark、AI Mode与Antigravity后面,等于把它定位成Agent时代的默认工作马。
需要指出的是,3.5 Flash并非全能。在密集学术推理和长上下文召回基准上,3.1 Pro仍有优势——MRCR v2在128K上下文窗口中84.9% vs 77.3%,Humanity's Last Exam 44.4% vs 40.2%。Google对此的态度很坦诚:3.5 Pro已在内部使用,计划下月推出,补齐深度推理短板。但就Agent场景而言,速度+成本+工具调用能力的组合,远比绝对推理深度更有商业价值。
9亿用户的护城河:从"会回答"到"会行动"
皮查伊在Keynote上披露了一组令人咋舌的规模数据:Gemini应用月活跃用户从去年I/O的4亿增长至9亿,翻了一倍多;AI Mode搜索月活突破10亿;谷歌每月处理Token从4800亿飙升至3.2千万亿,增长7倍;2026年AI资本支出预计1800-1900亿美元,是2022年的约6倍。
这些数字的战略含义远超表面。9亿用户背后串接的Gmail、YouTube、Chrome与搜索构成的生态系,让Google形同将最难以复制的"规模"本身转变为这场AI竞赛的护城河。皮查伊明确表示,Spark本周先向受信任测试者开放,下周起面向美国AI Ultra订阅用户Beta测试。新增100美元/月的Ultra档位(原250美元降至200美元),把Spark的门槛降到与竞对主力产品同一价格带。

Spark的原生连接能力是竞对难以企及的结构性优势。ChatGPT Tasks只支持定时动作,不会持续后台运行,也没有对Google生态的原生访问。Claude桌面端需要连接器才能访问Workspace。而Spark开箱即连Gmail、Calendar、Drive、Docs、Sheets、Slides、YouTube与Google Maps,并通过MCP协议首批接入Canva、OpenTable与Instacart等第三方应用。The Next Web的评价直指核心:"Spark与竞争对手一样,被锁定在单一模型供应商之中。但Google控制着操作系统、浏览器、邮件客户端和云基础设施,Spark可以跨所有这些层运行,而不需要独立Agent拼接不同工具时面对的摩擦。"
搜索25年来最大变革:从信息检索到信息代理
Gemini Spark之外,Google I/O 2026另一条被低估的主线是搜索的彻底重构。Google搜索副总裁伊丽莎白·里德(Liz Reid)宣布,AI Mode改用Gemini 3.5 Flash为默认模型,新搜索框支持更长提问,原生支持跨文字、图片、档案、影片与Chrome分页的多模态输入。里德称之为"搜索框25年来最大升级"。
更深层的变革是"信息代理人"(Information Agents)。用户可以建立、客製、管理多个信息代理,让它们24小时在背景监看特定主题——产业动态、财经资料、长期研究问题。条件达成时,代理人通知用户,附上连结与摘要。搜索不再是"人输入关键字,Google回传连结",而变成一套由AI主动分解问题、监控资料源、生成答案与互动介面的系统。Google还同步提出generative UI(生成式介面):搜索结果可以依问题即时生成自订互动元件、视觉化或mini app。
对内容发布商而言,这意味着更多流量可能停留在Google自己的介面内。对App开发者而言,更致命的是:当用户通过Agent而非手动点击进入你的App,"渠道"的定义正在从"媒体平台"变为"智能体决策"。
从Agent代执行到归因链路断裂:分发入口的三重冲击
Gemini Spark代表的"AI替人干活"范式,对App分发与归因体系造成了三重结构性冲击。
冲击一:意图流量替代点击流量。 传统分发链路是"广告点击→H5落地页→应用商店→App激活",每一步都有可追踪的参数标记——广告来源、渠道标识、邀请码。但在Agent流量路径下,用户告诉Spark"帮我订一份DoorDash的氮气冷萃咖啡",Spark代为打开App、找到饮品、准备订单——用户手机始终放在口袋里。这条路径从"用户主动点击"变成了"Agent代为决策",中间的跳转过程对第三方App完全不可见。
冲击二:搜索入口内化。 当信息代理人在Google搜索内24小时运行、当生成式UI把交互留在Google自己的介面内,传统SEO流量将面临被截流的压力。用户不再点击蓝色链接跳转到你的网站或App——他们直接在Google的Agent介面内完成操作。据每日经济新闻报道,Google在I/O现场演示了"通用购物车"(Universal Cart)功能:用户在不同服务中看到想买的商品,直接加入购物车,Gemini自动24小时追踪价格波动、寻找特价、甚至警告零件不相容。整个购买路径不需要离开Google生态。
冲击三:归因参数在Agent通道中被清洗。 这是技术层面最直接的冲击。当Spark跨应用执行任务时,它在一个受控的虚拟环境中运行——Google自己称Spark"运行在专有的虚拟环境中"。这意味着传统前端点击追踪的UTM参数、深度链接的deferred deep link参数、应用商店的referrer参数,在Spark代为操作的通道中极大概率会被清洗或截断,就像微信沙盒对URL参数的处理一样。

工程实践:在Agent意图流量时代重建跨端归因链路
面对Gemini Spark等AI Agent带来的分发入口洗牌,第三方App不能把归因主权的希望寄托在Google"开放参数透传"的善意上。必须在自己底层部署独立于Agent生态的归因与追踪防线。
深度链接路由:击穿Agent意图黑盒的参数恢复引擎
当Spark代替用户发起跨端操作时,传统的前端点击追踪参数会被虚拟环境清洗殆尽。解决方案是在系统最底层部署基于内核信任的路由引擎——无论Spark以何种方式触达App,路由引擎都能在冷启动瞬间从云端提取加密的意图参数快照,将用户精准还原到指定业务场景。
核心机制:为独立触点单独签发加密动态Token,冷启动瞬间秒级S2S回调核销,强行找回流量发源地。即使意图参数在Spark的Agent通道中经历了多跳中转、被Google虚拟环境截断,只要Token签发时绑定了源端指纹,激活时的S2S回调依然能完成归因闭环。这不需要依赖Google的参数透传承诺——它只依赖你自己控制的加密签发与云端核销。
行业前瞻提示:针对大模型Agent跨端传参等前沿场景,openinstall技术实验室目前正与部分头部App展开定向的联合探索。
S2S端云协同对账:穿透Agent暗网的全渠道确权体系
不能指望Spark告诉你"这个用户是从哪个Agent推荐来到你的App的"。必须建立独立的与S2S端云对账体系——在云端记录每一次参数快照的上传时间、设备指纹和业务特征,在App激活瞬间与云端记录进行异步碰撞核对,独立完成归因闭环。
具体做法:在Spark触达用户之前,先在触点端(如H5页面、邮件链接、广告素材)签发携带加密参数的追踪链接。当用户被Spark引导至App时,即使中间经历了Google虚拟环境的中转,App激活时仍可向云端发起S2S核对请求,用设备指纹+时间窗口碰撞找到签发记录,完成归因。这种方式不依赖任何Agent平台的数据透传。

这件事和开发、增长团队的关系
面向开发与架构团队
当Gemini Spark等Agent通过MCP协议接入你的App接口,你需要为Agent流量预留独立的参数接收位置——不能假设所有流量都来自用户手动点击。Agent代为操作时,请求可能缺少传统UTM参数,但会携带Agent特有的上下文标识。开发团队需要在接口层同时兼容"人类点击"和"Agent代执行"两种流量模式,实施非对称加密与Nonce防重放攻击机制,确保Agent流量不会被伪造或劫持。多端ID策略也需重新审视——在Agent代为操作的场景下,"谁在操作"(Agent身份)和"谁在消费"(用户身份)可能不是同一个实体,链路必须能区分并正确关联两者。
面向产品与增长运营团队
当Agent流量入口逐渐取代传统的H5落地页和广告点击,"渠道"的定义正在从"媒体平台"变为"智能体决策"。增长团队必须重新定义主路径渠道的归因逻辑——不再只追踪"用户从哪个广告来的",更要追踪"哪个Agent的推荐触发了这次转化"。预算策略也需相应调整:将营销资金向能被自身完全掌控溯源路径的触点倾斜,而不是盲目为Agent生态中的"黑盒流量"买单。利用能力设计闭环,确保无论用户是通过Spark还是传统渠道进入App,都能被精准导航到指定业务页面并完成归因。
常见问题(FAQ)
Gemini Spark和普通Gemini助手有什么区别?
标准Gemini是被动式的:你打开它,提问,获得回答。Spark则是主动式的:它持续在Google Cloud虚拟机上后台运行,监控你已连接的应用,呈现相关信息,并能在既定边界内代表你采取行动——包括整理邮件、生成报告、甚至发起购买。核心差异在于"常开式后台运行"和"代为执行"。
Gemini Spark什么时候能用?
本周先向受信任的测试者开放,下周起面向美国Google AI Ultra订阅用户推出Beta版。Ultra新增100美元/月档位,原250美元档位降至200美元。今年夏天Spark将进入Chrome浏览器和macOS桌面版Gemini应用。台湾及其他地区用户目前尚无时间表。
Agent代为执行时,App的归因参数会不会丢失?
极大概率会。当Spark在Google虚拟环境中跨应用执行任务时,传统前端追踪参数(UTM、referrer、deeplink参数)面临与微信沙盒类似的截断风险。解决方案是在底层部署独立的S2S端云对账体系与加密动态Token签发机制,不依赖Agent平台的数据透传,用自己的加密签发与云端核销完成归因闭环。
行业动态观察
Gemini Spark的发布不是一个产品新闻,而是一个分发范式信号。当Google把Gemini从"会回答"推向"会行动",当搜索框从信息检索入口变成Agent调度中枢,当9亿用户的行为路径从"手动点击"转向"AI代执行"——整个App分发的底层逻辑正在被重写。
对应用开发者而言,这个趋势的实质影响不是"哪家的Agent更强",而是"我还能不能独立知道我的用户从哪来"。当Agent接管了用户与应用之间的交互入口,当追踪参数在跨端流转中被不可见地清洗,当搜索流量被生成式UI内化到Google自己的介面——第三方应用的归因体系、数据主权和商业闭环,都面临被吞噬的风险。
openinstall运营团队
2026-05-20
3
闽公网安备35058302351151号