谷歌震撼发布：AI智能体全面融入搜索、浏览器、手机与眼镜，Gemini 3.5 Flash、视频模型Omni及AI助手Spark齐亮相！一文读懂2026谷歌新动向

2026-05-20 08:04:06未知作者:徽声在线

北京时间5月20日凌晨1点，谷歌I/O 2026开发者大会在美国加州山景城盛大启幕。

与往届大会不同，今年的发布会重点并非聚焦于单一模型或功能，而是谷歌进行了一次全面而深刻的系统性变革——将AI智能体深度融入所有核心产品入口。

从搜索框到Chrome浏览器，从Android手机到智能眼镜，Gemini不再局限于对话助手的角色，而是进化为一个能够持续运行、跨应用执行复杂任务的AI代理。它能够为用户追踪信息、生成内容、调用各类工具，甚至直接完成下单和操作流程，极大地提升了用户体验。

在开场演讲中，谷歌CEO桑达尔·皮查伊（Sundar Pichai）兴奋地表示，过去12个月是谷歌“飞速发展”的辉煌时期。据统计，谷歌每月处理的Token数量已高达3.2千万亿个，同比增长了7倍；同时，Gemini应用的月活跃用户数也达到了惊人的9亿。

然而，尽管谷歌在AI领域取得了显著成就，但截至美股5月19日收盘，谷歌A的股价仍下跌了2.34%。

谷歌每月Token处理量图片来源：直播视频截图

Gemini月活跃用户数图片来源：直播视频截图

Ask YouTube：开启AI视频搜索新时代

步入“对话+精准跳转”新纪元

大会开场后的产品展示环节，谷歌首先介绍了YouTube和办公场景中的AI创新功能。

谷歌隆重推出了“Ask YouTube”功能。这一功能在YouTube网站中融入了聊天机器人式的交互界面，用户只需通过自然语言描述，即可引导系统精准找到符合搜索意图的视频片段，并直接跳转至相关部分。谷歌表示，该功能目前正在紧张测试中，并计划于今年夏季在美国更广泛地推出。

随后，谷歌展示了Docs Live这一创新产品。不同于传统文档编辑工具，Docs Live允许用户直接通过语音与Google Docs进行对话，无需输入具体提示词。在现场演示中，一名用户需要为高中职业日准备校友演讲，Gemini自动提取了演讲要点，从Google Drive中获取了简历信息，并从Gmail中调取了活动详情，随后帮助用户轻松创建和编辑了文档。

从TPU 8到Gemini 3.5 Flash：谷歌全面升级AI底层架构与生成能力

在介绍完应用层功能后，皮查伊将话题转向了AI基础设施。他表示，谷歌在AI基础设施方面的支出正在大幅增长，预计今年的支出将达到1800亿美元至1900亿美元。

谷歌资本支出图片来源：直播视频截图

谷歌还重点介绍了其自研的AI硬件TPU（张量处理单元）。谷歌称，最新一代TPU 8将分为两类：一类专注于大规模AI训练，另一类则用于模型在实际服务用户时的快速响应。

谷歌最新训练用TPU 8t 图片来源：直播视频截图

紧接着，DeepMind首席执行官德米斯·哈萨比斯（Demis Hassabis）登台，介绍了谷歌在“世界模型”方面的最新进展，并发布了Gemini Omni。这是一款基于谷歌在世界模型领域积累的新型视频生成模型。据谷歌介绍，Gemini Omni可以根据多种输入生成视频，并支持对话式编辑。用户可以通过自然语言修改角色、背景和场景，也可以上传自拍并将其转换成其他风格或内容。哈萨比斯表示，未来Omni将能够根据任何输入生成任何输出，而首款模型Gemini Omni Flash将于今年夏季正式推出。

Gemini Omni 图片来源：直播视频截图

在AI生成内容识别方面，谷歌还扩展了SynthID验证功能。用户现在可以询问一张图片是否由AI生成。皮查伊在现场以一张他和另外几个科技巨头CEO的梗图为例，生动展示了该AI检测能力。

皮查伊测试SynthID能力图片来源：直播视频截图

随后，皮查伊发布了Gemini 3.5 Flash这一重磅产品。他表示，该模型相比此前的Gemini 3.1速度更快，专为更复杂的智能体任务、更长工作流和现实世界开发者使用场景而构建。谷歌称，Gemini 3.5 Flash生成输出Token的速度大约是其他前沿模型的4倍，因此尤其适合AI Agent和编码工具。

Gemini 3.5 Flash生成速度为其他模型的四倍图片来源：直播视频截图

Antigravity与Gemini Spark：智能体从编程走向个人助理

模型发布之后，谷歌的软件开发平台Antigravity负责人瓦伦・莫汉（Varun Mohan）登台，详细介绍了智能体编程平台Antigravity 2.0。

该平台被谷歌定位为面向AI Agent时代的编程工具，直接对标Anthropic的Claude Code和OpenAI的Codex。瓦伦・莫汉表示，谷歌通过Antigravity 2.0及其代理系统从零开始构建了一个操作系统，整个过程所消耗的Token成本不到1000美元。他还强调，Antigravity 2.0“毫不掩饰地以智能体为先”。

谷歌Antigravity 图片来源：直播视频截图

紧接着，皮查伊发布了Gemini Spark这一创新产品。谷歌将其定义为一款全天候运行的个人AI助手，基于Gemini 3.5构建，并运行在Google Cloud虚拟机上。用户可以通过Gemini应用轻松访问Spark。按照谷歌的说法，即便用户合上笔记本电脑，Spark也可以继续工作，同时也能在智能手机上流畅运行。

谷歌表示，Gemini Spark未来将与第三方工具进行深度集成，相关工具将陆续公布。该功能本周将面向受信任测试人员推出，下周面向美国Google AI Ultra订阅用户开放。为了进一步降低成本，谷歌还推出了价格更低的Ultra套餐，起始价为100美元/月。今年夏天，Spark也将在Chrome浏览器中正式运行。

Gemini Spark 图片来源：直播视频截图

谷歌还展示了如何通过Gemini Spark来策划一场精彩的街区派对。

在演示中，Spark汇总了所有回复，追踪了每位参与者携带的物品，自动向尚未回复的邻居发送了后续邮件，并在Google Sheets中创建了一个实时回复追踪器。它还生成了一份Google Slides派对宣传册，其中包含了充气城堡和社区规则等详细信息，这些信息都来自Google Drive中的文件。

Gemini Spark演示图片来源：直播视频截图

此外，谷歌还计划发布Android Halo这一创新产品，用于承载其在安卓手机平台上的AI智能体。按照谷歌的设想，Android Halo将成为手机上AI智能体运行状态和任务进展的可视化入口，为用户提供更加直观、便捷的操作体验。

Android Halo 图片来源：直播视频截图

AI Mode和AI Overview：谷歌用智能体重构搜索体验

随后，谷歌搜索副总裁伊丽莎白•里德（Liz Reid）登台，详细介绍了AI Mode和AI Overview的相关进展。

谷歌推出了全新的搜索框设计。新搜索框不仅具备传统自动补全能力，还能提供AI生成的搜索建议，并支持多模态搜索，允许用户在搜索请求中上传照片和视频，极大地丰富了搜索方式。

谷歌搜索新搜索框图片来源：直播视频截图

更大的变革在于AI智能体正式进入搜索领域。谷歌介绍，全新推出的信息智能体可以全天候在后台运行，用于回答“极其复杂”的问题，例如追踪特定行业的市场动态。用户无需反复手动搜索，智能体可以持续监控网络，并在相关信息发生变化时及时更新结果。谷歌计划在今年夏季推出这类智能体，并在之后增加更多专业化代理。

信息智能体图片来源：直播视频截图

谷歌搜索产品副总裁罗比·斯坦（Robbie Stein）介绍，AI Mode还将接入Antigravity的强大编码能力。谷歌称，搜索未来可以在交互界面中生成可交互画面，并帮助用户创建“迷你应用”。例如，当用户想寻找周末适合全家参与的娱乐活动时，搜索可以从零开始生成一个周末活动计划表，为用户提供更加个性化的服务。

AI Mode演示图片来源：直播视频截图

Universal Cart：AI智能体升级购物体验

能追踪优惠、监控价格变动

在搜索之后，谷歌广告和商务副总裁Vidhya Srinivasan登台展示了同样具有智能体元素的购物相关功能。

图片来源：直播视频截图

谷歌宣布了一系列全球合作关系，这些合作将使用开源的通用商业协议，服务也将扩展到美国以外的新地区，为用户提供更加便捷、全球化的购物体验。

图片来源：直播视频截图

谷歌还发布了Universal Cart这一创新产品。这是一款由AI智能体驱动的通用购物车，可在Google服务中无缝使用，包括搜索和Gemini应用，后续还将支持YouTube和Gmail。用户在搜索、与Gemini聊天、观看YouTube或阅读Gmail时，都可以轻松把商品加入同一个购物车。

谷歌称，Universal Cart可以追踪优惠、监控价格变动、显示价格历史、在商品重新上架时提醒用户，甚至还能识别兼容性问题。例如，用户在组装一台定制电脑时，如果某个部件不兼容，购物车会及时进行提示，避免用户购买到不合适的商品。

Universal Cart演示图片来源：直播视频截图

随后，谷歌介绍了Gemini应用的重大更新。Gemini应用将采用新的Neural Expressive设计语言，带来包括交互式图像反馈、生成视频时间线在内的全新体验。Gemini Omni也将接入该应用，支持用户创建和编辑视频，为用户提供更加丰富的创作工具。

智能体也将加入Gemini应用，为用户提供更加个性化的服务。第一个名为“每日简报”的智能体，可以利用用户的Google服务信息，概览当天行程，让用户随时掌握自己的日程安排。高级用户还可以构建自己的智能体工作流，满足更加复杂的需求。

每日简报图片来源：谷歌

Android XR智能眼镜：从导航到下单，无需掏手机

在硬件方面，谷歌预告了由Gentle Monster、Warby Parker与三星合作推出的Android XR智能眼镜。这款智能眼镜将有两种形态：一种是可以与用户对话的语音眼镜，另一种是可以将信息投射到用户面前的显示眼镜。Gentle Monster和Warby Parker联名款属于语音眼镜，计划于今年秋季上市，并可与iOS和Android设备配对使用，为用户提供更加便捷、智能的穿戴体验。

Android XR智能眼镜图片来源：直播视频截图

现场演示中，谷歌人工智能与眼镜产品负责人Nishtha Bhatia使用智能眼镜轻松点了一杯咖啡。Gemini为她导航到一家咖啡馆，打开手机中的DoorDash外卖平台，并准备好她常点的氮气冷萃咖啡订单。用户仍需最终批准下单，但Gemini已完成打开应用、找到饮品和准备订单等步骤，而手机始终放在口袋里，无需掏出操作。

智能眼镜演示图片来源：直播视频截图

（免责声明：文章内容和数据仅供参考，不构成投资建议。投资者据此操作，风险自担。）

记者|岳楚鹏

编辑|段炼高涵杜波

校对|金冥羽

｜每日经济新闻 nbdnews 原创文章｜

未经许可禁止转载、摘编、复制及镜像等使用

点击展开全文