谷歌全军出击!誓把一切“装”上Gemini,还有XR眼镜引爆全场
出品|网易科技《态度》栏目
作者|袁宁 丁广胜
发自山景城海岸线圆形剧场Google I/O大会
一分钟速览2025 Google IO,Gemini 2.5 Pro来了(来源:逆向思维)
“我听说今天是双子星季(Gemini Season)的开始,”Sundar Pichai 一上台就抛出冷笑话,“但我不明白这有什么特别的。在谷歌,每天都是双子星(Gemini)季。”
2025年 Google I/O 主题演讲刚一开场,Pichai 就用 Gemini 做了个梗,引得全场轻笑。
5月20日的山景城,气氛热烈,网易科技排队一小时挤进会场前排,和来自全球的开发者、分析师、媒体一同见证这场发布。
而就在 I/O 开幕前,微软才刚刚开了 Build,大张旗鼓讲“AI Agent”;而苹果也官宣 WWDC 定档6月。
压力之下,谷歌也不再藏牌:升级后的 Gemini 2.5系列模型、全新图像与视频生成模型 Veo3和 Imagen4、音乐模型Lyria2,AI 电影制作工具 Flow,备受关注的Android XR,甚至连 AI 虚拟试衣和 Gmail 智能回复都安排上了。
一句话:Gemini 正以“操作系统”的姿态,全面融入谷歌的生态,进入我们的日常设备与工作流程中。
发布会临近结束,谷歌在屏幕上打出“AI 提及次数:92”这一数字,现场再次爆发出笑声。
去年,这个数字是120,堪称“AI 烂大街”的笑话起点。而今年的减少,不仅是一种克制,也是一种信号:AI 不是用来说的,而是要落在产品里的。
01 Gemini 2.5再进化:速度快、推理强、会操作电脑
不出意料,Sundar Pichai 一上来就把焦点交给了 Gemini。
他强调最新的 Gemini 2.5 Pro 表现抢眼,是“基准测试中的顶级选手”,“在 Cursor 上增长最快” “性价比最高。”
这次 Gemini 2.5系列更新的重点有三:
首先,原生支持音频生成,不再只是图文视频那一挂,语音领域也安排上了。
其次,推出一项名叫“Deep Think”的实验性增强推理模式,模型不再是一拍脑门地回答,而是“多想一步”,并列出多个假设之后再输出结果,尤其在复杂数学和编码问题上表现亮眼。
最后,具备原生电脑操作能力,开始学会“动手”了。
另外,开发者体验也在同步升级。谷歌引入了“思维摘要”和“思维预算”功能,让模型的推理过程更透明、也更可控。你不仅能知道它是怎么想的,还能设定它“最多想多久、想多细”。
谷歌还为 Gemini API 和 SDK 加入了对 MCP 工具的支持,等于是打开了更多开源工具的工具箱。
02 Veo 3、Imagen 4、Lyria 2齐发,Flow直接让你拍电影
这次谷歌的多模态生成模型更新,显然是奔着“全栈AI创作者工具箱”来的。
发布会一口气讲完三大主角:Veo 3、Imagen 4、Lyria 2,外加一款新工具 Flow,试图把创作这件事变成“一句话起片”的全流程自动化。
视频生成模型Veo 3接棒了 Veo 2的位置,还加上了与之相配的配乐:从街道喧嚣到鸟叫虫鸣,甚至能让角色开口说话,口型对得也很准。
而且它还强调理解能力:你在提示里讲一个简短小故事,它会给你剪出一段完整、有节奏感的镜头内容。也就是说,它不只是拼图,而是开始“导演”了。
目前,Veo 3已面向美国的 Gemini Ultra 用户开放,也能在企业级 Vertex AI 中使用。
其次是图像生成模型Imagen 4,主打两个字:清晰。
水珠、毛发、织物细节一个不少,连拼写排印都照顾到了,贺卡、海报甚至漫画都能直接生成。分辨率最高能到2K,适合商用输出场景;风格上,既能写实也能玩抽象,灵活度不低。
后面谷歌还要推出一个“加速版”,声称比 Imagen 3快10倍,赶图党们可以期待。
Imagen 4已接入 Gemini 应用、Workspace 的 Slides、Vids、Docs 等产品,走的依然是“平台+场景一体化”路线。
音乐方面,谷歌悄悄扩大了对 Lyria 2的开放权限。虽然没大张旗鼓,但这套系统依旧是业内最顶尖的 AI 音乐生成模型之一。
而最有趣的是 Flow——这款看起来像是AI导演助手的工具,背后集成了 Veo、Imagen 和 Gemini 的能力。你可以用一句话描述场景,然后 Flow 来帮你安排演员、布置场景、选风格,最后剪出一段完整视频。它不仅是一个“生成器”,更是一个创作流程管理平台。
Flow 目前只在美国区对 Pro 和 Ultra 订阅者开放,谷歌表示“很快全球上线”——这话我们听过很多次了。
值得一提的是,会前的媒体沟通会上,谷歌表示未来生成内容依旧会带有 SynthID 水印。并透露,谷歌已经给超过100亿张图片、视频、音频和文本打上了这枚“AI身份标签”。
03 AI 模式成Google搜索的未来,一键试衣购物
搜索,是谷歌的“祖传主业”,也是AI时代最不能输的阵地。
这一次,谷歌不再只是“在搜索里加AI”,而是让AI变成搜索本体,推出的 “AI 模式”,将Gemini 正式纳入搜索栏。
该更新将于周三开始向年满18岁的英语用户推出,但仅限于每月20美元的 Google AI Pro 或每月250美元的 Google AI Ultra 订阅用户,以及 Chrome Beta、Dev 和 Canary 用户。
购物是此次 AI 搜索升级中的另一大亮点。
谷歌将 Gemini 与自家的商品图谱(Shopping Graph)打通,结合500亿+ 商品数据源和评论系统,让用户从“浏览灵感”一步跳转到“理性选择”。
最惊艳的,是“试穿功能 Try-On”。
你在搜索连衣裙时点击“试穿”图标,上传一张自己的全身照,几秒钟后就能看到那件裙子穿在你身上的效果。不满意?保存造型、发给闺蜜讨论、换风格一键重来。
这功能现在已在美国 Search Labs 上线,首批支持衬衫、裙子、裤子、连衣裙等品类。
更狠的是“代理结账”功能。你设定颜色、尺寸、预算,Gemini 会在后台盯着价格变动,并在合适时机“替你下单”——从加入购物车到通过 Google Pay 安全结账,全程自动。你只需点击“确认购买”,剩下的都交给 AI 处理。
值得一提的是,为了让回答更“对你胃口”,谷歌宣布,AI 模式未来会引入更多用户上下文——从搜索记录,到 Gmail 中的航班、日程、预订信息。
比如,你搜索“这个周末在纳什维尔和朋友一起做什么,我们喜欢音乐和美食”,AI 可以结合你过去订过哪些餐厅、飞到哪、住哪,推荐有户外座位的餐厅,顺便附带附近的音乐活动清单。
当然,谷歌强调,这些个性化信息的使用完全可控,你可以随时开启或关闭,并查看 AI 是怎么用的。隐私提示也会同步出现。
04 Gmail、Docs、Meet,Gemini 正式接管 Google Workspace
在 Gemini 入驻搜索的同时,谷歌也把这位“AI助理”带入了每一位打工人的日常——Gmail、Docs、Meet。
这一轮 Workspace 升级,关键词只有一个:自动完成你懒得做的事。
在Gmail里,Gemini 可以学习你给特定联系人、群组的邮件风格,自动回信;你还可以指示 Gemini 删除特定发件人在某时间段内的邮件;而如果 AI 检测到你在邮件中试图约时间,它还会自动弹出一个会议窗口推荐时间段,连跳转 Google Calendar 的步骤都省了。
Docs 则加入了一个对专业用户非常实用的新功能:基于来源的写作辅助。你可以预设信息来源,比如某份 PDF、某篇网文,Gemini 就只从你指定的材料中提取观点和数据进行写作建议,不再“自作聪明”引用外部网络。该功能将于下季度正式开放。
Meet 将支持几乎实时的语音翻译功能。你用中文发言,听众就能同步听到英文版;你讲法语,Gemini 实时帮你转成德语。这项功能将优先向 AI Pro 和 Ultra 订阅者开放。
05 Google Ultra 版本登场,月费249.99美元
与 OpenAI 和 Microsoft 的订阅模式类似,谷歌也发布了Google AI Ultra:目前定价为249.99美元/月,先在美国上线,未来将扩展至更多国家。
Ultra 版到底值不值?来看它给了哪些特权:
Ultra 计划包括 Google 的最高速率限制、抢先体验即将推出的实验性 AI 产品,如 Project Mariner、Veo 3和具有深度思考模式的 Gemini 2.5 Pro。
从商业视角看,它是 Google 首次系统化出售“前沿大模型使用权”。
释放的信号是:Gemini 不是玩具,而是你可以为之付费的核心工作力。
下一步要看的则将是,在 GPT-4o 推出免费化后,谷歌的“高价模型订阅”路线,是否能赢得专业用户的青睐。
06 Starline 项目更名为 Google Beam,Android XR也亮相了
几年前,Google 曾用 Project Starline 掀起视频通信革命。它不是一个会议工具,而是一个颠覆性的构想 —— 用 AI 和光场技术,把枯燥的远程会议变成“仿佛就在你面前”的3D 面对面交流体验。
Project Starline 是一条独立于 Gemini、搜索、Android 之外的产品路线,更多代表的是 Google 对“未来人机交互方式”的长期押注。
如今,这个曾经看起来“黑科技”十足的研究项目迎来了正式产品化:Project Starline 更名为 Google Beam,并将在今年正式走入企业市场。
此外,在经历了十年从 Google Glass 到实验性原型的技术摸索后,Google 终于在今年 I/O 大会上首次展示了真正意义上的Android XR 智能眼镜设备形态。
过去几个月,Android XR 作为系统层方案已经低调发布,旨在统一 Google 的 XR/VR 设备体验。而现在,Google 把 Android XR 拓展到智能眼镜,将 Gemini 融入现实世界视角中,打造出日常可穿戴的 AI 助理。
谷歌表示将与创新眼镜品牌合作,首批合作伙伴包括 Gentle Monster 和 Warby Parker。与此同时,还将深化与三星的合作,将 Android XR 的应用范围从头戴式设备扩展到眼镜。
以上就是本次发布的主要内容。发布会结束,随着人流走出会场,大家在讨论Android XR、Veo3、Google Beam,耳边还回响着最后一句话:
“几十年的研究,正在成为现实。”Pichai 的声音沉稳,没用大词,也没许诺奇迹。
这不是一场靠惊艳取胜的发布会,但如果你问,哪家 AI 公司最可能让十亿人每天用上 AI——我想,这一刻,我在山景城现场,看见了答案。