谷歌深夜王炸!“纳米香蕉”霸榜大模型竞技场,500万次盲测认证最强,图像SOTA彻底易主
https://aistudio.google.com/apps?source=showcase
Gemini 2.5 Flash Image 核心亮点:
1. 保持角色一致性
图像生成的一个基本挑战是在多个提示和编辑中保持角色或对象的外观。现在,nano-banana 可以将同一个角色放置在不同的环境中,在新环境中从多个角度展示单个产品,或生成一致的品牌资产,同时保留主题
谷歌在 Google AI Studio 中构建了一个模板应用 (可以轻松自定义并在其上设置代码),演示模型的字符一致性功能
除了角色一致性之外,nano-banana还擅长遵守视觉模板
2. 基于自然语言的精准编辑
nano-banana支持使用自然语言进行有针对性的转换和精确的本地编辑。例如,模型可以模糊图像的背景、去除 T 恤上的污渍、从照片中删除整个人物、改变拍摄对象的姿势、为黑白照片添加颜色,或者可以通过简单的提示想到任何其他内容
3. 多图像融合
nano-banana可以理解和合并多个输入图像。例如将对象放入场景中,使用配色方案或纹理重新设置房间样式,并通过单个提示融合图像,为了展示多图片融合,谷歌在 Google AI Studio 中构建了一个模板应用 ,可将商品拖到新场景中,以快速创建新的逼真的融合图片
one more thing
现在的图像生成模型在美学图像方面表现出色,但缺乏对现实世界的深刻语义理解,nano-banana在对现实世界的理解上取得了突破
为了证明这一点,谷歌在 Google AI Studio 中构建了一个模板应用 ,将一个简单的画布变成了一个互动式教育导师。它展示了模型阅读和理解手绘图表、帮助解决现实世界问题以及在一个步骤中遵循复杂编辑说明的能力。
参考:
https://developers.googleblog.com/en/introducing-gemini-2-5-flash-image/