近日Google AI Labs的产品总监Jaclyn Konzelmann在博客中分享了她打算内部分享的Nano Banana的使用技巧和可实现的效果。
看完整篇分享,我的一些思考:
一、分享的19个效果
重点高亮:高亮图中景点,并在旁边生成有趣的描述

海报生成:和P图滤镜差不多

视角转换:箭头标识目标视角,让照片从箭头处视角看向原点。

草图理解:基于手绘草图生成配色带效果版图片

天气修改:认识地理位置,添加该地理位置下适当的天气效果

3M模型建立:通过一张照片还原多视角的3D模型

微型世界:想象一个知名景点,建立一个微型模型

日夜变换:转换图中的白天和黑夜场景效果

广告图制作:一张人像和一个产品图,直接生成真人广告图

季节转换:认知图中场景,更换其季节效果。

时空转换:把爸妈的老照片变成新照片的模样。

Pose切换:你是导演,确定人物,并把他们所处位置和姿势在新场景中标明,可以获得全新的人物照片。

菜品调优:对菜品加高级滤镜

魔法棒:对图中的小东西施加魔法的想象力

瞬间转移:为图中的主要角色切换场景

画面建立:为保证图片的一致性,以多次小步的方式添加和修改内容

创意绘制:复杂的构思通过多步骤以生成最终图片

材料替换:替换图中物品的材料和效果。

相册集:以一个小故事的方式生成一个对象一系列的场景图片。

二、大模型对比
最后对比一下我最近试过的几款图像生成大模型,为大家做个简单对比
模型 | 开放性 | 主要优势 | 典型场景 |
|---|---|---|---|
Nano Banana (Gemini 2.5) | 半开放(集成于 Google 系生态) | 编辑与一致性极强,理解复杂语境 | 智能文档、内容生成、营销图像 |
DALL·E 3 | 商业闭源(OpenAI) | 语言理解精准、创意构图强 | 广告创意、社交内容、品牌视觉 |
Stable Diffusion 3 | 全开源(可私有化部署) | 定制化强、插件生态丰富 | 企业私有部署、素材自动生成 |
Midjourney V6 | 闭源(社区驱动) | 画面风格独特、美术质量极高 | 视觉设计、封面、概念艺术 |