想象过把心中的创意变成真实的视觉作品,却总是缺乏工具或灵感?Google Labs 推出的 Whisk,这款全新的 AI 工具,让你可以用图片轻松“对话”,快速生成独一无二的视觉作品。
官方视频链接:《Introducing Whisk: Prompt Less, Play More | Google Labs》
https://www.youtube.com/watch?v=fyFDztZxlEc
- Whisk的特别之处
(1)与传统 AI 图像生成工具需要复杂的文字描述不同,Whisk 更注重直观体验。
你只需上传三张图片(Subject/Scene/Style)作为提示,即可完成创作,每次会生成2张作品;
- 主体图片(Subject):你想要突出的核心元素(比如人物、物品或符号)
- 场景图片(Scene):定义背景或故事的环境(如城市街景、山川湖泊等)
- 风格图片(Style):设定艺术风格(如油画、水彩、科幻风格等)
(2)三张提示图可以使用已有的图片,还可以通过提示词来生成图片,或者直接Roll出随机图片;
(3)针对待生成/已生成的图片,可以通用修改/增加文字描述来调整图片细节;
在演示视频中,官方分别使用了:
主体(Subject)图片为:“一位戴帽子戴眼镜的绅装老者”
场景(Scene)图片为Roll出的:“梦幻森林”
风格(Style)图片为通过文字生成的:“90年代复古动漫”
增加的细节(Details)为:“主体人物正在骑一辆飞行自行车”
就得到了这样的两幅初始作品:
再次点击优化(REFINE)修改局部细节:“穿着一套带条纹的粉色西装”,我们就得到了最终的作品。
正如同Whisk 的Slogan一样:Prompt Less, Play More!让你的灵感轻松落地!
- 案例测试
看到了这么好的创意效果,怎么能忍住不亲自试一下!
- 【测试案例-1】
让我们来上传:
一张皮卡丘的图片作为主体(Subject)
一张迪士尼城堡的照片作为场景(Scene)
用提示词输入“Chinese ink painting”让Whisk识别并做出一幅中国水墨画作为风格(Style)
点击生成后, 我们得到了第一轮的初始作品:
我们发现图片中皮卡丘的花纹错误了,有花纹的应该是背后,于是我们点击图片后增加补充的细节描述:“皮卡丘身体上的花纹在背后”,于是生成了第二幅作品:
在画面细节正确的前提下,我们继续尝试改动画面,让:“主体皮卡丘背着气球飞在空中,风格变为彩色水墨画风格”,得到了如下第三幅作品:
- 【测试案例-2】
继续用皮卡丘作为主体,测试系统默认推荐的三种风格(贴纸Sticker/搪瓷别针Enamel Pin/毛绒玩具Plushie):
测试到这里其实成果已经非常惊艳了,但本着极强的求真心态,我们进行了再一次的测试。
- 【测试案例-3】:
本次使用IP知名度较弱的形象:妙蛙种子、小火龙和杰尼龟 作为主体来进行创作,风格和测试2中的Enamel Pin(搪瓷别针)保持一致,结果这三个主体在第一轮都遇到了问题:
通过检查,我们发现了问题所在:
Whisk对于上传的所有图片,都是先利用 Google 的 Gemini 模型分析这些图片内容,生成详细的文字描述,并将其输入到 Imagen 3 模型 中,再生成匹配的视觉作品。
像皮卡丘这种全球大IP是会被Gemini直接识别的。反之,对于IP知名度没有那么高的形象作为主体的时候,以测试3的这三个形象,Gemini只识别了对应的主体特征,如妙蛙种子的:“浅青绿色的卡通生物。它有一个大大的头、短小的四肢,背上有一个叶状的绿色附属物。该生物拥有大而富有表现力的红色眼睛……”所以才会出现如下“货不对版”的错误形象。
那么遇到此类问题我们又该如何解决呢?
其实很简单,我们在上传主体和选择风格后,在细节描述中输入该主体形象的 官方名称+风格 即可,比如:妙蛙种子/杰尼龟/小火龙的搪瓷别针,于是就可以得到想要的作品。
在我们多轮测试后,并结合各大论坛的技术分享,我们发现:
Whisk以捕捉主体的“本质”为主,而非精确复制原图。例如,生成的图像可能在身高、肤色、发型等细节上有所变化。对于关键特征,用户可以手动调整文字描述,进一步优化结果。
- Whisk的意义是什么?
Google 表示,Whisk 是一种全新类型的创意工具,专为快速视觉探索而设计,而非精细化的像素编辑。
- 适合想快速试验创意方向的艺术家和设计师
- 无需技术背景,任何人都可以轻松上手
- 提供一种更直观、更人性化的创意表达方式
- 如何开始使用 Whisk?
目前Whisk完全免费,感兴趣的小伙伴可直接访问 labs.google/whisk 进行创意实现!
▼
最后,我们用本文中出现的四位主体角色送上对所有读者的美好祝福,祝大家节日快乐!
* 本图像的Seed种子值:341422,喜欢该风格的小伙伴们可以直接使用,欢迎在评论区和我们互动并分享你的创意作品哦!
--- End ---
欢迎关注微软 智汇AI 官方账号
一手资讯抢先了解