(Prompt:把画面风格换成用线条和形状勾勒的涂鸦风;Prompt:把画面风格换成皮克斯风格;Prompt:把画面风格换成日本动漫风)
经过多次尝试,我们也总结出一套超实用的 Prompt 指南。
每次编辑尽量使用单指令,为防止它「丢三落四」, 多指令最好少于 3 种变化。虽然 SeedEdit 具备一定的推理能力,有时指令模糊它也能猜个大概,但为了效果更佳,在局部编辑时,下指令要精准,尤其是画面具有多个实体时,需描述清楚对谁做什么。参考图尽可能清晰、分辨率高,要想保留参考图中的对象,则可以多加一些对象描述。比如从简单的 change to afro hairstyle 变成 change this young Chinese man hairstyle to afro style.如果感觉编辑效果不明显,可以调整编辑强度,比如从 0.5 调整到 1.0;若发现编辑变化太多, 同样也可以减少编辑强度,比如降到 0.1。 单挑 Dall・E3、Midjourney
没有对比就没有发言权。
我们就让字节 SeedEdit 和 AI 生图界的「扛把子」Dall・E3、Midjourney 来次真刀真枪的比拼。
首先,我们给这三个模型输入同样的 Prompt:a female model in blue Nike tracksuit, Fujifilm, urban street photography。让它们各自生成一张图片,再在此基础上进行局部调整。
SeedEdit 生成的图片既时尚又充满运动气息。模特身着印有醒目耐克 Logo 的运动背心,搭配同色系棉质夹克,裤子的光泽与夹克相得益彰,整体效果相当协调。
随后,我们输入文字指令「Change the blue Nike tracksuit to black Nike tracksuit」,SeedEdit 迅速响应,给模特换成了一身黑色,夹克和裤子的光泽感同样得到完美呈现。
(Input Prompt:a female model in blue Nike tracksuit, Fujifilm, urban street photography;Edit Prompt:Change the blue Nike tracksuit to black Nike tracksuit.)
与 SeedEdit 一句话 P 图不同,Midjourney 和 Dall・E3 的局部编辑功能稍显复杂,需要先使用画笔工具涂抹要修改的区域,然后输入 Prompt,以实现对图像的元素修改。
Midjourney 虽然也遵从了指令,但改变了模特动作和衣服款式。
(Input Prompt:a female model in blue Nike tracksuit, Fujifilm, urban street photography;Edit Prompt:Change the blue Nike tracksuit to black Nike tracksuit.)
Dall・E3 的表现最拉胯,生成的图像美感不足,还一股 AI 味,涂抹修改也没有完全遵循 Prompt。
(Input Prompt:a female model in blue Nike tracksuit, Fujifilm, urban street photography;Edit Prompt:Change the blue Nike tracksuit to black Nike tracksuit.)
再来试一下删除效果。Prompt:Remove the guy on the right.
原图:
DALL-E3、Midjourney、SeedEdit 之间,不同图像生成工具的效果对比。
不得不说,字节提出的方法别具特色,相比业内现有技术又向前跨出了一步。 豆包的生成式 AI 技术,走在前面
看到这里,你可能突然意识到,AI 领域的风向正在发生转变。
一直以来,很多关注 AI 绘画的人总是在期盼着 DALL-E、Midjourney 等海外 AI 创业公司的技术更新。而随着国内的技术不断迭代,我们已经见证了一系列先进的生成式 AI 应用在外网刷屏。或许到了新技术落地的节点,我们目光更应该向近处看。
其实仔细想来,作为全球短视频领域的佼佼者,字节跳动在生成式 AI,特别是图像生成领域上的优势可谓得天独厚。
早在豆包大模型诞生前,字节就一直在关注 AI 图像生成相关技术,并持续增加研发投入。豆包大模型尽管入场时间不是最早,但凭借优秀的效果和独特的社交体验迅速成为了国内最热门的大模型之一。到今年 9 月,豆包大模型日均生成图片 5000 万张。
能够迅速做出生成式 AI 应用爆款的字节,其所做的努力并不只是在应用层面上创新。字节大模型团队最近的前沿研究,已经在不断挑战 AI 领域的技术难题。 在工程层面上,仅从今年下半年起,我们在社交网络上就不时可以刷到字节的新成果,比如可以生成长篇漫画、有剧情视频的 StoryDiffusion: