OpenAI DALL·E 2 模型(高级版)
-
简介
DALL·E 2是由OpenAI创建的一个AI模型。它可以根据用户的文本输入(“prompt”(提示))生成高品质的图像。
例如,如果你的输入是“a bowl of soup that is also a portal to another dimension, digital art”(一碗汤,也是通往另一个维度的入口,数字艺术),那么输出可能会如下图那样:
你可以把DALL·E 2想象成是一名绘画大师,他能根据你的特定请求绘画出任何内容。
OpenAI DALL·E 积木
要使用DALL·E 2模型来生成图像,你可以使用以下来自“人工智能”类别的积木(仅限高级版订阅用户):
第一个输入是待生成图像的名称。图像将保存为具有此名称的一个新造型。如果具有该名称的造型已经存在,那么它将被替换。
第二个输入是你的请求,最多为1000个字符。我们将在稍后讨论如何编写此类请求。
第三个输入将指定待生成图像的大小,这可以是256x256、512x512以及1024x1024。注意,越大的图像需要越长的时间才能生成。
运行以上积木后,将通常需要3到5秒钟来创建具有给定名称的新造型图像。但是,如果在你的请求之前还有其他请求,那么,由于OpenAI实行的流量限制,这将需要更长的时间。
生成的造型图像
当造型图像制作好后,你可以切换到“造型”选项卡查看它。你还可以右击它把图像导出为png文件。
角色造型
你不但可以生成背景图像,还可以生成角色造型。例如,通过提示“a cute singing dog cartoon, full body view, white background”(一只正在歌唱的可爱小狗卡通,全身视图,白色背景),你可以得到如下图的一个造型图像:
生成图像的版权
你生成的图像保证是唯一的,同时你对该图像拥有完全的版权。这意味着你可以把它应用到你的项目中,如果你能找到买家,你甚至可以出售它。
但是,如果你选择共享包含此图像的项目,那么只要其他人给予你信用,他们将获得使用你的图像的权利。
如何编写出色的文本提示
在DALL·E的帮助下,即使你不懂绘画,你也可以成为一名优秀的二维艺术家。所需要的只是撰写一段有创意和准确的出色的文本提示的能力。
要真正擅长使用DALL·e2作画,需要进行大量的练习。在某种程度上,这类似于编程:你必须要有一个创意,然后你必须能够把这个想法表达成为DALL·E 2模型可以理解和执行的文本命令。
以下是可供你参考的一些有用的提示:
提示 1 - 从例子中学习
你可以查看其他人生成的图像以及他们使用的文本提示。这将有助你学习如何编写你自己的提示。例如,https://lexica.art 就是一个提供了大量示例图像及其提示的优秀网站。
提示 2 - 试试“不可能的”组合
DALL·E 2模型尤其善于绘画不存在的事物。如果你能把通常互不关联的一些事物或概念结合起来,那么你就有可能会得到一些很有趣的结果。以下是一些示例:
“a sports shoe made of watermelon”(用西瓜制造的运动鞋)
“a dog taking a cooking class, photo-realistic, highly detailed”(一只狗在上烹饪课,照片逼真,非常细致)
提示 3 - 提供更多细节
你的文本提示中的每一个字都很重要。你提供的细节越多,DALL·E 2模型就越有可能“理解”你想要的效果。
例如,如果你的文本提示是“a beautiful beach”(一个漂亮的海滩)那么你将只会得到一张相当普通的海滩照片:
但是,如果你的提示包含了更多细节的话,例如“Beach paradise, concept art, low angle, high detail, warm lighting, volumetric, god rays, vivid, beautiful, huge scene”(海滩天堂,概念艺术,低角度,丰富细节,暖光,体积,光线投射效果,生动,美丽,巨大的场景), 那么你将能得到更独特的效果:
当然,你需要知道一些用来描述一幅画作或物体的特殊术语。例如,“volumetri”(体积的)表示“提供一种三维的感觉”。
对于另一个例子,如果你的提示是“a city on Mars”(火星上的一座城市),以下将是你会得到的结果:
如果你能添加更多细节,例如“a city on Mars, futuristic, highly detailed, sci-fi, beautiful, warm color, peaceful, photo-realistic, vast ground”(火星上的一座城市,未来感,丰富细节,科幻,美丽,温暖的色彩,和平,照片般的现实,广阔的地面),你将得到如下图的结果:
提示 4 - 不断尝试
很有可能你无法获得预期中的理想图像。这时,你可以做的最简单的事情就是再试一次。你甚至无需更改文本提示,因为每一张图像都是随机生成的。
当然,你可能也会希望稍微更改一下文本提示,例如添加、更改或移除某些文字。每次都尝试作出微小的更改,这样你就可以在得到的图像中查看对应的变化。
提示 5 - 不要期望漂亮的面孔
DALL·E 2模型将不会生成很好看的人类的面孔。
例如,如果提示为“a beautiful face full view photo realistic”(一张美丽的脸,全视图照片逼真),你可能会得到下面这样的面容:
这是有意为之的结果,因为DALL·E 2模型的开发者不希望该模型被用来模拟真实的人类。
-