- DALL-E 3 是设计师进行视觉头脑风暴和概念生成的绝佳工具。
- DALL-E 3 通过 ChatGPT 使用,因此理解你的提示词如何帮助这些工具生成输出比以往任何时候都重要。
- 使用 DALL-E 3(以及所有生成式 AI)会带来一些伦理问题,因为这些能力大多建立在辛勤工作的艺术家未经许可的作品训练之上。
人工智能(AI)领域因生成模型的进步而热闹非凡,尤其是在图像生成领域。该领域最重要的发展之一就是 DALL-E 3 的崛起,这一由人工智能驱动的图像生成器正在重塑我们感知和创作视觉内容的方式。在这篇博客文章中,我们将深入探讨 DALL-E 3 的复杂性、其功能,以及它对艺术、设计和其他领域产生的深远影响。
DALL-E 3 现象
由 OpenAI 开发的 DALL-E 3 是原始 DALL-E 模型的继任者,后者灵感来源于超现实主义艺术家萨尔瓦多·达利和皮克斯角色瓦力。与其前身不同,DALL-E 3 将生成式 AI 的概念提升到了新的高度,为生成的图像提供了前所未有的细节和控制水平。
另请参阅:Demis Hassabis:DeepMind 联合创始人,从国际象棋神童到人工智能先驱
功能与特点
高分辨率图像生成:DALL-E 3 能够以媲美人类创作艺术品的分辨率生成图像。质量的飞跃为数字艺术家和设计师开辟了新的可能性。
文本到图像合成:用户可以用文本描述一个场景、对象或概念,DALL-E 3 将生成一幅体现该描述的图像。这一功能对艺术和设计的可及性具有深远的影响。
属性控制:DALL-E 3 允许用户指定生成图像的某些属性,如风格、情绪甚至光照条件。这种控制水平对个性化内容创作来说是颠覆性的。
编辑与迭代:该模型可以对现有图像进行编辑或根据用户输入生成变体。这种迭代过程可以产生独特而精致的视觉内容。
多模态输出:DALL-E 3 可以生成结合不同概念、风格和元素的图像,创造出之前难以想象的多模态输出。
如何使用 DALL-E 3 图像生成器?
注册与付费
先从标准 ChatGPT 账户开始。如果你还没有,可以使用 Apple、Google 或 Microsoft 账户,或者用邮箱和强密码创建一个登录名。此阶段没有多因素认证选项。
进入后,你会在左下方看到“升级计划”,或者顶部菜单显示 ChatGPT 3.5,其中提供了切换到 GPT-4/ 升级到 Plus 的选项。任一操作都会显示此屏幕,包括“升级到 Plus”选项。
准备对话
与拥有自己界面的 DALL-E 2 不同,DALL-E 3 只是 ChatGPT 4 的一方面,你发送“消息”,聊天机器人会回应。值得庆幸的是,通过 GPT-4,你可以进行持续对话来更改/调整/改进它为你生成的内容。这包括图像。在高级版 ChatGPT Plus 上,提示限制为 4,000 个字符,约 500 个单词。
完美提示
设计提示包括内容主题词(你想看到什么)和风格修饰词(它应该如何呈现)。例如:“一个机器人在画架上画画”是内容,而“过肩视角、色彩丰富、油画、梵高风格”都是修饰词。你还可以使用其他几个修饰词来提高质量、将 DALL-E 聚焦在特定事物上,或者只是注入一些额外的创意。使用情感词汇可以获得更积极或消极的图像,并设定情绪或美学风格。
另请参阅:什么是 Perplexity AI?
更改尺寸并保留风格
默认情况下,使用 DALL-E 3 时,每个提示只能获得一张图像。然而,你可以指定它从一个提示中生成最多 10 张图像。或者,你可以在对话中输入多个独立的提示来获取多张图像,每张图像仅对应其提示,而非同一措辞的不同变体。
默认情况下,DALL-E 生成的图像为正方形,尺寸为 1024×1024 像素。但是,你可以通过在提示中使用这些数字或说出“纵向”或“横向”来将其指定为更高(1792×1024)或更宽(1024×1792)。
如果你想要同一图像的更大版本怎么办?只需说类似于“使用代码解释器将此图像放大 2 倍”的话。
如果你想在之后用不同的内容复制某张图像的风格,可以向 ChatGPT 询问最近图像的“gen_ids”(生成 ID 的缩写)。
DALL-E 3 代表了人工智能和图像生成领域的一次重大飞跃。当我们站在新时代创造力的边缘时,拥抱这项技术的潜力,同时留意其带来的伦理问题,是至关重要的。艺术和设计的未来正在我们眼前谱写,而 DALL-E 3 在塑造这一叙事中发挥着关键作用。
随着技术的不断发展,看到 DALL-E 3 和其他生成式 AI 模型将如何改变我们创作、感知和与视觉内容互动的方式,将是令人着迷的。可能性就像人类的想象力一样广阔,而旅程才刚刚开始。

