dall-e-3

图像处理模型

字体:

DALL-E 是由 OpenAI 开发的一系列基于人工智能的文本到图像生成模型,能够根据自然语言描述创建逼真或风格化的图像。该系列已迭代至第三代,各版本在功能、分辨率和控制能力上持续增强。

  • ‌DALL-E‌:作为系列的首个版本,于2021年发布,基于120亿参数的GPT-3架构,能够通过文本提示生成原创图像,支持组合不相关概念、控制物体属性和视角,并具备一定的三维渲染能力。‌

  • ‌DALL-E 2‌:2022年推出,显著提升了图像分辨率(为第一代的4倍),并增强了图像生成的逼真度与细节处理。它还引入了图像编辑功能,如根据文本提示修改现有图像的特定区域。‌

  • ‌DALL-E 3‌:2023年10月正式开放,与ChatGPT深度集成,支持更自然的多轮对话式提示优化,能生成细节更丰富、风格更精准的图像。它支持多种输出尺寸(如1024×1024、1792×1024)和风格(自然、生动),并添加了内容水印(C2PA)以标识AI生成内容。自2024年8月起,该模型已向ChatGPT免费用户开放,但每日生成次数有限。‌

DALL-E 模型广泛应用于创意设计、游戏开发、广告营销等领域,其核心能力在于将抽象的语言描述转化为视觉内容,并能“填补”提示中未明确说明的细节。‌

目前,DALL-E 3 已集成于微软的多个平台,例如通过 ‌Bing Image Creator‌ 和 ‌Windows 画图‌ 应用中的“图像创建器”功能,用户可直接输入文本生成AI艺术作品。‌

立即使用大模型

免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能

立即使用此模型

免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能