GPT-Image-1 API支持多种类型的图像生成与输出,能够满足开发者在不同场景下的多样化需求。以下是其主要支持的图像类型及相关配置:

1. ‌图像生成模式

  • 文本到图像(Text-to-Image)‌:根据纯文本提示(prompt)从零生成高质量图像,适用于概念设计、插画创作等场景。

  • 图像编辑(Image Edits)‌:基于已有图像和新的文本提示,对图像进行局部或整体修改,实现“图生图”功能。

  • 图像变体生成(Variations)‌:基于输入图像生成风格或细节不同的新图像,适合探索视觉多样性。

2. ‌图像尺寸与分辨率

支持多种标准尺寸,模型也可自动选择最优尺寸:

  • 1024x1024(方形)

  • 1536x1024(横向)

  • 1024x1536(竖向)

  • auto(默认,由模型根据提示词智能判断)

3. ‌输出格式

支持主流图像文件格式,便于集成到不同工作流中:

  • JPEG

  • PNG(支持透明背景)

  • WebP(支持透明背景和压缩调节)

4. ‌渲染质量

可选三种渲染质量等级,平衡画质与成本:

  • low

  • medium

  • high

5. ‌背景设置

  • 支持生成‌透明背景‌图像,特别适用于需要抠图的电商、设计和广告场景,减少后期处理成本。

6. ‌压缩控制

针对JPEG和WebP格式,可设置0–100%的压缩级别,灵活控制文件大小与清晰度。

7. ‌风格与内容定制

  • 支持通过文本提示定制视觉风格(如吉卜力风格、写实风、水彩等)

  • 能生成包含清晰可读文字的图像,优化了排版与字体渲染,适用于海报、广告等商业用途

  • 整合世界知识,可生成符合特定文化、历史背景的图像内容

8. ‌批量生成

通过n参数,单次请求最多可生成10张图像,提升内容生产效率。

综上,GPT-Image-1 API不仅支持高保真、多尺寸、多格式的图像输出,还提供精细的参数控制,适用于数字艺术、广告营销、教育插图、自动化设计等多种应用场景。