gpt-image-1.5

OpenAI模型

字体:

GPT-Image 1.5是OpenAI于2025年12月17日发布的旗舰级图像生成模型,旨在推动AI图像生成从“新奇”向“实用、高保真”转变,目标是将ChatGPT打造成一个高效、灵活的创意工作室。 ‌ 

该模型在多个方面实现了显著升级:  ‌

核心架构革新‌:GPT-Image 1.5摒弃了传统的扩散模型(Diffusion Models),转而采用视觉自回归(Visual Autoregressive, VAR)范式。这一变革使其能像处理语言一样“书写”图像,通过预测图像的下一个Token来构建画面,从而在逻辑推理和指令遵循上获得质的飞跃。 ‌ 

性能大幅提升‌:得益于VAR架构,其图像生成速度是上一代模型的4倍,能更快速地响应用户需求。 ‌ 

精准的图像编辑与指令遵循‌:模型在理解复杂提示词、执行特定编辑任务(如修改服装、试穿发型、应用风格滤镜)方面表现更优,能更好地保留原图精髓,并在处理需要严密逻辑的构图(如生成“站在梯子上粉刷天花板的长颈鹿”)时展现出色的能力。 ‌ 

文本渲染能力增强‌:相较于前代产品,其在图像中生成文字的准确性有显著提升,能生成排版正确、拼写无误的标题或说明文字,更适合商业物料设计。 ‌ 

GPT-Image 1.5已通过ChatGPT和API向所有用户开放,并在2026年1月被Adobe集成至其Firefly平台。 ‌

在基准测试中,该模型在文生图与图像编辑任务中均位列第一,但其对中文的支持仍存在不足,生成包含中文文字的图像时错误频出。

立即使用大模型

免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能

立即使用此模型

免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能