qwen-image-edit

图像处理模型

字体:

Qwen-Image-Edit‌ 是由阿里通义千问团队推出的开源图像编辑模型,基于 ‌Qwen-Image(20B 参数)‌ 进一步训练,专注于实现高精度、高一致性的图像内容修改。

该模型支持语义与外观双重编辑、中英文精准文字修改,并在多个公开基准测试中达到 ‌SOTA(State-of-the-Art)性能‌ ‌ 。 

 核心特性 ‌

语义与外观双重编辑能力‌ ‌语义编辑‌:保持图像视觉语义一致的前提下进行高级修改,如: IP 角色创作(如基于吉祥物“卡皮巴拉”生成 MBTI 表情包) 视角转换(支持 90° 或 180° 旋转,可见物体背面) 风格迁移(如将人像转为吉卜力动画风格)‌ 

外观编辑‌:在局部区域进行增、删、改操作,同时保持其他区域不变,例如: 添加指示牌并自动生成倒影 删除头发丝等微小物体 修改文字颜色(如将字母“n”变为蓝色)‌ ‌

精准中英文文字编辑‌ 可直接对图像中的文字进行增、删、改,‌保留原有字体、字号、风格‌ 支持中文海报大字与小字的精细调整,甚至可修复书法作品中的错别字(如通过链式编辑逐步修正“兰亭集序”)‌ 

链式编辑与定点修复‌ 支持多轮修正:先标注大区域修改,再对错误细节进行局部微调(如将“稽”字右下角“日”改为“旨”)‌

立即使用大模型

免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能

立即使用此模型

免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能