bfl/flux-pro
图像处理模型
Flux模型是由Black Forest Labs(BFL)推出的新一代图像生成模型系列,旨在克服传统Stable Diffusion(SD)架构的局限性。该系列通过底层架构重构,显著提升了生成质量、推理速度以及对复杂文本提示的理解与控制能力。
模型背景与核心思想 Flux模型由Stable Diffusion原班人马创立的研究机构Black Forest Labs开发。其核心思想并非对SD进行改良,而是采用全新的多模态扩散Transformer(MMDiT)架构与基于修正流(Rectified Flow)的生成框架,从底层彻底重构了图像生成流程。
相比传统SD模型,Flux旨在解决计算开销大、长文本理解弱、可控性差等痛点。
关键架构与技术 Flux模型的核心创新主要体现在以下两方面:
多模态扩散Transformer(MMDiT)架构 MMDiT架构是Flux能高效处理文本与图像信息的关键。它并非简单地将文本与图像token混合处理,而是通过交叉注意力机制让两者分别处理后再交互,从而保留各自特性并避免信息污染。
输入流程包括: 文本编码:提示词通过CLIP-G/14、CLIP-L/14和T5 XXL三个编码器分别提取全局语义、局部细节与生成更丰富的文本表示。 1 图像编码:图像经VAE编码为潜空间向量(如64×64×4),经打补丁(Patching)和位置编码后形成序列。
主干网络:一系列MMDiT Block接收图像token、条件信息与时间步,通过调制(Modulation)层动态影响注意力机制,确保生成过程准确遵循文本指导,最终经Unpatching层输出。 1 2. 基于修正流(Rectified Flow)的生成框架 Flux放弃了传统扩散模型的复杂噪声调度,转而采用修正流(Rectified Flow)框架。该框架通过学习一条近似直线的最优传输路径,将高斯噪声直接映射到数据分布,从而实现更直接、梯度更稳定的生成过程,这也是Flux模型推理速度显著提升的关键原因。
其生成步骤可简化为:文本编码初始化、噪声潜变量初始化、MMDiT主干网络逐步细化布局与细节、最终经VAE解码输出图像。
模型版本与特点 Flux系列已推出多个版本,具备不同的特点与适用场景: Flux.1:于2024年推出,开源版本在生成质量媲美SDXL的同时,推理速度提升近一倍。它显著增强了文本依从性、多主体生成能力和手部生成等细节表现。
Flux.2:于2025年末推出,进一步嵌入了Mistral-3 24B大语言模型,旨在提升对复杂提示的深层语义理解与生成能力。
Flux.1提供了多种型号,包括开源可快速推理的“schnell”版本、适用于开发的“dev”版本以及仅通过API访问的“pro”版本。
其训练策略强调数据质量优于数量,并采用了务实的设计以提升模型性能。
性能与应用 Flux模型在多项能力上表现突出: 文本控制:能有效处理较长英文文本,对复杂提示(如包含多个对象、属性与空间关系的描述)的理解与依从性显著增强。
多主体生成:在多实体生成及分别控制颜色等任务上能力出色。
生成速度:基于修正流框架,其推理步骤减少,生成速度相比传统SD模型有显著优势。
在风格适应性上,Flux模型保持了较好的多样性,但其对某些特定风格(如中国水墨画)的理解可能仍有局限。
总体而言,Flux模型系列通过创新的架构设计,为图像生成领域提供了更高效、可控且理解能力更强的解决方案。
免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能
免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能
图像处理模型推荐
flux-dev
Flux-dev模型是Flux系列中的一个开源版本,由德国AI初创公司黑森林实验室(BlackForestLabs)开
flux-2-flex
Flux-2-flex是黑森林实验室(BlackForestLabs)发布的Flux-2系列图像生成模型中的一个特化版本
flux-2-dev
FLUX.2-dev是由BlackForestLabs发布的FLUX.2系列中的开源版本,专为开发者和创意人士设计
bfl/flux-pro
Flux模型是由BlackForestLabs(BFL)推出的新一代图像生成模型系列,旨在克服传统StableDiffus
bfl/flux-2-max
Flux.2是由黑森林实验室(BlackForestLabs,BFL)于2025年12月发布的Flux.2系列中性能最强
bfl/flux-2-flex
Flux.2是由黑森林实验室(BlackForestLabs)推出的Flux.2系列图像生成模型中的一个特化版本,专
bfl/flux-pro-1.1
BFL/FLUX-PRO-1.1模型通常指的是由黑森林实验室(BlackForestLabs)开发的FLUX.1.1模型,这
bfl/flux-pro-1.1-ultra
bfl/flux-pro-1.1-ultra的模型是BlackForestLabs推出的FLUX1.1ProUltra,这是一个专注