gpt-5.4-mini

OpenAI模型

字体:

GPT-5.4 mini是OpenAI于2026年3月18日发布的迄今最强小型语言模型,专为高频、低延迟任务设计,在编程、推理与多模态理解方面性能接近旗舰级GPT-5.4,运行速度提升超2倍,成本仅为后者的三分之一,是AI智能体、实时编码助手与大规模应用的理想选择‌。


核心定位:轻量但不“轻能”,填补实时AI的空白

GPT-5.4 mini 并非简单的“缩水版”大模型,而是通过‌知识蒸馏与架构压缩技术‌优化的高性能轻量模型。它解决了大模型在实时交互场景中因高延迟、高成本难以落地的问题,适用于:

  • 实时代码补全与调试(IDE内嵌)

  • AI智能体的“执行单元”(Subagent)

  • 多模态界面解析(如截图理解与操作系统操作)

  • 高频数据处理与API调用

💡 四川大学AI学者宋耀评价:“这就像物流系统中的无人机,虽载重有限,但响应极快,适合完成80%的日常任务,释放重型卡车(大模型)去处理复杂问题。”


性能表现:逼近旗舰,多项测试接近GPT-5.4

尽管体积更小,GPT-5.4 mini 在多个权威基准测试中展现出惊人实力,‌性能已逼近完整版GPT-5.4‌:

表格

测试项目

GPT-5.4 mini

GPT-5.4(旗舰)

GPT-5 mini(前代)





‌SWE-Bench Pro‌(真实编码能力)

‌54.4%‌

57.7%

45.7%

‌OSWorld-Verified‌(计算机操作)

‌72.1%‌

75%

42%

‌GPQA Diamond‌(专业推理)

‌85.48%‌

93.00%

‌Terminal-Bench 2.0‌(终端操作)

‌59.30%‌

38.20%

📌 在SWE-Bench Pro测试中,GPT-5.4 mini 仅比旗舰模型低3.3个百分点,而前代GPT-5 mini仅为45.7%,‌一代之间实现近9%的飞跃‌ 。


核心优势与应用场景

  1. ‌极致速度‌
    运行速度‌提升超过2倍‌ ,响应延迟极低,适合集成到IDE、客服系统、语音助手等对实时性要求高的场景。

  2. ‌超长上下文支持‌
    支持‌400k上下文窗口‌ ,可处理超长代码库、复杂文档或跨文件任务,远超多数轻量模型。

  3. ‌多模态与工具调用‌
    支持图像输入、函数调用、网页搜索、文件检索与计算机使用等12项功能 ,可作为AI智能体的“四肢”执行具体操作 。


立即使用大模型

免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能

立即使用此模型

免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能