gpt-5.4-mini-2026-03-17

OpenAI模型

字体:

GPT-5.4 mini(模型ID:gpt-5.4-mini-2026-03-17)是OpenAI于2026年3月17日发布的高性能小型语言模型,定位为“实时AI的引擎”,在编程、推理与多模态任务中性能逼近旗舰GPT-5.4,运行速度提升超2倍,成本显著降低,专为高频、低延迟场景设计‌ 。


核心定位:轻量级模型,承担高密度任务

GPT-5.4 mini 并非简单压缩版的大模型,而是通过‌知识蒸馏、架构优化与计算效率重构‌打造的专用模型 。它的诞生旨在解决大模型在实时交互中响应慢、成本高的痛点,填补从“强大但笨重”到“敏捷且经济”的应用空白。

💡 四川大学人工智能学者宋耀比喻:“这就像物流系统中,重型卡车负责长途运输,而无人机完成最后一公里配送——GPT-5.4 mini 正是AI世界的‘末端配送无人机’。”

它特别适用于以下高频场景:

  • 实时代码补全与调试(如IDE内嵌助手)

  • AI智能体的子任务执行单元(Subagent)

  • 系统截图解析与计算机操作自动化

  • 大规模数据分类、提取与API调用链路


性能表现:小身材,大能量

尽管参数规模精简,GPT-5.4 mini 在多项权威基准测试中展现出接近旗舰模型的实力,尤其在‌编程与多模态理解‌方面表现突出 。

表格

测试项目

GPT-5.4 mini

GPT-5.4(旗舰)

提升对比





‌SWE-Bench Pro‌(真实软件工程)

‌54.4%‌

57.7%

仅差3.3个百分点

‌OSWorld-Verified‌(操作系统操作)

‌72.1%‌

~75%

接近人类水平

‌Terminal-Bench 2.0‌(终端命令执行)

‌59.3%‌

超越前代GPT-5 mini(38.2%)

‌GPQA Diamond‌(专业领域推理)

‌85.48%‌

93.00%

表现稳健

📌 在SWE-Bench Pro测试中,其得分较前代GPT-5 mini(45.7%)实现近9个百分点飞跃,‌一代之间完成质的跨越‌ 。


核心能力与技术特性

  1. ‌极速响应‌
    运行速度‌提升逾2倍‌,延迟极低,适合集成于对实时性要求极高的产品中,如语音翻译、在线客服语义路由等 。

  2. ‌超长上下文支持‌
    支持高达 ‌40万token上下文窗口‌,可处理大型代码库、复杂文档或多轮交互历史,远超同类轻量模型 。

  3. ‌多模态与工具调用‌
    支持图像输入、函数调用、网页搜索、文件检索、计算机使用等能力,可作为AI智能体的“四肢”执行具体操作 。


立即使用大模型

免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能

立即使用此模型

免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能