gpt-5.4-mini-2026-03-17

OpenAI模型

字体：大中小

轻量级

GPT-5.4 mini（模型ID：gpt-5.4-mini-2026-03-17）是OpenAI于2026年3月17日发布的高性能小型语言模型，定位为“实时AI的引擎”，在编程、推理与多模态任务中性能逼近旗舰GPT-5.4，运行速度提升超2倍，成本显著降低，专为高频、低延迟场景设计‌ 。

核心定位：轻量级模型，承担高密度任务

GPT-5.4 mini 并非简单压缩版的大模型，而是通过‌知识蒸馏、架构优化与计算效率重构‌打造的专用模型。它的诞生旨在解决大模型在实时交互中响应慢、成本高的痛点，填补从“强大但笨重”到“敏捷且经济”的应用空白。

💡 四川大学人工智能学者宋耀比喻：“这就像物流系统中，重型卡车负责长途运输，而无人机完成最后一公里配送——GPT-5.4 mini 正是AI世界的‘末端配送无人机’。”

它特别适用于以下高频场景：

实时代码补全与调试（如IDE内嵌助手）
AI智能体的子任务执行单元（Subagent）
系统截图解析与计算机操作自动化
大规模数据分类、提取与API调用链路

性能表现：小身材，大能量

尽管参数规模精简，GPT-5.4 mini 在多项权威基准测试中展现出接近旗舰模型的实力，尤其在‌编程与多模态理解‌方面表现突出。

表格

测试项目

GPT-5.4 mini

GPT-5.4（旗舰）

提升对比


‌SWE-Bench Pro‌（真实软件工程）	‌54.4%‌	57.7%	仅差3.3个百分点
‌OSWorld-Verified‌（操作系统操作）	‌72.1%‌	~75%	接近人类水平
‌Terminal-Bench 2.0‌（终端命令执行）	‌59.3%‌	—	超越前代GPT-5 mini（38.2%）
‌GPQA Diamond‌（专业领域推理）	‌85.48%‌	93.00%	表现稳健

📌 在SWE-Bench Pro测试中，其得分较前代GPT-5 mini（45.7%）实现近9个百分点飞跃，‌一代之间完成质的跨越‌ 。

核心能力与技术特性

‌极速响应‌
运行速度‌提升逾2倍‌，延迟极低，适合集成于对实时性要求极高的产品中，如语音翻译、在线客服语义路由等。
‌超长上下文支持‌
支持高达 ‌40万token上下文窗口‌，可处理大型代码库、复杂文档或多轮交互历史，远超同类轻量模型。
‌多模态与工具调用‌
支持图像输入、函数调用、网页搜索、文件检索、计算机使用等能力，可作为AI智能体的“四肢”执行具体操作。

立即使用大模型

免费体验最新的AI大模型，支持对话、写作、编程、图像、视频等多种功能

立即使用此模型

免费体验最新的AI大模型，支持对话、写作、编程、图像、视频等多种功能

OpenAI模型推荐

gpt-5.4-nano-2026-03-17

GPT-5.4nano（模型ID：gpt-5.4-nano-2026-03-17）是OpenAI于2026年3月17日发布的迄今最小、最轻