gpt-5.4-pro

OpenAI模型

字体:

GPT-5.4 Pro‌ 是 OpenAI 在 ‌2026年3月5日‌ 正式发布的最新一代大模型,属于 ‌GPT-5.4 系列中的高性能版本‌,专为处理‌复杂专业任务‌和‌企业级应用‌设计。 

核心特性 ‌

原生计算机操作能力‌: GPT-5.4 Pro 是 OpenAI 首个具备‌通用原生电脑操作能力‌的模型,可通过截图理解界面,并执行鼠标点击、键盘输入等操作,实现跨应用自动化工作流 ‌。  ‌

Thinker 模式增强‌: 在 ChatGPT 中以 ‌“GPT-5.4 Thinking”‌ 形式提供,支持‌实时展示推理路径‌,允许用户在生成过程中‌中途调整指令‌,提升结果匹配度。  ‌

超长上下文支持‌: 支持高达 ‌100万 tokens‌ 的上下文窗口,适用于处理超长文档、复杂代码库或多步骤任务。  ‌

专业任务表现卓越‌: 在 ‌GDPval 职业能力测试‌(44类职业任务)中,‌83% 的结果达到或超过人类专业人士水平‌(GPT-5.2 为 70.9%)‌。 在 ‌OSWorld-Verified‌(桌面环境操作)测试中,‌成功率 75.0%‌,‌超越人类平均水平(72.4%)‌ ‌ 。 在 ‌投行级电子表格建模‌中,得分 ‌87.3%‌,远高于 GPT-5.2 的 68.4% ‌。 ‌

高阶编程与调试‌: 继承并优化了 ‌GPT-5.3-Codex‌ 的编程能力,在 ‌SWE-Bench Pro‌ 基准上表现持平或更优,支持 ‌Playwright (Interactive)‌ 可视化调试 ‌ 。

视觉与文档理解增强‌: 支持 ‌1024万像素原图输入‌,在 ‌MMMU-Pro 视觉推理测试‌中准确率达 ‌81.2%‌ ‌ 。 

在 ‌OmniDocBench 文档解析测试‌中错误率降至 ‌0.109‌(GPT-5.2 为 0.140)‌ 。 ‌

工具调用效率提升‌: 通过 ‌“工具搜索”‌ 功能,在多步骤任务中减少 ‌47% 的 token 消耗‌,提升响应速度与成本效率 ‌

立即使用大模型

免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能

立即使用此模型

免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能