gemini-3.1-pro-preview-thinking-medium

Google模型

字体:

‌Gemini 3.1 Pro-Preview (thinking level: Medium) 是 Google DeepMind 于2026年2月推出的旗舰级多模态大模型的增强版本,专为复杂任务中的高效推理设计,在保持强大逻辑能力的同时引入“中等思考层级”(Medium Thinking Level),实现性能、成本与响应速度的最优平衡,成为开发者、科研人员与企业构建智能系统的核心引擎‌。

该模型是 ‌Gemini 3.1 Pro-Preview‌ 系列中最具实用价值的配置之一,填补了“快速响应”与“深度推理”之间的空白,适用于需要适度逻辑推演但又不能牺牲效率的生产级场景,如代码生成、数据分析、多步骤智能体任务等。


核心能力与技术突破

  1. ‌三层可调推理架构:首次实现精细化算力控制‌
    Gemini 3.1 Pro-Preview 首创 ‌Low / Medium / High 三级思考模式‌,本版本启用 ‌Medium‌ 模式,意味着模型会在生成答案前进行适度的内部推理(Chain-of-Thought),显著提升准确性而不大幅增加延迟。

    • ‌Low‌:毫秒级响应,适合简单问答;

    • ‌Medium‌:1–3秒思考,适合日常复杂任务;

    • ‌High‌:数分钟深度分析,用于科研级难题 。

  2. ‌逻辑推理能力跨越式提升‌
    在衡量抽象逻辑能力的 ‌ARC-AGI-2 基准测试‌中,Gemini 3.1 Pro 取得 ‌77.1%‌ 的验证得分,是前代 Gemini 3 Pro(31.1%)的 ‌2.5 倍以上‌,并领先于 Claude Opus 4.6(68.8%)和 GPT-5.2(52.9%)。
    在 ‌MCP Atlas‌(评估AI执行真实任务能力)测试中达到 ‌69.2%‌,展现出强大的工具调用与任务规划能力 。

  3. ‌原生多模态与超长上下文支持‌

    • 支持 ‌文本、图像、音频、视频、PDF、代码仓库‌ 输入;

    • 上下文窗口高达 ‌1,048,576 tokens(约100万)‌,可一次性处理整本技术文档或大型项目源码 ;

    • 输出上限为 ‌65,536 tokens‌,足以生成完整网页、报告或程序模块。

  4. ‌结构化输出与工具调用能力成熟‌

    • 支持 ‌JSON、XML 等结构化格式输出‌,便于系统集成;

    • 内置 ‌Google Search、Python 代码执行、文件搜索、函数调用‌ 等工具,可作为智能代理(Agent)自主完成多步任务 ;

    • 在 ‌Terminal-Bench 2.0‌ 编程测试中表现优于 GPT-5.2 与 Opus 4.6,尤其在调试与错误修复方面更稳定 。

  5. ‌知识截止与训练背景‌

    • 知识截止时间为 ‌2025年1月‌;

    • 采用 ‌混合专家(Mixture-of-Experts, MoE)架构‌,总参数量超 ‌5000亿‌,但每次推理仅激活部分专家网络,兼顾效率与智能 。


性能与成本优势

表格

项目

参数



输入 Token 上限

‌1,048,576‌

输出 Token 上限

‌65,536‌

首Token响应速度

‌108.6 tokens/秒‌

输入价格(<200K tokens)

‌$2 / 百万 tokens‌

输出价格(<200K tokens)

‌$12 / 百万 tokens‌

高负载价格(>200K tokens)

4/4/18‌(输入/输出)

💡 实测显示,在完成相同复杂任务时,其 ‌单位智能成本仅为 Claude Opus 的一半以下‌,性价比极高 。


典型应用场景

  • ✅ ‌企业级智能助手开发‌:构建能理解长文档、调用API、生成报告的AI员工;

  • ✅ ‌科研数据分析‌:自动解析论文、提取数据、生成可视化图表;

  • ✅ ‌软件工程辅助‌:代码生成、审查、重构与测试一体化;

  • ✅ ‌金融与法律文书处理‌:从合同中提取关键条款、生成摘要与风险提示;

  • ✅ ‌教育个性化辅导‌:根据学生提问提供分步解题思路与知识拓展。


立即使用大模型

免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能

立即使用此模型

免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能