gemini-3.1-pro-preview-thinking-medium
Google模型
Gemini 3.1 Pro-Preview (thinking level: Medium) 是 Google DeepMind 于2026年2月推出的旗舰级多模态大模型的增强版本,专为复杂任务中的高效推理设计,在保持强大逻辑能力的同时引入“中等思考层级”(Medium Thinking Level),实现性能、成本与响应速度的最优平衡,成为开发者、科研人员与企业构建智能系统的核心引擎。
该模型是 Gemini 3.1 Pro-Preview 系列中最具实用价值的配置之一,填补了“快速响应”与“深度推理”之间的空白,适用于需要适度逻辑推演但又不能牺牲效率的生产级场景,如代码生成、数据分析、多步骤智能体任务等。
核心能力与技术突破
三层可调推理架构:首次实现精细化算力控制
Gemini 3.1 Pro-Preview 首创 Low / Medium / High 三级思考模式,本版本启用 Medium 模式,意味着模型会在生成答案前进行适度的内部推理(Chain-of-Thought),显著提升准确性而不大幅增加延迟。Low:毫秒级响应,适合简单问答;
Medium:1–3秒思考,适合日常复杂任务;
High:数分钟深度分析,用于科研级难题 。
逻辑推理能力跨越式提升
在衡量抽象逻辑能力的 ARC-AGI-2 基准测试中,Gemini 3.1 Pro 取得 77.1% 的验证得分,是前代 Gemini 3 Pro(31.1%)的 2.5 倍以上,并领先于 Claude Opus 4.6(68.8%)和 GPT-5.2(52.9%)。
在 MCP Atlas(评估AI执行真实任务能力)测试中达到 69.2%,展现出强大的工具调用与任务规划能力 。原生多模态与超长上下文支持
支持 文本、图像、音频、视频、PDF、代码仓库 输入;
上下文窗口高达 1,048,576 tokens(约100万),可一次性处理整本技术文档或大型项目源码 ;
输出上限为 65,536 tokens,足以生成完整网页、报告或程序模块。
结构化输出与工具调用能力成熟
支持 JSON、XML 等结构化格式输出,便于系统集成;
内置 Google Search、Python 代码执行、文件搜索、函数调用 等工具,可作为智能代理(Agent)自主完成多步任务 ;
在 Terminal-Bench 2.0 编程测试中表现优于 GPT-5.2 与 Opus 4.6,尤其在调试与错误修复方面更稳定 。
知识截止与训练背景
知识截止时间为 2025年1月;
采用 混合专家(Mixture-of-Experts, MoE)架构,总参数量超 5000亿,但每次推理仅激活部分专家网络,兼顾效率与智能 。
性能与成本优势
表格
💡 实测显示,在完成相同复杂任务时,其 单位智能成本仅为 Claude Opus 的一半以下,性价比极高 。
典型应用场景
✅ 企业级智能助手开发:构建能理解长文档、调用API、生成报告的AI员工;
✅ 科研数据分析:自动解析论文、提取数据、生成可视化图表;
✅ 软件工程辅助:代码生成、审查、重构与测试一体化;
✅ 金融与法律文书处理:从合同中提取关键条款、生成摘要与风险提示;
✅ 教育个性化辅导:根据学生提问提供分步解题思路与知识拓展。
免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能
免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能
Google模型推荐
gemini-3.1-pro-preview-thinkin
Gemini3.1Pro-Preview(thinkinglevel:Medium)是GoogleDeepMind于2026年2月推出的旗舰级多
gemini-3.1-flash-lite-preview-
Gemini3.1Flash-LitePreview(thinkinglevel:Medium)是谷歌于2026年3月推出的Gemini3系列中速
veo3.1-components-4k
Veo3.1-Components-4K是谷歌DeepMind推出的面向企业级工业化视频生产的高阶模块化模型,专
veo3.1-components
Veo3.1-Components是Google推出的模块化视频生成专用模型,专为需要高精度控制与多组件协同的
veo3-pro
Veo3Pro是谷歌DeepMind在2025年I/O大会上推出的旗舰级AI视频生成模型,作为全球首款实现“
gemini-2.5-pro-nothinking
Gemini2.5Pro-NoThinking是Gemini2.5Pro系列中专为“极速响应”场景设计的轻量推理模式版本
gemini-2.5-flash-thinking
Gemini2.5Flash-Thinking是谷歌Gemini2.5系列中首个支持“可控深度思考”的混合推理模型,
gemini-2.5-pro
Gemini2.5Pro是谷歌DeepMind推出的旗舰级“思考型”多模态大模型,被官方称为其研发至今最智