gemini-2.5-flash-thinking

Google模型

字体：大中小

对话推理

‌Gemini 2.5 Flash-Thinking 是谷歌 Gemini 2.5 系列中首个支持“可控深度思考”的混合推理模型，它在保持 Flash 系列高速、低成本优势的同时，首次引入了可调节的“思考能力”，让 AI 能够像人类一样——简单问题快速作答，复杂任务深入推演‌。

这一特性使其成为当前大模型中极具灵活性与实用性的“智能工作引擎”，特别适合需要在‌响应速度、计算成本与输出质量之间动态平衡‌的开发者与企业级应用。

‌“思考模式”自由切换：真正实现按需智能‌
Gemini 2.5 Flash-Thinking 最大的突破在于其‌混合推理架构（Hybrid Reasoning）‌，允许用户通过 API 参数 thinking_config 显式开启或关闭“思考”过程。

当 thinking_budget = 0 时，模型以“直觉模式”运行，响应极快、成本最低，适用于语法检查、内容摘要等轻量任务；
当设置 thinking_budget > 0（最高可达 ‌24,576 tokens‌）时，模型进入“深思模式”，会主动拆解问题、验证逻辑、规划步骤，显著提升数学解题、代码生成和复杂推理的准确性。

‌百万级上下文 + 多模态原生支持‌
与整个 Gemini 2.5 系列一致，Flash-Thinking 拥有高达 ‌100万 token‌ 的上下文窗口，可处理整本技术文档、长视频字幕或大型代码库。
同时支持‌文本、图像、音频、视频输入‌，并能调用谷歌搜索、代码执行等工具，实现跨模态理解与行动闭环。
‌极致性价比：性能接近 Pro，成本仅为零头‌
在 LMArena 和 CAR-bench 等第三方评测中，开启思考后的 Gemini 2.5 Flash 在多项任务上表现接近 Gemini 2.5 Pro，但延迟更低、价格更优。

免费体验最新的AI大模型，支持对话、写作、编程、图像、视频等多种功能

免费体验最新的AI大模型，支持对话、写作、编程、图像、视频等多种功能

‌Veo3.1-Components-4K是谷歌DeepMind推出的面向企业级工业化视频生产的高阶模块化模型，专

Veo3.1-Components是Google推出的模块化视频生成专用模型，专为需要高精度控制与多组件协同的

‌Veo3Pro是谷歌DeepMind在2025年I/O大会上推出的旗舰级AI视频生成模型，作为全球首款实现“

Gemini2.5Pro-NoThinking是Gemini2.5Pro系列中专为“极速响应”场景设计的轻量推理模式版本

‌Gemini2.5Flash-Thinking是谷歌Gemini2.5系列中首个支持“可控深度思考”的混合推理模型，

Gemini2.5Pro是谷歌DeepMind推出的旗舰级“思考型”多模态大模型，被官方称为其研发至今最智

Gemini2.5Flash是谷歌推出的一款高效能、低延迟的混合推理AI模型，专为高吞吐量和实时应用场

Gemini3Pro-Preview-Thinking‌并非一个独立的模型，而是‌Gemini3ProPreview‌模型在启用“