gemini-3.1-flash-lite-preview-thinking-medium
Google模型
Gemini 3.1 Flash-Lite Preview (thinking level: Medium) 是谷歌于2026年3月推出的 Gemini 3 系列中速度最快、性价比最高的轻量级智能模型,专为大规模高频任务设计,在保持极低延迟与成本的同时,支持“中等思考深度”(Medium thinking level),可在响应速度与推理能力之间实现动态平衡,适用于从批量内容处理到多步复杂工作流的广泛场景。
该模型是 Gemini 3.1 Flash-Lite 的增强推理版本,通过启用 thinking_level=medium 参数,赋予其处理需要适度逻辑推演任务的能力,打破了“轻量即弱智”的传统认知,在编程辅助、多模态理解与智能代理(Agent)任务中表现亮眼。
核心性能与基准表现
极致响应速度与生成效率
首Token响应时间(TTFT)比 Gemini 2.5 Flash 快 2.5 倍,实现“零延迟”交互体验;
每秒输出 Token 数达 389 个,在 Artificial Analysis 生成速度榜单中排名第一;
支持 100 万 Token 上下文窗口,可处理整本小说、长篇代码库或复杂多模态文档 。
卓越的智能表现(超越前代旗舰)
在 Arena.ai 排行榜中获得 1432 Elo 分,与 Grok-4.1-fast 水平相当;
推理能力测试 GPQA Diamond 得分 86.9%;
多模态理解测试 MMMU Pro 得分 76.8%,均超越前代更大模型如 Gemini 2.5 Flash 。
可调节的“思考层级”(Thinking Levels)
多步指令执行
简单代码生成与调试
结构化数据提取(如 JSON 输出)
工具调用与函数调用(Function Calling)
支持 MINIMAL、MEDIUM、HIGH 三级思考控制,本模型设定为 MEDIUM,适合:
开发者可通过 reasoning_effort="medium" 参数直接调用,无需修改代码逻辑 。
多模态输入与结构化输出
支持 文本、图像、音频、视频、PDF 等多模态输入;
可配置输出为 JSON 格式,便于系统集成;
支持 Thought Signatures,确保多轮对话与工具调用中的上下文一致性 。
成本与计费优势
表格
💡 说明:该价格仅为大型模型(如 Gemini 3 Pro)的一小部分,特别适合对成本敏感但又需一定推理能力的大规模部署场景。
典型应用场景
✅ 批量翻译与内容审核:高速处理海量用户生成内容(UGC),支持多语言;
✅ 电商自动化:快速生成商品描述、SEO标题、营销文案;
✅ SaaS 智能体(Agent)构建:创建能执行多步骤任务的企业级 AI 助手;
✅ 动态仪表盘生成:结合实时天气、金融数据生成可视化报告;
✅ 教育辅助:为学生提供中等复杂度的解题思路与代码讲解。
免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能
免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能
Google模型推荐
gemini-3.1-pro-preview-thinkin
Gemini3.1Pro-Preview(thinkinglevel:Medium)是GoogleDeepMind于2026年2月推出的旗舰级多
gemini-3.1-flash-lite-preview-
Gemini3.1Flash-LitePreview(thinkinglevel:Medium)是谷歌于2026年3月推出的Gemini3系列中速
veo3.1-components-4k
Veo3.1-Components-4K是谷歌DeepMind推出的面向企业级工业化视频生产的高阶模块化模型,专
veo3.1-components
Veo3.1-Components是Google推出的模块化视频生成专用模型,专为需要高精度控制与多组件协同的
veo3-pro
Veo3Pro是谷歌DeepMind在2025年I/O大会上推出的旗舰级AI视频生成模型,作为全球首款实现“
gemini-2.5-pro-nothinking
Gemini2.5Pro-NoThinking是Gemini2.5Pro系列中专为“极速响应”场景设计的轻量推理模式版本
gemini-2.5-flash-thinking
Gemini2.5Flash-Thinking是谷歌Gemini2.5系列中首个支持“可控深度思考”的混合推理模型,
gemini-2.5-pro
Gemini2.5Pro是谷歌DeepMind推出的旗舰级“思考型”多模态大模型,被官方称为其研发至今最智