gemini-2.5-flash

Google模型

字体：大中小

推理

Gemini 2.5 Flash 是谷歌推出的一款高效能、低延迟的混合推理AI模型，专为高吞吐量和实时应用场景设计，在性能、成本与响应速度之间实现了优秀平衡‌ 。

该模型于2025年4月10日首次发布，定位为兼顾质量与效率的“混合推理”模型，支持开发者通过API动态调整其“思考预算”（Reasoning Budget），以灵活控制推理深度和计算成本。这一机制使得Gemini 2.5 Flash既能处理简单请求时快速响应，也能在复杂任务中开启深度思考以提升准确性。

核心特性：

‌动态可控推理能力‌
支持开启或关闭“思考模式”，用户可根据任务需求设置从0到24,576 token的思考预算。关闭时成本大幅降低，开启后可显著提升在数学、编码和知识问答等任务中的表现。
‌超长上下文支持‌
拥有高达 ‌100万token‌ 的上下文窗口，适用于长文档分析、多轮对话、大型代码库理解等场景。
‌原生多模态支持‌
能够处理文本、图像、音频和视频输入，并生成多模态输出，广泛适用于客户服务、内容审核、智能助手等复杂应用环境。
‌工具调用与集成能力‌
支持通过API调用谷歌搜索、代码执行、URL上下文引用等功能，增强信息实时性和实用性。同时可与Firebase AI Logic SDK集成，便于Android和Web应用开发。
‌卓越性价比与性能‌
在CAR-bench评测中，Gemini 2.5 Flash展现出 ‌1.1秒‌ 的平均响应时间，运行100个基础任务仅需约 ‌0.02美元‌，位于当前大模型的帕累托前沿（Pareto Frontier），即在相同成本下性能最优或相同性能下成本最低。
‌广泛应用场景‌
适合用于文档解析、实时客服系统、自动化摘要、轻量级AI代理等对延迟敏感且需高并发的任务。

立即使用大模型

免费体验最新的AI大模型，支持对话、写作、编程、图像、视频等多种功能

立即使用此模型

免费体验最新的AI大模型，支持对话、写作、编程、图像、视频等多种功能

Google模型推荐

veo3.1-components-4k

‌Veo3.1-Components-4K是谷歌DeepMind推出的面向企业级工业化视频生产的高阶模块化模型，专

veo3.1-components

Veo3.1-Components是Google推出的模块化视频生成专用模型，专为需要高精度控制与多组件协同的

veo3-pro

‌Veo3Pro是谷歌DeepMind在2025年I/O大会上推出的旗舰级AI视频生成模型，作为全球首款实现“

gemini-2.5-pro-nothinking

Gemini2.5Pro-NoThinking是Gemini2.5Pro系列中专为“极速响应”场景设计的轻量推理模式版本

gemini-2.5-flash-thinking

‌Gemini2.5Flash-Thinking是谷歌Gemini2.5系列中首个支持“可控深度思考”的混合推理模型，

gemini-2.5-pro

Gemini2.5Pro是谷歌DeepMind推出的旗舰级“思考型”多模态大模型，被官方称为其研发至今最智

gemini-2.5-flash

Gemini2.5Flash是谷歌推出的一款高效能、低延迟的混合推理AI模型，专为高吞吐量和实时应用场

gemini-3-pro-preview-thinking

Gemini3Pro-Preview-Thinking‌并非一个独立的模型，而是‌Gemini3ProPreview‌模型在启用“