gemini-2.5-pro

Google模型

字体：大中小

推理

Gemini 2.5 Pro 是谷歌 DeepMind 推出的旗舰级“思考型”多模态大模型，被官方称为其研发至今最智能、能力最强的AI模型，在复杂推理、编码、数学与科学任务中表现卓越，是当前生成式AI领域的前沿代表‌。

该模型于2025年3月25日首次以“实验版”形式发布，随后在2025年6月起面向AI Pro和AI Ultra订阅用户全面开放，并逐步集成至Google AI Studio、Vertex AI平台及Gemini应用中。作为Gemini 2.X系列的巅峰之作，它不仅在性能上全面超越前代Gemini 1.5 Pro和Gemini 2.0系列，更在多个权威基准测试中取得‌SOTA（State-of-the-Art）成绩‌，稳居全球大模型排行榜前列。

核心能力亮点：

‌强大的高阶推理能力‌
Gemini 2.5 Pro 是典型的“思考模型”（Thinking Model），能在回应前自主进行多步逻辑推演，显著提升答案准确性。在“Humanity’s Last Exam”（人类最后考试）这一高难度综合知识推理测试中，其无工具辅助得分为 ‌18.8%‌，为当时全球最高纪录。在GPQA Diamond（研究生级专家问答）中得分达 ‌84%‌，接近Claude 3.7 Thinking水平。
‌原生多模态理解与处理‌
支持文本、图像、音频、视频和代码的‌统一输入与协同处理‌，无需外挂模块。例如：

可解析长达 ‌3小时的视频内容‌，识别动作、语义与字幕；
能精准提取复杂PDF中的图表、表格与排版结构，支持千页文档分析；
实现从手绘草图或教学视频直接生成可运行的交互式代码。

‌超大上下文窗口‌
支持高达 ‌100万token‌ 的上下文长度（未来将扩展至200万），可一次性处理整本技术手册、长篇学术论文或大型代码仓库，极大提升了复杂任务的连贯性与完整性。
‌顶尖的编程与代码生成能力‌
在WebDev Arena基准测试中以 ‌+147 Elo分‌ 的绝对优势登顶，能从自然语言描述生成包含响应式布局、动态波形等复杂功能的完整Web应用，UI代码生成精确度高达 ‌95%‌ 。同时支持跨语言代码转换（如Python转TypeScript）与现有逻辑优化。
‌企业级工具集成与部署支持‌

通过Google AI Studio和Vertex AI提供API接口，支持批量处理3000个PDF文件（单文件上限50MB）等重型任务；
支持结构化输出（如JSON）、文件分析、代码执行与隐式缓存等功能，便于开发者集成到生产环境；
提供免费使用额度：每分钟5次请求、每天100次请求、每分钟25万tokens，比OpenAI o3更宽松。

‌创新的“计算机使用”能力‌
基于Gemini 2.5 Pro衍生出的‌Gemini 2.5 Computer Use模型‌，可让AI智能体直接操作图形界面（GUI），执行点击、输入、拖拽等操作，实现浏览器自动化、表单填写、价格比对等任务，在Mind2Web等基准测试中准确率超70%，延迟仅约225毫秒。