claude-opus-4-5-20251101
Claude模型
Claude Opus 4.5-20251101 是 Anthropic 公司于 2025 年 11 月 24 日发布的旗舰级 AI 大模型,是 Claude Opus 4 系列的升级版本,在编程能力、智能体任务处理和多模态交互方面实现了显著突破。
核心能力与性能:
编程能力:在 SWE-bench Verified(现实世界软件工程基准)测试中准确率达到 80.9%,刷新行业纪录,显著超越 GPT-5.1 Codex-Max(77.9%)和 Gemini 3 Pro(76.2%)。 2 它能自主处理模糊需求、定位复杂系统级 Bug,并能单次生成 3500 行代码完整复刻《我的世界》游戏。
长任务处理:在 METR 测试中,其 50% 任务完成时间跨度长达 4 小时 49 分钟,是当时已公布的最长记录,展现了处理持久、复杂任务的卓越能力。 1
多模态与工具集成:上下文窗口扩展至 200K tokens,支持文本、图像和代码的跨模态整合。模型已深度集成至 Microsoft Excel、GitHub Copilot、Microsoft Copilot Studio 等产品,可作为内嵌式助手直接进行数据分析、公式生成和代码生成。
技术特性:
效率优化:API 新增 effort 参数,可平衡成本与性能,在中等努力度设置下输出 tokens 用量减少 76%。
安全与稳定性:安全防护能力可有效抵御提示词注入攻击,在内部评估中表现优于 GPT-5.1 和 Gemini 3 Pro。
语言支持:对新兴编程语言 MoonBit 提供原生支持,并能高效批量翻译其他语言代码至 MoonBit。
可用性与定价:
部署平台:可通过 Anthropic 官方应用、API 以及 AWS、Google Cloud、Microsoft Azure 三大云平台访问。
API 调用:在 API 中使用模型名为 claude-opus-4-5-20251101。
较前代 Claude Opus 4 价格直降约 67%。
该模型在 2026 年 1 月的升级版 LiveBench 榜单中排名第一,被广泛认为是当前性能领先的编程模型之一。
免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能
免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能