claude-sonnet-4-5-20250929

Claude模型

字体:

‌Claude Sonnet 4.5(模型ID:claude-sonnet-4-5-20250929)是Anthropic于2025年9月30日发布的高性能AI模型,定位为“最强编码模型”与“复杂智能体构建引擎”,在软件工程、计算机操作、专业推理与安全对齐方面实现全面突破,是企业级AI应用的中坚力量‌ 。


核心能力:不止于编程,更是“会用电脑的AI”

Claude Sonnet 4.5 不仅擅长写代码,更被设计为能‌在真实计算机环境中自主完成多步骤任务的智能体核心‌。Anthropic官方称其为“全球最擅长操作计算机的模型” 。

🚀 三大核心优势

  1. ‌顶尖编程能力‌
    在衡量真实软件工程能力的 ‌SWE-bench Verified‌ 测试中,Claude Sonnet 4.5 以 ‌77.2%‌ 的得分位居行业第一,启用并行测试时计算(parallel test-time compute)后可达 ‌82%‌,超越 GPT-5 Codex(74.5%)和 Gemini 2.5 Pro(67.2%)。

  2. ‌卓越计算机操作能力‌
    在模拟真实桌面环境操作的 ‌OSWorld‌ 基准测试中,其任务完成率达 ‌61.4%‌,较前代 Sonnet 4 的 42.2% 实现大幅跃升 。这意味着它能真正执行如“打开浏览器→搜索资料→填写表格→保存文件”这类完整工作流 。

  3. ‌超强长时任务稳定性‌
    模型可在复杂多步骤任务中‌连续专注超过30小时‌,全程稳定输出高质量代码或操作指令,是构建持久型AI智能体的理想选择 。


安全与对齐:迄今为止“最听话”的Claude模型

Sonnet 4.5 是 Anthropic ‌AI Safety Level 3(ASL-3)‌ 框架下的重要成果,通过广泛的安全训练,在减少谄媚(sycophancy)、欺骗、权力寻求等不良行为方面取得显著进展 。

  • ✅ 首次引入‌可解释性技术‌验证安全性,提升模型行为透明度 。

  • ✅ 内置针对‌化学、生物、放射、核(CBRN)‌ 高风险内容的分类器,误报率相比前代降低十倍(从0.15%降至0.02%)。

  • ✅ 强化对‌提示注入攻击‌的防御,保障智能体在开放环境中的安全性 。


开发者工具与API增强

为支持复杂AI智能体的构建,Anthropic同步推出 ‌Claude Agent SDK‌,开放其内部构建Claude Code的底层框架,解决长期记忆管理、权限平衡、子智能体协同等核心难题 。

API关键更新

表格

功能

说明



‌上下文编辑‌

自动清理旧工具调用,防止上下文溢出

‌记忆工具(Beta)‌

跨会话存储与调用信息,支持长周期任务

‌新停止原因提示‌

明确标识 model_context_window_exceeded,便于调试

‌工具参数修复‌

解决字符串尾部换行被截断问题,确保格式精确

‌Token计数优化‌

系统自动添加的优化Token不向用户收费

💡 实测显示,结合记忆工具与上下文编辑,开发者可构建出能“记住上周任务进度”并“自动回滚到检查点”的智能办公助手 。


立即使用大模型

免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能

立即使用此模型

免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能