glm-4.5-air

智谱模型

字体:

GLM-4.5‌ 是由智谱AI于2025年7月28日发布的面向智能体(Agent)应用的基础大模型,旨在统一推理、编码与智能体能力,实现“原生融合”而非模块拼接。该系列包含两个主要版本:‌GLM-4.5‌(旗舰版)和 ‌GLM-4.5-Air‌(轻量版)‌。


核心参数与架构

  • ‌GLM-4.5‌

    • 总参数量:‌3550亿‌

    • 激活参数:‌320亿‌

    • 上下文长度:‌128K tokens‌

    • 架构:混合专家(MoE),含89层,每次前向激活8位专家,共160个专家

    • 注意力机制:分组查询注意力(GQA)+ 部分RoPE + 96个注意力头(隐藏维度5120)

    • 稳定性技术:QK-Norm、Muon优化器、MTP(多标记预测)层用于推测解码

  • ‌GLM-4.5-Air‌

    • 总参数量:‌1060亿‌

    • 激活参数:‌120亿‌

    • 同样支持128K上下文与混合推理模式‌14


主要能力亮点

  • ‌智能体能力‌

    • 原生函数调用、工具使用、网页浏览等

    • 在 ‌BFCL-v3‌ 和 ‌τ-bench‌ 上性能媲美 Claude 4 Sonnet

    • ‌BrowseComp‌ 基准测试正确率达 ‌26.4%‌,显著优于 Claude-4-Opus(18.8%)‌1

  • ‌推理能力‌

    • AIME24(数学竞赛)得分:‌91.0%‌

    • GPQA(科学问答)得分:‌79.1%‌

    • 思考模式支持复杂多步逻辑推理‌

  • ‌编程能力‌

    • SWE-bench Verified 解决率:‌64.2%‌

    • Terminal-Bench 成功率:‌37.5%‌

    • 平均工具调用成功率 ‌90.6%‌,高于 Claude-4-Sonnet(89.5%)‌

    • 在52个真实编程任务中,对 Qwen3-Coder 胜率达 ‌80.8%‌‌


立即使用大模型

免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能

立即使用此模型

免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能