glm-4.5-flash

智谱模型

字体:

‌GLM-4.5-Flash‌ 是智谱AI于2025年7月发布的 ‌GLM-4.5 系列中的免费轻量级模型‌,专为高效率、低成本场景设计,适用于个人开发者、教育及轻量级商业应用。

以下是其核心介绍:


‌关键特性‌

  • ‌完全免费‌:支持免费调用 API,无调用次数限制(早期活动提供免费微调资源)‌。

  • ‌超长上下文‌:支持 ‌128K tokens‌ 的上下文窗口,可处理万字级文档或多轮复杂对话‌。

  • ‌混合推理模式‌:

    • ‌思考模式(Thinking)‌:用于数学证明、逻辑推理等复杂任务,生成可追溯的推理过程。

    • ‌非思考模式(Non-thinking)‌:用于简单问答、翻译等,实现毫秒级响应。

    • 可通过 thinking.type 参数控制(enabled/disabled),默认动态切换‌。

  • ‌多工具协同‌:支持网页浏览、函数调用(Function Call)、结构化输出(JSON/XML)等,可接入 Claude Code、Roo Code 等智能体‌37。

  • ‌高速生成‌:在高速模式下可达 ‌100 tokens/秒‌,适合交互式应用‌。

  • ‌轻量化部署‌:可在消费级 GPU 上运行,适合中小企业与个人开发者‌



立即使用大模型

免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能

立即使用此模型

免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能