kimi-k2-thinking

Moonshot模型

字体:

Kimi-K2-Thinking‌ 是由月之暗面(Moonshot AI)于 ‌2025年11月6日‌ 发布的开源通用 Agentic 思考模型,主打 ‌深度推理‌ 与 ‌多轮工具调用‌ 能力,被官方称为“Kimi 迄今能力最强的开源思考模型”‌


核心特性

  • 模型规模‌:

    • 总参数量:‌1万亿(1T)

    • 激活参数量:‌320亿(32B)

    • 架构:‌稀疏混合专家(MoE)‌,每 token 激活约 32B 参数

    • 上下文窗口:‌256K tokens

    • 量化方式:‌原生 INT4 量化‌,通过量化感知训练(QAT)实现无损加速,推理速度提升约 ‌2 倍‌,显存占用减半‌

  • Agentic 能力‌:

    • 支持 ‌200–300 次连续工具调用‌,无需人工干预

    • 可在搜索、编程、浏览、计算等工具间动态切换,构建“思考 → 工具调用 → 反思 → 再调用”的闭环推理链‌

    • 在 ‌BrowseComp‌(自主搜索)、‌SWE-bench‌(编程)、‌HLE‌(人类终极考试)等基准中表现优异

  • 性能表现(部分 SOTA 结果)‌‌23

    • HLE(带工具)‌:44.9%(超越 GPT-5 High 的 41.7%)

    • BrowseComp‌:60.2%(远超人类平均 29.2%)

    • SWE-bench Verified‌:71.3%

    • Artificial Analysis 智能体评测‌:93% 得分(发布初期创纪录)

  • 部署与成本‌:

    • 输入(缓存未命中):‌4元/百万 tokens‌(约 0.56 美元)

    • 输出:‌16元/百万 tokens‌(约 2.22 美元)‌

    • 支持在 ‌单张消费级 GPU(如 RTX 4090)‌ 上运行(通过 KTransformers 框架)‌

    • API 成本(2025年11月数据):


立即使用大模型

免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能

立即使用此模型

免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能