kimi-k2.6

Moonshot模型

字体:

‌Kimi K2.6‌ 是由月之暗面(Moonshot AI)于 ‌2026年4月20日‌ 正式发布并开源的大语言模型,被官方称为“迄今最强代码模型”‌‌。该模型在长程编码、Agent(智能体)集群能力、端到端任务交付等方面实现显著跃升,标志着其从“信息容器”向“执行引擎”的战略转型‌‌。


核心能力亮点

  • ‌长程编码能力‌

    • 支持 ‌连续13小时不间断编码‌,单次任务可编写或修改 ‌超过4000行代码‌‌‌。

    • 成功重构8年历史的开源金融撮合引擎 exchange-core,中位吞吐量提升 ‌185%‌‌‌。

    • 在Mac本地用Zig语言优化LLM推理,4000+次工具调用后吞吐量从15提升至193 tokens/s‌‌。

  • ‌Agent集群与协同‌

    • 支持 ‌最多300个子Agent并行协作‌,完成 ‌4000个协作步骤‌(K2.5为100个Agent、1500步)‌‌。

    • 可一次性交付多类型产物(如PDF报告、Excel、PPT、React网站),确保内容同源、数据一致‌‌。

    • 内部RL基础设施团队已实现 ‌K2.6驱动Agent连续5天自主运行‌,用于监控告警与故障响应‌‌。

  • ‌代码+视觉融合能力‌

    • 能根据单一提示词生成 ‌完整可交付的Web应用‌,包含前端UI、交互逻辑、后端服务‌‌。

    • 示例:生成“近地轨道旅行公司ORBITAL”官网,含太空舱座位预订、SVG动效、全栈功能‌‌。

    • 在设计任务中展现“审美判断”,能根据行业(如花店、婚纱)自动适配视觉风格‌‌。

  • ‌基准测试表现‌

    • ‌SWE-Bench Pro(软件工程实战)‌:58.6分,超越GPT-5.4(57.7)‌‌。

    • ‌DeepSearchQA(深度检索)‌:F1达92.5%,领先GPT-5.4(78.6%)‌‌。

    • ‌HLE“人类最后的考试”(工具增强版)‌:54.0分,登顶开源模型‌‌。

    • ‌短板‌:纯数学推理(如AIME 2026得96.4%,低于GPT-5.4的99.2%)‌‌。


技术架构与效率

  • ‌混合专家(MoE)架构‌:总参数1万亿(1T),每token激活320亿(32B),上下文长度256K‌‌。

  • ‌KVCache压缩‌:通过“Prefill-as-a-Service”与混合注意力架构,将KVCache流量压缩 ‌13–36倍‌,大幅降低算力成本‌‌。

  • ‌三层记忆机制‌:

    1. ‌工作记忆‌:128K Token动态压缩;

    2. ‌情景记忆‌:向量数据库存储关键决策;

    3. ‌程序记忆‌:编码模式与最佳实践嵌入模型权重‌‌。


商业化与开源策略

  • ‌开源协议‌:采用 ‌Apache 2.0 协议‌,支持本地部署、商用与二次开发‌‌。

  • ‌API定价‌(较K2.5上调):

    • 输入:$0.95/百万Token(缓存未命中),‌+58%‌;

    • 输出:$4.00/百万Token,‌+33%‌‌‌。

  • ‌商业模式‌:开源底座 + 企业级Agent集群服务(如Claw Groups异构协作生态)‌‌。

  • ‌估值‌:发布时达 ‌180亿美元‌,计划2026年下半年IPO‌‌。


使用方式

  • 免费体验:Kimi官网 或最新版Kimi App

  • 开发者调用:API指定模型 kimi-k2.6,上下文256K(约262K tokens)‌‌

  • 数字先锋API平台同步上线


立即使用大模型

免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能

立即使用此模型

免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能