deepseek-v3-1-terminus

DeepSeek模型

字体:

DeepSeek-V3.1-Terminus‌ 是深度求索(DeepSeek)于 ‌2025年9月22日‌ 发布的 DeepSeek-V3.1 系列的最终优化版本,其命名“Terminus”(拉丁语意为“终点”)暗示该版本为 V3.1 架构的成熟收官之作 ‌ 。 

核心功能与改进 ‌语言一致性优化‌ 显著减少中英文混杂输出及异常字符(如“极”“extreme”等随机插入)问题,提升多语言处理稳定性 ‌。  ‌

增强智能体(Agent)能力‌ ‌Code Agent‌:代码生成与执行更可靠,在编程竞赛和实际开发任务中表现更稳定。 ‌

Search Agent‌:信息检索与交叉验证能力提升,能更准确整合多源信息并给出高可信度回答 ‌ 。 ‌

双模式推理支持‌ ‌非思考模式(deepseek-chat)‌:默认输出长度 4K,最高 8K,适合快速响应任务。 ‌

思考模式(deepseek-reasoner)‌:默认输出长度 32K,最高 64K,适用于复杂推理与长文本生成 ‌ 。 ‌

高性价比与高效推理‌ 输入成本:缓存命中 0.5 元 / 百万 tokens,未命中 4 元 / 百万 tokens。 输出成本:12 元 / 百万 tokens ‌ 。 

支持 128K 长上下文,推理延迟低,吞吐量高 ‌ 。 ‌

多模态能力扩展(部分资料提及)‌ 虽主要为语言模型,但有资料称其在 V3.1 基础上重构了多模态交互架构,支持文本、图像、视频的统一语义表示,在跨模态检索和视频理解任务中表现优异 ‌ 。不过此点在多数权威资料中未强调,可能属于特定实验版本或未来方向。 ‌开源与生态支持‌ 模型已开源,可在 Hugging Face 和 ModelScope 获取 ‌ 。 提供 API 接口,支持 Python、cURL、Node.js 等多种接入方式 ‌ 。 

DeepSeek更新至V3.1 Terminus版本:两大升级 头像 快科技 刚刚,DeepSeek发了“终极版”! 头

像 智东西 技术亮点(来自深度分析) ‌混合专家架构(DeepSeekMoE)‌:总参数 6850 亿,但每个 token 仅激活约 370 亿,实现高效率与低成本平衡 ‌ 。

 ‌多头潜注意力(MLA)‌:缓存体积减少 80% 以上,长序列推理效率显著提升 ‌ 。 ‌多令牌预测(MTP)‌:提升训练效率 1.8 倍,推理吞吐量提升近 2 倍 ‌。 ‌

量化支持‌:提供 w8a8 量化版本(如 QuaRot),在保持功能调用能力的同时降低部署成本 ‌ 。 

⚠️ 注意:当前主流平台(如官方 App、网页端、API)均已默认使用 ‌DeepSeek-V3.1-Terminus‌ 版本,无需手动切换 ‌。数字先锋API已集成该模型。 

立即使用大模型

免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能

立即使用此模型

免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能