deepseek-v3-1-terminus

DeepSeek模型

字体：大中小

对话推理

DeepSeek-V3.1-Terminus‌ 是深度求索（DeepSeek）于 ‌2025年9月22日‌ 发布的 DeepSeek-V3.1 系列的最终优化版本，其命名“Terminus”（拉丁语意为“终点”）暗示该版本为 V3.1 架构的成熟收官之作 ‌ 。

核心功能与改进 ‌语言一致性优化‌ 显著减少中英文混杂输出及异常字符（如“极”“extreme”等随机插入）问题，提升多语言处理稳定性 ‌。 ‌

增强智能体（Agent）能力‌ ‌Code Agent‌：代码生成与执行更可靠，在编程竞赛和实际开发任务中表现更稳定。 ‌

Search Agent‌：信息检索与交叉验证能力提升，能更准确整合多源信息并给出高可信度回答 ‌ 。 ‌

双模式推理支持‌ ‌非思考模式（deepseek-chat）‌：默认输出长度 4K，最高 8K，适合快速响应任务。 ‌

思考模式（deepseek-reasoner）‌：默认输出长度 32K，最高 64K，适用于复杂推理与长文本生成 ‌ 。 ‌

高性价比与高效推理‌ 输入成本：缓存命中 0.5 元 / 百万 tokens，未命中 4 元 / 百万 tokens。输出成本：12 元 / 百万 tokens ‌ 。

支持 128K 长上下文，推理延迟低，吞吐量高 ‌ 。 ‌

多模态能力扩展（部分资料提及）‌ 虽主要为语言模型，但有资料称其在 V3.1 基础上重构了多模态交互架构，支持文本、图像、视频的统一语义表示，在跨模态检索和视频理解任务中表现优异 ‌ 。不过此点在多数权威资料中未强调，可能属于特定实验版本或未来方向。 ‌开源与生态支持‌ 模型已开源，可在 Hugging Face 和 ModelScope 获取 ‌ 。提供 API 接口，支持 Python、cURL、Node.js 等多种接入方式 ‌ 。

DeepSeek更新至V3.1 Terminus版本:两大升级头像快科技刚刚,DeepSeek发了“终极版”! 头

像智东西技术亮点（来自深度分析） ‌混合专家架构（DeepSeekMoE）‌：总参数 6850 亿，但每个 token 仅激活约 370 亿，实现高效率与低成本平衡 ‌ 。

‌多头潜注意力（MLA）‌：缓存体积减少 80% 以上，长序列推理效率显著提升 ‌ 。 ‌多令牌预测（MTP）‌：提升训练效率 1.8 倍，推理吞吐量提升近 2 倍 ‌。 ‌

量化支持‌：提供 w8a8 量化版本（如 QuaRot），在保持功能调用能力的同时降低部署成本 ‌ 。

⚠️ 注意：当前主流平台（如官方 App、网页端、API）均已默认使用 ‌DeepSeek-V3.1-Terminus‌ 版本，无需手动切换 ‌。数字先锋API已集成该模型。

立即使用大模型

免费体验最新的AI大模型，支持对话、写作、编程、图像、视频等多种功能

立即使用此模型

免费体验最新的AI大模型，支持对话、写作、编程、图像、视频等多种功能

DeepSeek模型推荐

deepseek-v3-1-terminus

DeepSeek-V3.1-Terminus‌是深度求索（DeepSeek）于‌2025年9月22日‌发布的DeepSeek-V3.1系列

deepseek-r1-search

DeepSeek-R1‌是由DeepSeek公司推出的一系列基于强化学习的开源推理大模型，其核心功能主要体

deepseek-v3.1

‌DeepSeek-V3.1‌是由深度求索（DeepSeek）于2025年9月发布的面向AI编程与多模态推理的高性能

deepseek-v3.2

DeepSeek-V3.2是由深度求索（DeepSeek）公司于2025年9月发布的开源大语言模型系列，其核心目标

deepseek-reasoner

DeepSeek推理模型（deepseek-reasoner）是一款基于深度学习技术的先进推理引擎，专为解决复杂的

deepseek-coder

DeepSeek-Coder是由DeepSeek团队开发的一系列专为代码生成与理解任务优化的大语言模型，其最

deepseek-chat

DeepSeek-Chat是由深度求索（DeepSeek）研发的一系列专为对话场景优化的大规模语言模型，以其高