deepseek-v4-flash
DeepSeek模型
DeepSeek-V4-Flash 是深度求索(DeepSeek)公司于 2026年4月24日 发布的高效轻量化大模型,属于 DeepSeek-V4 系列中的“快速模式”版本,主打高性价比、低延迟与高吞吐,适用于简单 Agent 任务和高并发场景 。
核心参数与能力
总参数量:284B
激活参数量:13B
上下文长度:1M(一百万 token),支持处理超长文本(如三本《三体》)
推理效率:相比前代模型,KV 缓存占用缩减至 10%,推理 FLOPs 降低至 27%
世界知识:略逊于 V4-Pro,但优于多数开源模型
推理能力:在数学、代码、逻辑推理等方面接近 V4-Pro,尤其在简单任务中表现相当 15
Agent 能力:在简单任务中与 V4-Pro 旗鼓相当;高难度任务仍有差距 15
技术亮点
混合稀疏注意力机制(CSA + HCA):
CSA(压缩稀疏注意力):每 4 个 token 压缩为 1 个,结合轻量索引器精读关键内容
HCA(高度压缩注意力):每 128 个 token 压缩为 1 个,提供全局摘要
FP4 + FP8 混合精度训练,支持昇腾 950 等国产芯片原生格式
Muon 优化器 + mHC(流形约束超连接),提升深层训练稳定性与收敛速度
支持 OpenAI 与 Anthropic 双标准 API 接口,降低开发者迁移成本
成本与定价(官方 API)
项目
V4-Flash 价格(人民币)
输入(缓存命中) | 0.2 元 / 百万 Token |
输入(未命中) | 1 元 / 百万 Token |
输出 | 2 元 / 百万 Token |
适用场景
高频率、低复杂度 Agent 任务(如自动回复、数据提取)
长文本处理(法律文书、技术文档、代码库分析)
成本敏感型应用(需大规模并发或 7×24 小时运行)
免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能
免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能
DeepSeek模型推荐
deepseek-v4-pro
DeepSeek-V4-Pro是深度求索(DeepSeek)于2026年4月24日发布并开源的旗舰级大语言模型,
deepseek-v4-flash
DeepSeek-V4-Flash是深度求索(DeepSeek)公司于2026年4月24日发布的高效轻量化大模型,
deepseek-v3-1-terminus
DeepSeek-V3.1-Terminus是深度求索(DeepSeek)于2025年9月22日发布的DeepSeek-V3.1系列
deepseek-r1-search
DeepSeek-R1是由DeepSeek公司推出的一系列基于强化学习的开源推理大模型,其核心功能主要体
deepseek-v3.1
DeepSeek-V3.1是由深度求索(DeepSeek)于2025年9月发布的面向AI编程与多模态推理的高性能
deepseek-v3.2
DeepSeek-V3.2是由深度求索(DeepSeek)公司于2025年9月发布的开源大语言模型系列,其核心目标
deepseek-reasoner
DeepSeek推理模型(deepseek-reasoner)是一款基于深度学习技术的先进推理引擎,专为解决复杂的
deepseek-coder
DeepSeek-Coder是由DeepSeek团队开发的一系列专为代码生成与理解任务优化的大语言模型,其最