deepseek-v4-flash

DeepSeek模型

字体:

DeepSeek-V4-Flash‌ 是深度求索(DeepSeek)公司于 ‌2026年4月24日‌ 发布的高效轻量化大模型,属于 DeepSeek-V4 系列中的“快速模式”版本,主打‌高性价比、低延迟与高吞吐‌,适用于简单 Agent 任务和高并发场景 ‌。


核心参数与能力

  • ‌总参数量‌:284B

  • ‌激活参数量‌:13B

  • ‌上下文长度‌:‌1M(一百万 token)‌,支持处理超长文本(如三本《三体》)‌

  • ‌推理效率‌:相比前代模型,KV 缓存占用缩减至 ‌10%‌,推理 FLOPs 降低至 ‌27%‌ ‌

  • ‌世界知识‌:略逊于 V4-Pro,但优于多数开源模型 ‌

  • ‌推理能力‌:在数学、代码、逻辑推理等方面接近 V4-Pro,尤其在简单任务中表现相当 ‌15

  • ‌Agent 能力‌:在简单任务中与 V4-Pro 旗鼓相当;高难度任务仍有差距 ‌15


技术亮点

  • ‌混合稀疏注意力机制‌(CSA + HCA):

    • ‌CSA‌(压缩稀疏注意力):每 4 个 token 压缩为 1 个,结合轻量索引器精读关键内容

    • ‌HCA‌(高度压缩注意力):每 128 个 token 压缩为 1 个,提供全局摘要 ‌

  • ‌FP4 + FP8 混合精度训练‌,支持昇腾 950 等国产芯片原生格式 ‌

  • ‌Muon 优化器‌ + ‌mHC(流形约束超连接)‌,提升深层训练稳定性与收敛速度 ‌

  • ‌支持 OpenAI 与 Anthropic 双标准 API 接口‌,降低开发者迁移成本 ‌


成本与定价(官方 API)

项目

V4-Flash 价格(人民币)



输入(缓存命中)

‌0.2 元 / 百万 Token‌

输入(未命中)

‌1 元 / 百万 Token‌

输出

‌2 元 / 百万 Token‌



适用场景

  • ‌高频率、低复杂度 Agent 任务‌(如自动回复、数据提取)

  • ‌长文本处理‌(法律文书、技术文档、代码库分析)

  • ‌成本敏感型应用‌(需大规模并发或 7×24 小时运行)

立即使用大模型

免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能

立即使用此模型

免费体验最新的AI大模型,支持对话、写作、编程、图像、视频等多种功能