跳到主要内容

1 篇博文 含有标签「大语言模型」

查看所有标签

DeepSeek-V4 全面解读:百万上下文、MoE 架构升级、双模型策略

· 阅读需 7 分钟
一介布衣
全栈开发者

2026 年 4 月 24 日,深度求索发布了全新系列模型 DeepSeek-V4 的预览版,同步上线网页端、App 和 API,并在 HuggingFace 和 ModelScope 开源权重。

这是 DeepSeek 继 V3 之后的又一次大版本迭代。不绕弯子,先说结论:V4 的核心变化不是"更大",而是"更省"——用更少的激活参数和显存,实现了更强的推理和 Agent 能力,同时把百万 token 上下文做成了标配。