1 篇博文含有标签「大语言模型」

DeepSeek-V4 全面解读：百万上下文、MoE 架构升级、双模型策略

2026年4月25日 · 阅读需 7 分钟

全栈开发者

2026 年 4 月 24 日，深度求索发布了全新系列模型 DeepSeek-V4 的预览版，同步上线网页端、App 和 API，并在 HuggingFace 和 ModelScope 开源权重。

这是 DeepSeek 继 V3 之后的又一次大版本迭代。不绕弯子，先说结论：V4 的核心变化不是"更大"，而是"更省"——用更少的激活参数和显存，实现了更强的推理和 Agent 能力，同时把百万 token 上下文做成了标配。