跳到主要内容

3 篇博文含有标签「开源模型」

查看所有标签

DeepSeek-V4 全面解读：百万上下文、MoE 架构升级、双模型策略

2026年4月25日 · 阅读需 7 分钟

全栈开发者

2026 年 4 月 24 日，深度求索发布了全新系列模型 DeepSeek-V4 的预览版，同步上线网页端、App 和 API，并在 HuggingFace 和 ModelScope 开源权重。

这是 DeepSeek 继 V3 之后的又一次大版本迭代。不绕弯子，先说结论：V4 的核心变化不是"更大"，而是"更省"——用更少的激活参数和显存，实现了更强的推理和 Agent 能力，同时把百万 token 上下文做成了标配。

Gemma 4 值不值得上手：从部署视角看它的手感和边界

2026年4月13日 · 阅读需 7 分钟

全栈开发者

先说清楚，这篇不是“我已经把 Gemma 4 全档位私有化跑了几周”的深测报告。更准确地说，它是一篇部署者视角的第一判断：只看官方文档、官方模型卡、上下文长度、模态支持、部署门槛和公开 benchmark 位置，Gemma 4 用起来会像什么样的模型。

Gemma 4 模型说明：E2B、E4B、26B A4B、31B Dense 怎么选

2026年4月12日 · 阅读需 6 分钟

全栈开发者

如果只看标题，很多人会以为 Gemma 4 是一个单一模型，再往下分几个参数档位。真正去看官方文档和模型卡以后，我更愿意把它理解成一条产品线，而不是一个点。因为这次 Google 给出来的，不只是“大一点和小一点”的差别，而是从 edge 到 workstation / server 的一整套部署带宽设计。