跳到主要内容

3 篇博文 含有标签「开源模型」

查看所有标签

DeepSeek-V4 全面解读:百万上下文、MoE 架构升级、双模型策略

· 阅读需 7 分钟
一介布衣
全栈开发者

2026 年 4 月 24 日,深度求索发布了全新系列模型 DeepSeek-V4 的预览版,同步上线网页端、App 和 API,并在 HuggingFace 和 ModelScope 开源权重。

这是 DeepSeek 继 V3 之后的又一次大版本迭代。不绕弯子,先说结论:V4 的核心变化不是"更大",而是"更省"——用更少的激活参数和显存,实现了更强的推理和 Agent 能力,同时把百万 token 上下文做成了标配。

Gemma 4 值不值得上手:从部署视角看它的手感和边界

· 阅读需 7 分钟
一介布衣
全栈开发者

先说清楚,这篇不是“我已经把 Gemma 4 全档位私有化跑了几周”的深测报告。更准确地说,它是一篇部署者视角的第一判断:只看官方文档、官方模型卡、上下文长度、模态支持、部署门槛和公开 benchmark 位置,Gemma 4 用起来会像什么样的模型。

Gemma 4 模型说明:E2B、E4B、26B A4B、31B Dense 怎么选

· 阅读需 6 分钟
一介布衣
全栈开发者

如果只看标题,很多人会以为 Gemma 4 是一个单一模型,再往下分几个参数档位。真正去看官方文档和模型卡以后,我更愿意把它理解成一条产品线,而不是一个点。因为这次 Google 给出来的,不只是“大一点和小一点”的差别,而是从 edge 到 workstation / server 的一整套部署带宽设计。