小米 MiMo V2.5 — 全球开源第一的大模型，值得一试

2026年5月2日 · 阅读需 4 分钟

一介布衣

全栈开发者

最近大模型圈有个值得关注的事：小米的 MiMo V2.5 系列开放公测了，而且在 Artificial Analysis 榜单上拿下了全球开源大模型综合智能指数第一。

一个做手机和智能家居的公司，AI 模型做到开源第一？我一开始也觉得有点意外，试了一圈之后，确实有点东西。

MiMo V2.5 到底强在哪

先说结论：推理能力很强，多模态能力扎实，代码生成可以直接跑。

推理和逻辑

之前那个经典的"去洗车店洗车，应该走路去还是开车去"的坑，ChatGPT 都栽过，MiMo V2.5 Pro 直接点出关键——要洗的是车不是人，车必须开过去。这种常识推理能力说明模型的逻辑底子是到位的。

多模态理解

MiMo V2.5 支持文本、图像、视频和语音输入。实测丢一张医院检验报告的照片，它能准确识别检查项目、读出数据、给出结论和建议。丢一张模糊的 Switch 照片，logo 都被遮住了，它也能认出来是 Switch OLED 版。

这个能力放到手机端想象空间很大——相机对准东西直接问 AI，导航时用相机定位，扫一下菜单自动翻译。

代码生成

让它写一个解一元二次方程的 HTML 程序，直接能在浏览器跑。加大难度让它写围棋程序，带 UI 的那种，也是一次生成直接运行。对于不会写代码但有需求的人来说，这个能力非常实用。

长文处理

丢给它一篇长文让它总结，2 秒出结果，提炼得很准确。28 页全英文的苹果财报 PDF，也能精准概括重点，给出"iPhone 是绝对功臣""研发投入暴增 31.7%""可穿戴拖后腿"这样的结论。

MiMo Claw — 小米的 Agent 工具

和 MiMo V2.5 一起上线的还有 MiMo Claw（龙虾），类似 Manus 那种 Agent 工具，可以帮你完成多步骤的复杂任务。

试了几个场景：

新闻抓取 + 海报生成：让它搜当天科技要闻，按 90 年代杂志风格生成海报，排版效果不错，就是信息时效性差了点
财报分析：28 页英文 PDF 全文提取、翻译、分析、总结，一气呵成
PPT 美化：把一个 90 年代风格的大学课件丢给它，让它参考科技公司 Keynote 风格重做排版，出来的效果确实好了很多

Claw 和金山生态有合作，Office 文档处理方面有优势。目前还在测试阶段，单次限时 1 小时。

也说说不足

公平起见，说说目前的短板：

联网检索能力一般：问它"小米 2025 年发布过哪些手机"，漏了小米 17 系列，还被一篇错误的博客文章误导。不过这个问题其他模型也有，Gemini 甚至虚构出了小米 16 系列
还在公测阶段：部分功能还在迭代中，Claw 的体验有时限

小米为什么要做大模型

这是我比较感兴趣的一个点。小米做大模型不是为了和 OpenAI 抢生意，而是为了给自己的"人车家"生态装上大脑。

想象一下小爱同学接入 MiMo V2.5 的全模态能力：不再是"小爱同学，开灯"这种机械指令，而是能看懂你手机屏幕上的内容、听懂你含糊的自然语言、理解你真正想要什么。从指令执行工具变成超级管家。

再往远了说，小米的人形机器人、智能汽车、IoT 设备，都需要一个足够强的 AI 底座。MiMo 就是这个底座。

注册体验

MiMo V2.5 目前已经开放公测，所有人都可以注册使用。

如果你想试试，可以用我的邀请码注册，双方各得 10 元体验金，可以解锁 MiMo V2.5 全系模型：

邀请码：7DJ86B

注册后在控制台左下方入口填写邀请码即可到账。体验金 40 天有效，够你好好玩一阵了。

注册地址：https://xiaoai.mi.com/mimo

总的来说，MiMo V2.5 作为一个开源模型，综合能力确实排在第一梯队。推理扎实、多模态好用、代码生成靠谱。联网检索弱了点，但这个问题整个行业都还在解决。

如果你在用其他大模型觉得不够用，或者想试试国产开源模型的水平，MiMo V2.5 值得花 10 分钟注册体验一下。

MiMo V2.5 到底强在哪​

推理和逻辑​

多模态理解​

代码生成​

长文处理​

MiMo Claw — 小米的 Agent 工具​

也说说不足​

小米为什么要做大模型​

注册体验​