小米 MiMo V2.5 — 全球开源第一的大模型,值得一试
最近大模型圈有个值得关注的事:小米的 MiMo V2.5 系列开放公测了,而且在 Artificial Analysis 榜单上拿下了全球开源大模型综合智能指数第一。
一个做手机和智能家居的公司,AI 模型做到开源第一?我一开始也觉得有点意外,试了一圈之后,确实有点东西。
MiMo V2.5 到底强在哪
先说结论:推理能力很强,多模态能力扎实,代码生成可以直接跑。
推理和逻辑
之前那个经典的"去洗车店洗车,应该走路去还是开车去"的坑,ChatGPT 都栽过,MiMo V2.5 Pro 直接点出关键——要洗的是车不是人,车必须开过去。这种常识推理能力说明模型的逻辑底子是到位的。
多模态理解
MiMo V2.5 支持文本、图像、视频和语音输入。实测丢一张医院检验报告的照片,它能准确识别检查项目、读出数据、给出结论和建议。丢一张模糊的 Switch 照片,logo 都被遮住了,它也能认出来是 Switch OLED 版。
这个能力放到手机端想象空间很大——相机对准东西直接问 AI,导航时用相机定位,扫一下菜单自动翻译。
代码生成
让它写一个解一元二次方程的 HTML 程序,直接能在浏览器跑。加大难度让它写围棋程序,带 UI 的那种,也是一次生成直接运行。对于不会写代码但有需求的人来说,这个能力非常实用。
长文处理
丢给它一篇长文让它总结,2 秒出结果,提炼得很准确。28 页全英文的苹果财报 PDF,也能精准概括重点,给出"iPhone 是绝对功臣""研发投入暴增 31.7%""可穿戴拖后腿"这样的结论。
MiMo Claw — 小米的 Agent 工具
和 MiMo V2.5 一起上线的还有 MiMo Claw(龙虾),类似 Manus 那种 Agent 工具,可以帮你完成多步骤的复杂任务。
试了几个场景:
- 新闻抓取 + 海报生成:让它搜当天科技要闻,按 90 年代杂志风格生成海报,排版效果不错,就是信息时效性差了点
- 财报分析:28 页英文 PDF 全文提取、翻译、分析、总结,一气呵成
- PPT 美化:把一个 90 年代风格的大学课件丢给它,让它参考科技公司 Keynote 风格重做排版,出来的效果确实好了很多
Claw 和金山生态有合作,Office 文档处理方面有优势。目前还在测试阶段,单次限时 1 小时。
也说说不足
公平起见,说说目前的短板:
- 联网检索能力一般:问它"小米 2025 年发布过哪些手机",漏了小米 17 系列,还被一篇错误的博客文章误导。不过这个问题其他模型也有,Gemini 甚至虚构出了小米 16 系列
- 还在公测阶段:部分功能还在迭代中,Claw 的体验有时限
小米为什么要做大模型
这是我比较感兴趣的一个点。小米做大模型不是为了和 OpenAI 抢生意,而是为了给自己的"人车家"生态装上大脑。
想象一下小爱同学接入 MiMo V2.5 的全模态能力:不再是"小爱同学,开灯"这种机械指令,而是能看懂你手机屏幕上的内容、听懂你含糊的自然语言、理解你真正想要什么。从指令执行工具变成超级管家。
再往远了说,小米的人形机器人、智能汽车、IoT 设备,都需要一个足够强的 AI 底座。MiMo 就是这个底座。
注册体验
MiMo V2.5 目前已经开放公测,所有人都可以注册使用。
如果你想试试,可以用我的邀请码注册,双方各得 10 元体验金,可以解锁 MiMo V2.5 全系模型:
邀请码:
7DJ86B注册后在控制台左下方入口填写邀请码即可到账。 体验金 40 天有效,够你好好玩一阵了。
注册地址:https://xiaoai.mi.com/mimo
总的来说,MiMo V2.5 作为一个开源模型,综合能力确实排在第一梯队。推理扎实、多模态好用、代码生成靠谱。联网检索弱了点,但这个问题整个行业都还在解决。
如果你在用其他大模型觉得不够用,或者想试试国产开源模型的水平,MiMo V2.5 值得花 10 分钟注册体验一下。
