小米MiMo-V2 5系列模型开启公测:更强的智能体,更优的性价比 就在今天,小米正式宣布,
就在今天,小米正式宣布,其Xiaomi MiMo-V2.5系列模型面向公众开启测试。更值得关注的是,其中的MiMo-V2.5-Pro和MiMo-V2.5模型将面向全球开源。这无疑为开发者社区和整个AI行业投下了一颗重磅冲击波。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
根据官方公告,这次发布的V2.5系列阵容相当完整,涵盖了MiMo-V2.5、V2.5-Pro、V2.5-TTS Series以及V2.5-ASR。简单来说,这一代模型的核心提升可以概括为:推理能力更强、智能体(Agent)表现更稳、上下文处理更长、对指令的理解与遵循更精准,并且在多模态感知与理解上达到了新的高度。与此同时,小米也同步优化了其Token Plan的定价方案,让使用成本更具吸引力。

如果说上一代模型是尖子生,那么MiMo-V2.5-Pro就是冲着“学霸”去的。官方将其定位为小米迄今为止最强大的模型,尤其在通用智能体能力、复杂软件工程以及长程任务处理这几个硬核维度上,已经具备了与全球顶尖Agent模型(如Claude Opus 4.6、GPT-5.4)同台竞技的实力,实现了对前代MiMo-V2-Pro的全方位超越。
那么,它的“长程任务”能力到底有多强?内部测试给出了答案:在搭配合适的运行框架后,它可以稳定完成单次涉及近千轮工具调用的超长任务链。这意味着什么?意味着它的指令遵循能力得到了质的飞跃——不仅能精准捕捉上下文里那些没说出口的“潜台词”,还能在超长的任务周期内始终保持逻辑的一致性。可以说,MiMo-V2.5-Pro已经能以更高的置信度,去承担那些真正严肃、复杂的专业工作了。

显然,这款模型就是为更高难、更复杂的任务目标而生的。小米甚至将一些需要人类专家花费数天乃至数周才能完成的项目交给它,让它独立跑完全程,而最终交付的质量依然令人惊叹。来看两个具体的案例:
这个任务源自北京大学的《编译原理》课程项目,要求从零开始,用Rust语言实现一个完整的SysY编译器,包括词法分析、语法分析、抽象语法树(AST)、Koopa IR中间代码生成、RISC-V汇编后端以及性能优化。要知道,北大本科生完成这个项目通常需要数周时间。然而,MiMo-V2.5-Pro仅用了4.3小时,经过672次工具调用,就交出了满分答卷——在隐藏测试集上取得了233/233的满分。这背后展现的,是极高的工程效率和生产力价值。

它的工作方式并非盲目试错,而是展现了清晰的架构思维:先搭建完整的编译器流水线骨架,再逐层攻克各个模块。结果,Koopa IR部分满分(110/110),RISC-V后端满分(103/103),性能优化部分也是满分(20/20)。更惊人的是,它的首次编译就通过了137个测试点,冷启动通过率高达59%。这相当于在没有任何测试反馈的情况下,它构建的架构基础就已经基本正确了。甚至在任务进行到第512轮时,一次代码重构导致在某个测试集上回退了两个点,模型也能自行诊断问题、恢复状态并继续推进。
另一个例子是,仅凭一句简单的指令——“构建一个视频编辑器Web应用”——MiMo-V2.5-Pro便自主完成了一款功能可用的Web应用。这款编辑器具备了多轨道时间线、片段裁剪、交叉淡化、音频混合以及导出流程等核心功能。最终生成的代码量达到8,192行,整个开发过程历经1,868次工具调用,在长达11.5小时的完全自主工作中完成。
如果说V2.5-Pro是专攻难题的“特种兵”,那么标准版的MiMo-V2.5就是为智能体(Agent)场景而生的“多面手”。它是一款原生的全模态大模型,能同时看、听、读,并将理解转化为行动。这一次,V2.5带来了几个关键升级:
Agent能力全面超越 MiMo-V2-Pro
在Claw-Eval等权威Agent评测中,MiMo-V2.5的表现已经超过了上一代的Pro版本,足以胜任日常的简单任务。与此同时,其API调用成本却降低了约50%,性价比优势凸显。
多模态感知全面超越 MiMo-V2-Omni
在跨模态推理、视频理解、图表分析等能力上,V2.5也实现了大幅提升。在VideoMME、CharXiv、MMMU-Pro等评测中,其表现已经逼近甚至超越了业界的顶级闭源模型。

除了能力提升,这一代模型在“经济性”上也下足了功夫。MiMo-V2.5全系列都针对Token效率进行了深度优化,目标是用更少的Token完成更多的事。
数据最能说明问题:在达到相同的Agent基准榜单(ClawEval)分数时:

面对两款强大的模型,该如何选择呢?官方的建议很清晰:

伴随着模型升级,小米的Token Plan计费方案也迎来了实质性的优化,目的就是让用户用得更划算。
Credits 速率更新,更优惠
值得注意的是,原先1 Token = 4 Credits的计费方式已被取消。更重要的是,Token Plan不再区分256k和1M上下文窗口的Credit倍率,使用长上下文不再有额外的费率惩罚。
夜间专属优惠速率
对于夜间工作的开发者来说,这是个好消息。北京时间每天00:00至08:00,所有模型的Credits消耗速率将在原有基础上再打8折。
自动续费享折扣
最后,小米还送上了一份诚意十足的“上新礼”。所有在北京时间4月22日22:00前已购买Token Plan的用户,其账户内的Credits额度将被全部重置清零,相当于获得了一个全新的开始,可以重新规划使用。

参考
菜鸟下载发布此文仅为传递信息,不代表菜鸟下载认同其观点或证实其描述。