产业资讯

端侧大模型新标杆：Liquid AI开源LFM2.5

2026-05-30

阅读 0

热度 0

作者菜鸟AI编辑部

摘要

人工智能初创公司 Liquid AI 今日宣布重大进展——正式发布并开源全新端侧大模型 LFM2 5-8B-A1

人工智能初创公司 Liquid AI 今日宣布重大进展——正式发布并开源全新端侧大模型 LFM2.5-8B-A1B。该模型聚焦于提升消费级硬件上的工具调用与指令遵循能力，同时将计算开销压缩至极致。最值得注意的是，它在端侧设备的推理与推理性能上实现了可量化的显著跃升。

架构层面，LFM2.5 采用稀疏混合专家（MoE）设计，总参数量达 8.3B，但每次生成单个 Token 仅激活 1.5B 参数。这意味着手机、笔记本等本地设备完全能够承载，无需依赖云端即可流畅运行。

相较前代，LFM2.5 的上下文窗口从 32K 扩展至 128K 词元，预训练数据量也由 12T 增至 38T。作为纯推理模型，它在输出最终答案前会先生成显式的思维链，且词表压缩率极高，处理中文、阿拉伯文等九种语言时效率更为突出。

长推理场景中常见的逻辑死循环与幻觉问题如何解决？开发团队在训练阶段引入两阶段强化学习（RL）。偏好优化机制专门针对长链路推理中的“死循环”进行校正，而防幻觉奖励机制则让模型在面对超出知识库的提问时，学会主动拒绝作答——这一设计尤为关键。

性能方面，LFM2.5 呈现出爆发式增长。逻辑推理与反幻觉基准测试得分大幅超越前代，指令遵循能力甚至可媲美参数规模更大的模型。工具调用上，模型默认输出高效的 Python 函数调用，同时支持在系统提示词中无缝切换为 JSON 格式。

发布首日即获得主流推理生态的全面支持：llama.cpp、MLX、vLLM、SGLang 悉数兼容。硬件实测数据同样扎实——在 M5 Max 芯片上解码速度达到每秒 253 字节，手机端也能实现每秒约 30 字节。兼顾端侧运行的私密性与高效率，这一次它做到了。

来源：互联网

免责声明

本网站新闻资讯均来自公开渠道，力求准确但不保证绝对无误，内容观点仅代表作者本人，与本站无关。若涉及侵权，请联系我们处理。本站保留对声明的修改权，最终解释权归本站所有。