端侧大模型新标杆:Liquid AI开源LFM2.5
摘要
人工智能初创公司 Liquid AI 今日宣布重大进展——正式发布并开源全新端侧大模型 LFM2 5-8B-A1
人工智能初创公司 Liquid AI 今日宣布重大进展——正式发布并开源全新端侧大模型 LFM2.5-8B-A1B。该模型聚焦于提升消费级硬件上的工具调用与指令遵循能力,同时将计算开销压缩至极致。最值得注意的是,它在端侧设备的推理与推理性能上实现了可量化的显著跃升。
架构层面,LFM2.5 采用稀疏混合专家(MoE)设计,总参数量达 8.3B,但每次生成单个 Token 仅激活 1.5B 参数。这意味着手机、笔记本等本地设备完全能够承载,无需依赖云端即可流畅运行。

长文本扩展与推理能力跃升
相较前代,LFM2.5 的上下文窗口从 32K 扩展至 128K 词元,预训练数据量也由 12T 增至 38T。作为纯推理模型,它在输出最终答案前会先生成显式的思维链,且词表压缩率极高,处理中文、阿拉伯文等九种语言时效率更为突出。
长推理场景中常见的逻辑死循环与幻觉问题如何解决?开发团队在训练阶段引入两阶段强化学习(RL)。偏好优化机制专门针对长链路推理中的“死循环”进行校正,而防幻觉奖励机制则让模型在面对超出知识库的提问时,学会主动拒绝作答——这一设计尤为关键。
端侧性能强劲与生态全面兼容
性能方面,LFM2.5 呈现出爆发式增长。逻辑推理与反幻觉基准测试得分大幅超越前代,指令遵循能力甚至可媲美参数规模更大的模型。工具调用上,模型默认输出高效的 Python 函数调用,同时支持在系统提示词中无缝切换为 JSON 格式。
发布首日即获得主流推理生态的全面支持:llama.cpp、MLX、vLLM、SGLang 悉数兼容。硬件实测数据同样扎实——在 M5 Max 芯片上解码速度达到每秒 253 字节,手机端也能实现每秒约 30 字节。兼顾端侧运行的私密性与高效率,这一次它做到了。
来源:互联网
本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。