Liquid AI端侧AI独角兽美国往事深度测评与排行榜
摘要
LiquidAI是源自MIT的端侧AI独角兽,基于液态神经网络架构开发LFM系列模型,推出LEAP平台与Loca
先给出几个关键判断。当AI战场从云端转向终端,真正值得聚焦的不再是“哪个模型参数量最大”,而是“哪个模型能在真实设备、隐私约束和业务限制下产出实际价值”。Liquid AI过去两年的演进轨迹,正好验证了这一点。
设想一个典型工作场景:电脑里存着两份合同、一堆客户资料、几个项目文件夹,外加一份不知何时遗留的.env文件。你希望AI完成三项任务:找出可能泄露的API Key、对比合同差异并生成报告、自动整理一份审计日志。
交给云端大模型?性能确实没问题,但风险同样明显——你必须把本地文件、客户隐私、目录结构乃至系统状态全部交给第三方。对个人用户或许只是体验上的取舍,对企业而言,这直接触碰了安全、合规和部署边界的三条红线。
Liquid AI刚推出的LocalCowork,正是针对这一矛盾:一台笔记本,无需云端API,数据全程留在本地。它背后是67个本地工具、13个MCP Servers,以及最新的LFM2.5-8B-A1B模型。通过本地调用工具、解释结果和可审计的工作流,它确实将前述三个任务变成了现实。

图:LocalCowork 界面,利用本地模型调度工具完成私有工作流。
到2026年这个时间点,Liquid AI这家公司,或许不该再被简单看作“又一家发布了小模型”的玩家。
用国内读者更熟悉的说法,它有点像“美国版的面壁智能”。过去两年,面壁智能的MiniCPM系列最突出的标签是端侧运行和强多模态——让小参数模型在手机上也能跑出惊艳效果。乍看之下,Liquid AI的LFM2.5-8B-A1B也踩着相似节奏:8B MoE架构、1.5B激活参数、128K上下文、纯本地部署和工具调用。
面壁智能是源自清华的端侧模型独角兽,而Liquid AI的起点同样不俗——孵化自顶级MIT CSAIL实验室。但此后它走出了一条不同路径:先引入有别于纯Transformer暴力Scaling的全新架构,再发布一系列Foundation Models,随后迅速补齐开发者工具与端侧入口,最终切入Shopify、奔驰等真实商业场景。
这才是Liquid AI故事里最值得深挖的部分。当整个行业都在云端数据中心比拼算力上限时,智能已经开始向边缘蔓延。一旦AI真正进入手机、PC、汽车、机器人和企业内网,核心问题就变成:模型如何适应真实的设备算力、隐私边界和业务流程?Liquid AI过去几年的战略布局,几乎全围绕这一底层变化展开。
逆流而上:当行业疯狂Scaling,Liquid AI选择重构架构
故事要从2023年底讲起。
那时,大模型行业的主流叙事已经固化:GPT-4验证了Scaling Law的统治力,资本、算力和顶尖人才全都往更大的集群和更长的训练周期里扎堆。牌桌上的玩家只关心一件事:谁能抢到更多GPU,谁能训出更大的模型。
Liquid AI却偏偏选了一个没人注意的盲区:如果AI最终要落到真实的物理世界和企业内网,那我们难道还要继续设计只适合数据中心的模型?
公司的名字“Liquid”,来自创始团队在MIT的核心研究——液态神经网络(Liquid Neural Network)。这是一种天生会“动态调整”的架构:当模型面对连续变化的信号和环境时,它的内部状态能实时自适应调整。这种特性天然契合自动驾驶、机器人、传感器序列等真实世界场景。所以从一开始,Liquid AI就把内存、延迟、能耗、硬件适配和可解释性放在了最核心的位置。

图:LFM架构图。
那时的Liquid AI,没有卷入“谁来训练下一个万亿参数Transformer”的军备竞赛。它沿着动力学系统和信号处理的底层研究,重新思考基础模型该长什么样。
这条路在传播上有天然优势——差异化足够锋利。在人人争抢“最大模型”的时代,它独占了“最高效架构”的叙事。但代价也很明显:信任成本极高。外界难免会问:你的模型在哪?评测数据呢?实验室里的论文,真的能变成工业级产品?
2023年12月,Liquid AI宣布完成4660万美元种子轮融资。投资人名单很有意思:除了OSS Capital、Samsung Next,还有Shopify创始人Tobias Lutke和Notion联合创始人Chris Prucha。这个阵容释放了清晰信号:Liquid AI的野心不仅在学术界,它想把高效模型真正扎进商业系统和设备生态中。
第一代LFM:从学术概念到可验证的模型
2024年9月,Liquid AI发布了第一代Liquid Foundation Models (LFMs)。当时的外部环境正处在一个微妙转折点:大模型能力确实在涨,但企业开始算经济账了——云端API的调用成本、网络延迟、私有化部署的安全顾虑,这些问题越来越突出。与此同时,AI PC、手机NPU和车载AI的普及,让离线运行从“可选”变成了“刚需”。
第一代LFM包含1.3B Dense、3.1B Dense和40.3B MoE三个型号。它们向外界展示了更好的性能/尺寸权衡、更低的内存占用,以及面向NVIDIA、AMD、高通、苹果等异构硬件的优化潜力。
这一步很关键:Liquid AI从“贩卖新架构概念”正式变成了“交付可用模型”的公司。社区里关于端侧AI的讨论,也从概念争论进入了真刀真枪的可行性和能力边界验证。
LFM2、LEAP与Apollo:端侧AI走向工作流
2025年,端侧AI彻底告别了边缘地位。面壁的MiniCPM证明了小参数的多模态能力;微软Phi把推理无缝接入了Windows和Copilot+ PC;Google Gemini Nano深入到了Android系统底层。Liquid AI也在2024年底拿到了AMD领投的大额融资,深度绑定了芯片和推理栈生态。
到了这个阶段,行业终于意识到:训练出小模型只是入场券,分发、运行权限和生态闭环,才是决定它能活多久的关键。
2025年7月,Liquid AI推出LFM2,主打混合架构和在CPU上的极速Decode/Prefill效率,同时释出了350M、700M、1.2B这类极度端侧友好的权重。

图:LFM2端侧模型的速度与效率。
同月,两个基础设施级别的发布,将Liquid AI的产品化向前猛推了一把:
- LEAP (Liquid Edge AI Platform):定位为端侧中间件,把模型的发现、测试、微调、量化打包和部署串成了完整的工作流。它解决了那个老问题:开发者到底该怎么为特定设备选到合适的模型?
- Apollo:移动端原生入口。不仅让普通用户能在手机上直接体验本地模型,也为Liquid AI收集到了真实设备在延迟、内存、发热和交互边界上的第一手数据。

图:LEAP试图把模型发现、测试、定制和部署串成端侧AI工作流。
这是Liquid AI的一个关键拐点:它不再只是一个发布模型的机构,而是变成了一个提供端侧部署解决方案的平台。
扩张模型族:拒绝“万能模型”的迷思
从2025下半年到2026年,Liquid AI迎来了产品矩阵的爆发式扩张。除了文本模型,它快速补齐了视觉语言(VL)、音频、MoE、Embedding、RAG、工具调用(Tool Use)等细分方向。LFM2-VL、LFM2.5-1.2B-Thinking、LFM2-24B-A2B等型号相继亮相,形成了一个庞大的“端侧模型货架”。
背后的商业逻辑很直白:没有任何一个模型能吞下所有场景。手机上的离线翻译、车机里的语音助手、电商搜索的极速推荐——它们对参数大小、延迟限制和多模态能力的要求完全不同。
到这里,它和面壁智能的差异就显现出来了:面壁的故事更聚焦——手机端的极致多模态;而Liquid AI铺了一条很长的战线——从底层架构、模型族群,一路贯通到部署平台和垂直行业。
走向真实业务:从Benchmark到落地Showcase
2026年前后,Liquid AI终于在应用层交出了答卷。它跳出了写诗、翻译这类常规Demo,直接切入了高价值的业务腹地:
- LocalCowork (本地Agent):正如开篇所说,它精准切中了企业数据资产(代码、合同、内部文档)不能上云的痛点,把Agent Loop拉回本地,由端侧模型可靠地调度工具链。
- Mercedes-Benz (车载智能):2026年4月,双方宣布在北美开展多年合作,为第三/四代MBUX系统提供嵌入式车载智能。汽车是端侧AI的终极试验田——它要求极致的低延迟、断网鲁棒性和长期系统稳定性。

图:Mercedes-Benz与Liquid AI合作,将嵌入式智能带入车载场景。
- Shopify (商业系统):首个生产环境部署强调了低于20毫秒(sub-20ms)的文本模型,专门服务于电商搜索和交易流。这证明了一件事:高效模型即使在云端,也能大幅削减成本并突破吞吐瓶颈。

图:Liquid AI与Shopify合作,把高效模型用于核心commerce workflow。
这三个案例,勾勒出了Liquid AI真正的靶心:那些云端千亿大模型进不去、跑不快、不合规的广阔“缝隙”。
LFM2.5-8B-A1B:端侧潜力的阶段性样本
作为最新力作,LFM2.5-8B-A1B把这条路线推到了新高度。总参数8.3B,激活参数仅1.5B,训练数据量却高达38T Tokens(和DeepSeek V4系列处于同一量级);支持128K超长上下文,专为工具调用和Agent工作流优化,而且全面拥抱llama.cpp、vLLM等开源生态。

图:LFM2.5-8B-A1B benchmark,强调端侧工具调用能力。
它的发布,让社区的关注点从空泛的“参数规模”落到了实处:消费级GPU能不能流畅跑?量化之后会不会破坏MoE路由的稳定性?长上下文会不会出现注意力漂移?这些问题的提出本身就是一个信号——开发者已经开始用衡量生产力工具的标准(Tokens/s、内存占用、量化损耗)来审视它了。
这个模型不必被神化。它更像是一个极具价值的阶段性样本:证明了在消费级硬件的算力和延迟边界内,本地Agent、超长上下文和高难度工具调用,已经成为现实。
尾声:一场部署范式的底层变革
回到开头的问题:Liquid AI究竟是不是美国版的“面壁智能”?
答案是:是,但又不是。
“是”的那一面在于,它们并肩站在同一股不可逆转的浪潮之巅。它们都在用行动宣告一件事:模型的价值不只看参数量。在严苛的成本和算力约束下,提供有效的智能,同样是一种价值。
但如果我们从更宏观的视角来看端侧机器学习系统的演进,就会发现Liquid AI的路线是在打造一套硬件原生的基础模型技术栈。它始于MIT实验室里的学术狂想,穿越了LFM的技术自证和平台化阵痛,最终在汽车和电商的工业齿轮中找到了自己的位置。它试图证明一个观点:基础模型需要被具体的设备、隐私边界和产业场景重新定义。
当然,这场关于端侧AI的探索远没有结束。Liquid AI仍然要面对漫长的考验:新架构的护城河到底有多深?资源受限场景下的Tool Calling能不能保持绝对的可靠性?更重要的是,微软Phi、Google Gemini Nano和苹果Apple Intelligence背后都有操作系统、芯片和分发入口的加持,Liquid AI必须在这些平台级玩家的夹击中,靠架构效率、部署工具链和行业场景守住自己的阵地。
但至少,它撕开了一个极具想象力的切口。
过去两年,AI的聚光灯始终打在云端大模型的能力穹顶上;而接下来的暗流,将属于智能如何挣脱数据中心的引力,下沉到手机、PC、汽车、机器人和每一个本地工作流之中。
无论Liquid AI最终的结果如何,它都将是这部宏大史诗中值得记录的一章。
来源:互联网
本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。