EverMind自进化AI:盛大邓亚峰揭示AIGC2026关键拼图
摘要
AI的演进轨迹,正从“对话交互”迈向“智能体协作”。这并非简单的功能堆砌,而是其核
AI的演进轨迹,正从“对话交互”迈向“智能体协作”。这并非简单的功能堆砌,而是其核心能力范式的根本性迁移。
在这场迁移中,一个关键洞察正变得清晰:当基础大模型的能力逐渐趋同,能够真正沉淀价值、构筑产品护城河的,将是记忆与数据层。未来的AI助手,不仅要高效执行指令,更需具备持续进化的能力,在与用户和环境的长期互动中不断学习与适应。
而实现智能体“自主行动”与“持续进化”这两大核心能力的基石,正是长期记忆系统。它不仅是下一代AI基础设施的竞争焦点,更是企业打造差异化优势的战略要地。

那么,具备下一代特质的AI助手应是什么形态?其背后的技术架构又将如何演进?
智能体范式成为新标准
我们正身处一场由AI驱动的生产力重塑之中。审视语言模型的发展历程,2025年5月Claude 4的发布是一个关键里程碑。

如今回看,那次发布标志着智能体走向真正自主的关键转折。尽管当时其意义未被完全认知,但如今Claude已在特定领域展现出超越OpenAI的潜力。
以“OpenClaw”的迅速走红为例,其吸引力在于塑造了“AI管家”般的体验:支持7×24小时待命,通过留言即可处理复杂任务。更重要的是,它将长期记忆、自主决策等核心能力引入了智能体框架。
当然,它仍存在完善空间,这也是其热度回落后部分用户流失的原因。但其价值如同智能体时代的iPhone 4,它定义了一种产品范式,明确了核心组件构成,为后续迭代铺平了道路。
这清晰地指向一个趋势:行业重心正从Chat(聊天)转向Agent(智能体)。这也是Claude及其公司Anthropic在估值上能与OpenAI抗衡的重要原因。

伴随这一范式转移,软件交付模式也在重塑:过去的SaaS交付的是标准化流程与操作界面,而未来则更倾向于直接交付结果。交互的核心也日益转向以消息(Message)为中心,更贴近人类自然的沟通方式。这场变革,已然展开。
智能体的核心能力与底层支撑
那么,在Agent时代,我们究竟需要怎样的AI助手?答案可归结为两个核心特征:自主性与自进化能力。

自进化,指的是AI能够在持续交互中学习、成长并优化自身行为,这是当前多数AI系统尚未具备的高级能力。可以说,自主与自进化是定义下一代智能体的关键标签。
支撑这两大特征的底层核心技术,无疑是长期记忆。
一个智能体(Agent)由模型和驾驭系统(Harness)构成。Harness主要包括两部分:一是执行流程(如智能体循环与底层设施),另一部分则是围绕数据与记忆构建的中间层——这正是长期记忆发挥价值的核心地带。
深入分析,当模型能力日益强大且差距缩小时,记忆(Memory)与数据(Data)层反而更容易在业务实践中沉淀为可持续的差异化优势。
类比人类智能,其构成同样包含两部分:逻辑推理能力和长期记忆能力。

在人类进化中,长期记忆至关重要——记住资源位置与风险来源,并据此预测未来。神经科学研究也证实,人类强大的泛化能力,很大程度上源于在记忆中高效组织经验样本的能力。可见,记忆是智能形成的根基。
当前,尽管模型迭代迅速,但针对记忆系统的专项工作直到今年才逐渐增多。在智能体运行中,记忆主要承担三大核心职能:
第一,突破上下文长度限制。 模型的上下文窗口有限(当前主流约1M token),而智能体运行中信息量会指数级增长。因此,需要对海量信息进行抽象、总结,并高效、精准、低成本地为模型提供所需上下文。
第二,根治“AI失忆症”。 用户常抱怨AI“记性差”,刚告知的信息转头即忘。长期记忆系统能实现个性化与偏好对齐,让AI记住“用户身份、偏好、目标与价值观”,这是构建可信赖助理关系的基石。
第三,实现主动预测与执行。 更高的要求是,AI在通晓用户全部历史的基础上,能主动洞察潜在需求,并预先处理,事后仅需确认。这如同雇佣优秀员工:不仅能完美执行任务A,还会主动预见并完成关联任务B和C。这要求AI具备一定的主动预测能力。
基于对长期记忆核心价值的判断,相关技术实践已在推进。例如,盛大集团孵化的EverMind团队,其目标正是打造具备自进化能力的自主Agent OS。他们推出的EverOS平台,定位为“面向AI开发者的智能体记忆系统”。

该平台聚焦于Agent记忆层,并内置了自进化(Self-Evolving)能力,意味着基于其记忆基础设施构建的智能体会“越用越智能”。它支持多模态记忆,具备跨平台、跨智能体特性,并提供云版本与本地版本(基于Markdown文件结构)。在多项基准测试中,其在上下文长度、准确率、响应速度(添加与检索均在几百毫秒级)等方面均表现领先。
尤其值得关注的是其效率优化:通过强化学习训练的小规模模型(如4B参数),在记忆提取与检索效果上可媲美数百B参数的大模型,从而显著降低token消耗与模型调用成本。相关研究成果,如论文《EverMemOS: A Self-Organizing Memory Operating System for Structured Long-Horizon Reasoning》已被ACL 2026收录,并在五个主流测试集上取得了SOTA结果。
另一项前沿工作是稀疏注意力机制(Memory Sparse Attention, MSA)。其设计初衷是:人一生的文本信息量约数亿token,而当前模型上下文窗口仅为其1%左右。要让智能体陪伴用户终身进化,就需要能支持上亿token上下文且支持端到端训练的解决方案。

MSA技术能将有效上下文长度扩展至1亿token,并通过可插拔的架构修改实现真正的端到端训练。在常见问答任务上,其性能与当前SOTA模型相当。关键在于,当上下文容量远超1M时,多数模型性能会急剧衰减,而MSA能保持准确率基本稳定。
实现AI自进化的技术路径
如何实现“AI越用越聪明”这一产品愿景?其技术路径核心在于构建一个能够自动沉淀、精准匹配与高效复用技能(Skill)的生态系统。
具体实践包括:
第一,构建高质量开源技能库。 通过对数十万个公开技能进行安全性审核、去重与筛选,最终提炼出7万多个可直接调用、开源且可商用的高质量Skills。
第二,开发高效的技能匹配机制。 当技能数量庞大时,不能仅依赖模型逐步披露,需要高精度、低延迟的检索与匹配策略。
第三,实现技能的自动进化。 智能体在服务用户过程中,会产生成功或失败的经验轨迹。系统能自动将这些成功经验沉淀为新的Skills。当类似任务再次触发时,相应技能会被自动调用,从而实现系统性能的持续优化。

为客观评估进化效果,团队推出了EvoAgentBench评测体系,目前在Hugging Face的Agent Bench类别中下载量已位居第二。该体系用于评估智能体在四大类任务上的性能,横向比较不同进化策略。数据显示,采用EverOS进化策略的智能体,在任务成功率的提升与执行轮次的减少方面均处于领先位置。
未来展望:个人记忆主权与智能体生态
展望未来,围绕长期记忆和智能体,将呈现两大趋势:
第一,记忆体系的重构。 传统记忆设计多服务于人类对话,而智能体场景需要一套全新的记忆架构。这包括定义智能体自身的身份、角色、目标、价值观与行为准则(Agent Memory),记录用户的时间线、地点、事件、行为历史及偏好(User Memory),以及整合必要的世界知识(如“LLM Wiki”)。
第二,个人记忆主权的回归。 未来,一个人可能会使用多个智能体,但记忆和数据的所有权应归属于个人。创建和使用智能体的能力,也将从开发者群体普及至更广泛的专业人士乃至普通用户。

为此,面向大众用户的产品(如EverMe)应运而生,其核心是帮助用户管理跨智能体、跨平台的数据与记忆。例如,用户在Codex、Claude Code、OpenClaw、Hermes等不同智能体中的交互记忆可以被汇聚、管理、优化,并用于提升现有体验或快速初始化一个新智能体。

基于此,一个更宏大的愿景是:当某个AI系统拥有了你完整、跨平台的记忆和数据后,它将成为最懂你的数字存在。你未来的意图与需求,或许都将从这个“个人记忆中心”进行分发与满足。 这不仅是技术演进的方向,也预示着人机协作与数字生活模式的深刻变革。
来源:互联网
本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。