百度AI时代新度量衡:权威解读与核心指标测评
摘要
百度提出以“日活智能体数”作为衡量AI价值的新标准,标志着行业焦点从模型能力转向应

百度重新定义 AI 竞赛积分规则的最新尝试。
在中国科技互联网的早期版图中,百度一直是布局AI等前沿技术最坚定的公司之一。这种长期投入,也让它在产业发展的关键节点上,总能率先抛出自己的前瞻判断。这些判断,往往在后来成为精准命中、甚至自我实现的预言。
2026年初,现象级的AI节点无疑是“龙虾”的爆火出圈。而百度的观察,又一次走在了前面。在李彦宏看来,“龙虾”最具标志性的意义在于,这是第一次AI因应用本身、而非底层模型受到广泛关注。这标志着一个维度的成熟:智能体不再只是被动触发的工具,它应该能自主执行任务、在执行中学习、在学习中变得更强。
于是,下一个问题接踵而至:当智能体开始自我进化,我们该用什么来衡量这个飞速演化的崭新生态?
整个AI行业再次站在了岔路口。旧的衡量标准已然失效,但新的度量衡应该长什么样?这一次,李彦宏率先给出了一个答案。
衡量智能体价值的百度算法
李彦宏提出的新指标是DAA——Daily Active Agents,日活智能体数。这个概念在Create 2026大会的开幕式上被正式抛出。其含义直截了当:不要只数有多少人在使用AI,而要数有多少智能体在真正替人干活,并且交付了最终结果。

乍看这三个字母,或许会觉得这不过是又一个AI营销概念,一个为发布会发明的缩写。但如果把它放回李彦宏过去两年的公开表态里,就会发现一条清晰的暗线贯穿始终,其主轴正是“智能体的自我进化”。
时间拉回2024年7月的上海WAIC大会。彼时,全行业的主流叙事是寻找AI时代的“微信”,一个达到十亿级DAU的超级应用被视为大模型价值兑现的标志。而李彦宏提出了不同看法:“要避免掉入‘超级应用陷阱’,觉得一定要出现一个10亿DAU的App才叫成功,这是移动时代的思维逻辑。”
他当时看好的方向非常明确——智能体。“只要用人话把工作流说清楚,再配以专有知识库,即可做出一个很有价值的智能体,比互联网时代制作一个网页还简单。”他甚至预测了规模:未来将涌现数百万量级的智能体,形成一个庞大的生态。
在当时,这听起来还有些理想化。四个月后的百度世界2024大会上,李彦宏沿着这个思路继续加码:“智能体是AI应用的最主流形态,即将迎来爆发点。”同场大会上,“秒哒”发布,百度将其定位为无需写代码就能实现任意想法的软件——李彦宏称之为“迄今为止人类历史上最复杂的多智能体协作工具”。秒哒成了百度智能体想象力的孵化器,旨在帮助更多人打造数以百万计的“超级应用”。
到了2025年11月的百度世界大会,李彦宏的判断更进一步:当AI被内化成一种原生能力,智能就不再是成本,而是生产力。新的提法出现了——“效果涌现”与“AI内化”。为此,百度发布了“伐谋”,一个借鉴进化算法、能模拟甚至超越顶尖算法专家、根据条件变化自动迭代方案的智能体。“自我演化”这个词,第一次正式进入百度的AI产品叙事。
然后,就是现在的DAA。必须承认,李彦宏并非每一个判断都绝对准确,但在智能体这件事上,百度的确比行业共识更早。2024年中他在台上大谈智能体时,多数人还在为“谁家的ChatBot DAU更高”争论不休。实际上,这种移动互联网时代的思维惯性,一直延续到了2026年春节的AI大战。
“龙虾”的出现,终结了这种争论。李彦宏在Create大会上精准概括了这个节点的意义:过去每一次AI出圈,火的都是模型本身——2024年的ChatGPT,2024年的Sora,2025年的DeepSeek。“龙虾”第一次不同,它火不是因为用了哪款特定模型,而是在模型之上构建出了真正能帮人完成任务的智能体。“这是历史上第一次智能体替代了模型,出圈了。第一次,AI的主角不是模型,而是应用。”
这意味着,AI竞争的焦点,正从“智力”转向“执行力”。过去几年,行业比拼的是谁更聪明、谁的推理能力更强;而“龙虾”证明了,用户真正买单的不是“你会不会做”,而是“你能不能帮我把事做完”。
于是,终于没人再争论谁是下一个“微信”,也没人质疑“要不要做智能体”了。行业共识迅速收敛到一个更实际的问题:应该如何衡量智能体的价值?
这正是李彦宏试图用DAA指标回答的问题。移动互联网时代的DAU,衡量的是“多少人打开了App”。这对于一个7×24小时在后台运行、调用十几个工具、全程无需用户点击任何按钮的智能体来说,几乎没有意义。
在李彦宏的框架里,DAA是智能体“自我进化”的必然结果——当智能体不再是一个被人类手动触发的工具,而是能够自主执行、在学习中变强的实体时,衡量AI价值的尺度就必须随之改变。
对比来看,英伟达黄仁勋的算法是Token消耗量,甚至人为将其分成了不同价格档次:最聪明的、次一级的、日常使用的……在黄仁勋看来,Token消耗量就是AI时代的GDP。这个说法通俗易懂,易于传播,但作为算力供应商,英伟达的视角完全不衡量产出:一个智能体消耗了100万Token却没完成任务,另一个只用10万Token就交付了结果,在Token经济学的算法里,前者反而“贡献”更大。
李彦宏说得更直白:“Token只代表成本,并不代表收益;它衡量的是投入,而不是产出。Token消耗有没有效率、产出了什么价值——这些Token本身无法回答。”
DAA的提出,实际上隐含了一个深刻的质疑:如果Token是投入,智能体交付的结果才是产出,那么只看Token,就像只看一个国家的电力消耗量来评估其经济水平——虽有相关性,但远远不够。
一个真正在“自我进化”的智能体生态,需要一把衡量产出的尺子。DAA,就是李彦宏给出的那把尺子。
能自我进化的产品是什么样的
从DAA的概念延伸开,百度在Create 2026上发布了多款产品,试图从不同维度诠释“自我进化”的含义。其中的枢纽,是名为DuMate的产品。
李彦宏提出了一个判断:聊天机器人和通用智能体是两代入口。“第一代入口是以ChatGPT为代表的聊天机器人,主要解决信息获取问题;第二代入口是通用智能体,解决的是任务完成问题。”显然,通用智能体的价值天花板要高得多,而DuMate正是百度在3月上线的通用智能体。
DuMate的定位是“AI办公搭子”。单看这个说法,它像市面上众多的AI助手之一。但其真正的野心藏在架构里:它不只是一个智能体,而是一个能调度其他智能体的“智能体中枢”。秒哒、伐谋、搜索、文件管理、数据分析等百度核心能力,并非作为模块被简单集成,而是作为独立的智能体被DuMate调度。
这是一个完全按照DAA指标设计的产品。在DuMate的架构下,用户的一次任务请求,可能触发多个智能体同时工作——DuMate自身负责任务理解和分配,秒哒生成所需应用或页面,伐谋在后台进行决策推演,搜索智能体抓取外部信息。每一个被调起的智能体,都是一个活跃的智能体。如果用传统的DAU来衡量,只能看到一条线性的工作流;但用DAA来衡量,看到的则是“四个智能体在同时干活并交付结果”。
在一个典型的运营场景中,DuMate可以同时处理客服、数据分析和营销三条线的工作——过去需要三个人或至少三个工具分别完成的任务,现在由一个人加一组智能体就能搞定,百度内部称之为“人机混编”。更有意思的是,DuMate还会通过生成每日工作日报,反思任务完成情况,并从中提炼优化方向。这可以看作是智能体自我管理的一种最朴素形态,恰好对应了“自我进化”的字面含义。
面向不同人群的智能体矩阵
在所有可供DuMate调用的智能体中,秒哒和伐谋是最关键的两个。前者面向零代码经验的普通用户,后者则恰恰相反,针对的是被认为最难被AI替代的群体:决策专家。
秒哒自2024年底发布以来,根据最新数据,已服务超过1000万用户,其中81%为非技术人员。它做的事情简单而激进:让不会写代码的人用自然语言做出完整的商业应用。在Create大会上发布的3.0版本,升级了两个关键能力——直接生成可部署的App,以及支持多人协作开发。它是从DAA逻辑中自然生长出来的产品,其预设前提是:如果创造门槛足够低,就会有足够多的人创造出足够多的智能体,DAA这个指标自然就会增长。
Create 2026大会现场,来了一位温州的8岁开发者“扑满”。二年级的他,用秒哒做了一个叫“哒哒打伞”的应用,灵感源于一个微小的校园场景:放学下雨时同学们拼伞回家。打开应用,选择“我想搭伞”或“我来打伞”,设定好时间、起点、终点,就能发布需求。应用甚至设计了一个积分系统,帮别人打伞越多积分越高。一个8岁的孩子无需写一行代码,就能将一个具体的想法变成可用的产品。扑满把秒哒形容成机器猫:只要说出想要的,它就能从口袋里掏出来,甚至比想象的还要神奇。
秒哒这样的代码智能体,击穿了两道墙:高门槛与高成本。这意味着,并非只有足够通用、足够庞大的需求才值得被开发。李彦宏在台上描述了一个看似矛盾的现象:代码能力越来越重要,但代码本身正在变得不值钱。
在面向“零基础”用户的秒哒之外,针对专业领域,百度拿出了伐谋2.0。它的上一个版本在2025年发布时,还是一个偏技术侧的算法优化工具,核心能力是“自我演化式地寻找全局最优解”。到了2.0版本,伐谋最大的变化在于交互方式:它不再要求企业一次性把所有复杂的业务规则和约束条件讲清楚,而是通过持续对话,逐步逼近最优解。企业的业务专家可以像与资深同事交流一样,将模糊的经验、直觉和判断告诉伐谋,而伐谋会在对话中不断推演、验证、迭代这些内部知识,最终做出判断——而判断,往往是最稀缺的。
这非常适用于企业中的复杂场景,例如港口集装箱调度。这涉及数百个动态变量:船期、潮汐、堆场容量、卡车排队时间等。传统的优化模型需要运筹学专家花费数周建模,而伐谋2.0通过对话式推演,大幅压缩了这一过程。青岛港在引入伐谋后,其全球领先的自动化码头调度系统A-TOS在关键指标上实现了10.21%的进一步提升——对于一个已经连续十三次刷新世界纪录的系统来说,这个增量意义重大。关键不在于速度提升了多少,而在于它改变了“谁能使用优化工具”的前提——从需要运筹学博士,变成了一线业务人员。
除了面向不同用户群的智能体产品,百度的智能体概念还延伸至数字人领域。数字人像是介于现实与虚拟、软件与具身之间的节点,用李彦宏的话说,是“看得见的智能体”。百度“一镜”(原慧播星)可以实现全场景的真人级数字内容生成,倚靠的同样是多智能体协同能力。一条视频的生产过程中,剧本智能体负责脚本,视频智能体负责画面生成,剪辑智能体负责后期——三个智能体各自独立运作又相互配合,最终交付一个商业级的完整作品。一个人加上一组智能体,就能覆盖过去需要编导、摄像、剪辑、运营等多个岗位才能完成的工作。
这些产品在不同维度上讲述着同一个故事:智能体不再是一个被动等待指令的工具,它在学习、在迭代、在协同、在独立交付结果。这就是智能体的“自我进化”,而衡量这种进化的指标,就是DAA。
全栈布局共识的形成
DAA的智能体论述背后,是百度全栈的AI战略布局。这原本是个老生常谈的话题,大家都知道全链路技术能力的重要性。然而,互联网基础设施产业长久以来的演化规律是,不同的环节攫取各自的利润,从产品到模型,从芯片到云。
但AI的演化带来了真正的算力井喷式需求,分链条协作的效率开始比不上垂直整合。2026年上半年,全球最重要的几家AI公司,正在用真金白银的行动诠释这个结论。
三周前的Google Cloud Next 2026上,谷歌发布了第八代TPU双芯片架构,一颗专攻模型训练,一颗专攻推理。谷歌把针对大模型的技术布局,垂直优化到了芯片层。用谷歌云CEO托马斯·库里安的话说,所有组件都是协同开发的,这件事谷歌已经做了十年。
几乎同一时间,Anthropic在5月初公布了一系列智能体产品,但更震撼的是与马斯克的SpaceX签署了数据中心算力协议。加上此前与亚马逊AWS、微软Azure、谷歌云的基础设施合作,Anthropic正在极力扩充自己的算力储备。原因很简单,其CEO达里奥·阿莫迪此前估计第一季度增长速度为10倍,而实际情况是80倍。
OpenAI的路径也在向同一方向收敛。Codex正从与Claude Code竞争的代码工具,转变为一个生产力智能体平台。OpenAI显然也意识到,智能体的价值至少与10亿月活用户同等重要,甚至可能更重要。
微软也在5月1日上线了名为Agent 365的企业级智能体平台,设计了一整套管理智能体的流程。将这四家巨头的动作叠在一起看,一个清晰的共识浮现出来:智能体是重要的,但做好智能体需要从芯片到云再到平台调度层的全套优化。它们之间的关系不是松散的,想要实现极致性能,就需要端到端的垂直整合。
这也是百度“芯云模体”战略的核心。昆仑芯、百度智能云、文心大模型以及DuMate/秒哒/伐谋/一镜等应用,共同构成了百度的端到端AI链路。

从实际落地层面看,在B端智能体基础设施这一层,百度确实有可用的积累:昆仑芯P800已完成万片级交付,256卡超节点计划于6月问世,同时芯片企业主体正在筹备上市;百度智能云在第三方报告的AI全栈服务市场份额中位居中国市场前列。
这些都说明,在B端智能体基础设施层面,百度具备相当的积累。然而,放眼全球,目前还没有哪家公司真正跑通了AI智能体全栈的每一层。“芯云模体”四个字所暗示的那种端到端协同优化,目前更多还是一个架构愿景和发展方向。大家对方向没有异议,关键在于如何执行。
书写新答案的时间
当然,敢于率先出牌,并不意味着牌一定能赢。
DAA能否从百度的一家之言,变成行业的通用语言,尚取决于几个先决条件。首先,智能体本身要足够成熟——当前全球范围内,大多数智能体产品还处在从演示Demo到稳定产品的过渡期,能真正7×24小时可靠运行并交付结果的智能体,仍然是少数。
其次,DAA的定义也需要可量化、可测量。如何标准化地衡量一个智能体交付的成果?在Create大会上,李彦宏给出了一个大胆预测:未来全球日活智能体数量可能超过100亿。如何统计它们的成果将是一个极其复杂的课题。当组织里每个人的效率都成倍提升时,金字塔型的管理结构将不再必要,管理的主要功能将从监督、指挥、激励,转变为“对齐”——不是盯着他做事,而是确认他在做对的事。
这个关于组织进化的判断,已经超越了技术范畴。它暗示的终局是:衡量一家企业竞争力的方式,将从“你有多少员工”转变为“你有多少智能体”。DAA不只是一个产品指标,它隐含了百度对于未来劳动和组织全新形态的一种认知。在这种新形态中,AI在提升每个人的能力边界,而传统组织的层级、分工与控制手段,可能反而在压制创造力。

回到李彦宏2024年在WAIC上的那句话:“不是只有10亿DAU才叫成功。”两年后的Create 2026上,他给出了这个回答的下半部分:成功的标准,应该是有多少智能体在真正替人干活、交付结果。百度把这个标准叫做DAA,把驱动它迭代的路径叫做“自我进化”,把支撑它的全栈技术体系概括为“芯云模体”。
DAA是否会成为行业通行的标准?现在下结论还为时过早。但至少,在所有人都在做智能体、却没人认真思考“智能体时代该怎么计分”的2026年上半年,百度是第一个开始系统回答这个问题的组织。
书写最终的答案,还需要时间。
题图来源:百度
来源:互联网
本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。