其他资讯百度AI时代新度量衡

百度AI时代新度量衡：权威解读与核心指标测评

2026-05-14

阅读 0

热度 0

作者菜鸟AI编辑部

摘要

百度提出以“日活智能体数”作为衡量AI价值的新标准，标志着行业焦点从模型能力转向应

百度重新定义 AI 竞赛积分规则的最新尝试。

在中国科技互联网的早期版图中，百度一直是布局AI等前沿技术最坚定的公司之一。这种长期投入，也让它在产业发展的关键节点上，总能率先抛出自己的前瞻判断。这些判断，往往在后来成为精准命中、甚至自我实现的预言。

2026年初，现象级的AI节点无疑是“龙虾”的爆火出圈。而百度的观察，又一次走在了前面。在李彦宏看来，“龙虾”最具标志性的意义在于，这是第一次AI因应用本身、而非底层模型受到广泛关注。这标志着一个维度的成熟：智能体不再只是被动触发的工具，它应该能自主执行任务、在执行中学习、在学习中变得更强。

于是，下一个问题接踵而至：当智能体开始自我进化，我们该用什么来衡量这个飞速演化的崭新生态？

整个AI行业再次站在了岔路口。旧的衡量标准已然失效，但新的度量衡应该长什么样？这一次，李彦宏率先给出了一个答案。

衡量智能体价值的百度算法

李彦宏提出的新指标是DAA——Daily Active Agents，日活智能体数。这个概念在Create 2026大会的开幕式上被正式抛出。其含义直截了当：不要只数有多少人在使用AI，而要数有多少智能体在真正替人干活，并且交付了最终结果。

乍看这三个字母，或许会觉得这不过是又一个AI营销概念，一个为发布会发明的缩写。但如果把它放回李彦宏过去两年的公开表态里，就会发现一条清晰的暗线贯穿始终，其主轴正是“智能体的自我进化”。

时间拉回2024年7月的上海WAIC大会。彼时，全行业的主流叙事是寻找AI时代的“微信”，一个达到十亿级DAU的超级应用被视为大模型价值兑现的标志。而李彦宏提出了不同看法：“要避免掉入‘超级应用陷阱’，觉得一定要出现一个10亿DAU的App才叫成功，这是移动时代的思维逻辑。”

他当时看好的方向非常明确——智能体。“只要用人话把工作流说清楚，再配以专有知识库，即可做出一个很有价值的智能体，比互联网时代制作一个网页还简单。”他甚至预测了规模：未来将涌现数百万量级的智能体，形成一个庞大的生态。

在当时，这听起来还有些理想化。四个月后的百度世界2024大会上，李彦宏沿着这个思路继续加码：“智能体是AI应用的最主流形态，即将迎来爆发点。”同场大会上，“秒哒”发布，百度将其定位为无需写代码就能实现任意想法的软件——李彦宏称之为“迄今为止人类历史上最复杂的多智能体协作工具”。秒哒成了百度智能体想象力的孵化器，旨在帮助更多人打造数以百万计的“超级应用”。

到了2025年11月的百度世界大会，李彦宏的判断更进一步：当AI被内化成一种原生能力，智能就不再是成本，而是生产力。新的提法出现了——“效果涌现”与“AI内化”。为此，百度发布了“伐谋”，一个借鉴进化算法、能模拟甚至超越顶尖算法专家、根据条件变化自动迭代方案的智能体。“自我演化”这个词，第一次正式进入百度的AI产品叙事。

然后，就是现在的DAA。必须承认，李彦宏并非每一个判断都绝对准确，但在智能体这件事上，百度的确比行业共识更早。2024年中他在台上大谈智能体时，多数人还在为“谁家的ChatBot DAU更高”争论不休。实际上，这种移动互联网时代的思维惯性，一直延续到了2026年春节的AI大战。

“龙虾”的出现，终结了这种争论。李彦宏在Create大会上精准概括了这个节点的意义：过去每一次AI出圈，火的都是模型本身——2024年的ChatGPT，2024年的Sora，2025年的DeepSeek。“龙虾”第一次不同，它火不是因为用了哪款特定模型，而是在模型之上构建出了真正能帮人完成任务的智能体。“这是历史上第一次智能体替代了模型，出圈了。第一次，AI的主角不是模型，而是应用。”

这意味着，AI竞争的焦点，正从“智力”转向“执行力”。过去几年，行业比拼的是谁更聪明、谁的推理能力更强；而“龙虾”证明了，用户真正买单的不是“你会不会做”，而是“你能不能帮我把事做完”。

于是，终于没人再争论谁是下一个“微信”，也没人质疑“要不要做智能体”了。行业共识迅速收敛到一个更实际的问题：应该如何衡量智能体的价值？

这正是李彦宏试图用DAA指标回答的问题。移动互联网时代的DAU，衡量的是“多少人打开了App”。这对于一个7×24小时在后台运行、调用十几个工具、全程无需用户点击任何按钮的智能体来说，几乎没有意义。

在李彦宏的框架里，DAA是智能体“自我进化”的必然结果——当智能体不再是一个被人类手动触发的工具，而是能够自主执行、在学习中变强的实体时，衡量AI价值的尺度就必须随之改变。

对比来看，英伟达黄仁勋的算法是Token消耗量，甚至人为将其分成了不同价格档次：最聪明的、次一级的、日常使用的……在黄仁勋看来，Token消耗量就是AI时代的GDP。这个说法通俗易懂，易于传播，但作为算力供应商，英伟达的视角完全不衡量产出：一个智能体消耗了100万Token却没完成任务，另一个只用10万Token就交付了结果，在Token经济学的算法里，前者反而“贡献”更大。

李彦宏说得更直白：“Token只代表成本，并不代表收益；它衡量的是投入，而不是产出。Token消耗有没有效率、产出了什么价值——这些Token本身无法回答。”

DAA的提出，实际上隐含了一个深刻的质疑：如果Token是投入，智能体交付的结果才是产出，那么只看Token，就像只看一个国家的电力消耗量来评估其经济水平——虽有相关性，但远远不够。

一个真正在“自我进化”的智能体生态，需要一把衡量产出的尺子。DAA，就是李彦宏给出的那把尺子。

能自我进化的产品是什么样的

从DAA的概念延伸开，百度在Create 2026上发布了多款产品，试图从不同维度诠释“自我进化”的含义。其中的枢纽，是名为DuMate的产品。

李彦宏提出了一个判断：聊天机器人和通用智能体是两代入口。“第一代入口是以ChatGPT为代表的聊天机器人，主要解决信息获取问题；第二代入口是通用智能体，解决的是任务完成问题。”显然，通用智能体的价值天花板要高得多，而DuMate正是百度在3月上线的通用智能体。

DuMate的定位是“AI办公搭子”。单看这个说法，它像市面上众多的AI助手之一。但其真正的野心藏在架构里：它不只是一个智能体，而是一个能调度其他智能体的“智能体中枢”。秒哒、伐谋、搜索、文件管理、数据分析等百度核心能力，并非作为模块被简单集成，而是作为独立的智能体被DuMate调度。

这是一个完全按照DAA指标设计的产品。在DuMate的架构下，用户的一次任务请求，可能触发多个智能体同时工作——DuMate自身负责任务理解和分配，秒哒生成所需应用或页面，伐谋在后台进行决策推演，搜索智能体抓取外部信息。每一个被调起的智能体，都是一个活跃的智能体。如果用传统的DAU来衡量，只能看到一条线性的工作流；但用DAA来衡量，看到的则是“四个智能体在同时干活并交付结果”。

在一个典型的运营场景中，DuMate可以同时处理客服、数据分析和营销三条线的工作——过去需要三个人或至少三个工具分别完成的任务，现在由一个人加一组智能体就能搞定，百度内部称之为“人机混编”。更有意思的是，DuMate还会通过生成每日工作日报，反思任务完成情况，并从中提炼优化方向。这可以看作是智能体自我管理的一种最朴素形态，恰好对应了“自我进化”的字面含义。

面向不同人群的智能体矩阵

在所有可供DuMate调用的智能体中，秒哒和伐谋是最关键的两个。前者面向零代码经验的普通用户，后者则恰恰相反，针对的是被认为最难被AI替代的群体：决策专家。

秒哒自2024年底发布以来，根据最新数据，已服务超过1000万用户，其中81%为非技术人员。它做的事情简单而激进：让不会写代码的人用自然语言做出完整的商业应用。在Create大会上发布的3.0版本，升级了两个关键能力——直接生成可部署的App，以及支持多人协作开发。它是从DAA逻辑中自然生长出来的产品，其预设前提是：如果创造门槛足够低，就会有足够多的人创造出足够多的智能体，DAA这个指标自然就会增长。

Create 2026大会现场，来了一位温州的8岁开发者“扑满”。二年级的他，用秒哒做了一个叫“哒哒打伞”的应用，灵感源于一个微小的校园场景：放学下雨时同学们拼伞回家。打开应用，选择“我想搭伞”或“我来打伞”，设定好时间、起点、终点，就能发布需求。应用甚至设计了一个积分系统，帮别人打伞越多积分越高。一个8岁的孩子无需写一行代码，就能将一个具体的想法变成可用的产品。扑满把秒哒形容成机器猫：只要说出想要的，它就能从口袋里掏出来，甚至比想象的还要神奇。

秒哒这样的代码智能体，击穿了两道墙：高门槛与高成本。这意味着，并非只有足够通用、足够庞大的需求才值得被开发。李彦宏在台上描述了一个看似矛盾的现象：代码能力越来越重要，但代码本身正在变得不值钱。

在面向“零基础”用户的秒哒之外，针对专业领域，百度拿出了伐谋2.0。它的上一个版本在2025年发布时，还是一个偏技术侧的算法优化工具，核心能力是“自我演化式地寻找全局最优解”。到了2.0版本，伐谋最大的变化在于交互方式：它不再要求企业一次性把所有复杂的业务规则和约束条件讲清楚，而是通过持续对话，逐步逼近最优解。企业的业务专家可以像与资深同事交流一样，将模糊的经验、直觉和判断告诉伐谋，而伐谋会在对话中不断推演、验证、迭代这些内部知识，最终做出判断——而判断，往往是最稀缺的。

这非常适用于企业中的复杂场景，例如港口集装箱调度。这涉及数百个动态变量：船期、潮汐、堆场容量、卡车排队时间等。传统的优化模型需要运筹学专家花费数周建模，而伐谋2.0通过对话式推演，大幅压缩了这一过程。青岛港在引入伐谋后，其全球领先的自动化码头调度系统A-TOS在关键指标上实现了10.21%的进一步提升——对于一个已经连续十三次刷新世界纪录的系统来说，这个增量意义重大。关键不在于速度提升了多少，而在于它改变了“谁能使用优化工具”的前提——从需要运筹学博士，变成了一线业务人员。

除了面向不同用户群的智能体产品，百度的智能体概念还延伸至数字人领域。数字人像是介于现实与虚拟、软件与具身之间的节点，用李彦宏的话说，是“看得见的智能体”。百度“一镜”（原慧播星）可以实现全场景的真人级数字内容生成，倚靠的同样是多智能体协同能力。一条视频的生产过程中，剧本智能体负责脚本，视频智能体负责画面生成，剪辑智能体负责后期——三个智能体各自独立运作又相互配合，最终交付一个商业级的完整作品。一个人加上一组智能体，就能覆盖过去需要编导、摄像、剪辑、运营等多个岗位才能完成的工作。

这些产品在不同维度上讲述着同一个故事：智能体不再是一个被动等待指令的工具，它在学习、在迭代、在协同、在独立交付结果。这就是智能体的“自我进化”，而衡量这种进化的指标，就是DAA。

全栈布局共识的形成

DAA的智能体论述背后，是百度全栈的AI战略布局。这原本是个老生常谈的话题，大家都知道全链路技术能力的重要性。然而，互联网基础设施产业长久以来的演化规律是，不同的环节攫取各自的利润，从产品到模型，从芯片到云。

但AI的演化带来了真正的算力井喷式需求，分链条协作的效率开始比不上垂直整合。2026年上半年，全球最重要的几家AI公司，正在用真金白银的行动诠释这个结论。

三周前的Google Cloud Next 2026上，谷歌发布了第八代TPU双芯片架构，一颗专攻模型训练，一颗专攻推理。谷歌把针对大模型的技术布局，垂直优化到了芯片层。用谷歌云CEO托马斯·库里安的话说，所有组件都是协同开发的，这件事谷歌已经做了十年。

几乎同一时间，Anthropic在5月初公布了一系列智能体产品，但更震撼的是与马斯克的SpaceX签署了数据中心算力协议。加上此前与亚马逊AWS、微软Azure、谷歌云的基础设施合作，Anthropic正在极力扩充自己的算力储备。原因很简单，其CEO达里奥·阿莫迪此前估计第一季度增长速度为10倍，而实际情况是80倍。

OpenAI的路径也在向同一方向收敛。Codex正从与Claude Code竞争的代码工具，转变为一个生产力智能体平台。OpenAI显然也意识到，智能体的价值至少与10亿月活用户同等重要，甚至可能更重要。

微软也在5月1日上线了名为Agent 365的企业级智能体平台，设计了一整套管理智能体的流程。将这四家巨头的动作叠在一起看，一个清晰的共识浮现出来：智能体是重要的，但做好智能体需要从芯片到云再到平台调度层的全套优化。它们之间的关系不是松散的，想要实现极致性能，就需要端到端的垂直整合。

这也是百度“芯云模体”战略的核心。昆仑芯、百度智能云、文心大模型以及DuMate/秒哒/伐谋/一镜等应用，共同构成了百度的端到端AI链路。

从实际落地层面看，在B端智能体基础设施这一层，百度确实有可用的积累：昆仑芯P800已完成万片级交付，256卡超节点计划于6月问世，同时芯片企业主体正在筹备上市；百度智能云在第三方报告的AI全栈服务市场份额中位居中国市场前列。

这些都说明，在B端智能体基础设施层面，百度具备相当的积累。然而，放眼全球，目前还没有哪家公司真正跑通了AI智能体全栈的每一层。“芯云模体”四个字所暗示的那种端到端协同优化，目前更多还是一个架构愿景和发展方向。大家对方向没有异议，关键在于如何执行。

书写新答案的时间

当然，敢于率先出牌，并不意味着牌一定能赢。

DAA能否从百度的一家之言，变成行业的通用语言，尚取决于几个先决条件。首先，智能体本身要足够成熟——当前全球范围内，大多数智能体产品还处在从演示Demo到稳定产品的过渡期，能真正7×24小时可靠运行并交付结果的智能体，仍然是少数。

其次，DAA的定义也需要可量化、可测量。如何标准化地衡量一个智能体交付的成果？在Create大会上，李彦宏给出了一个大胆预测：未来全球日活智能体数量可能超过100亿。如何统计它们的成果将是一个极其复杂的课题。当组织里每个人的效率都成倍提升时，金字塔型的管理结构将不再必要，管理的主要功能将从监督、指挥、激励，转变为“对齐”——不是盯着他做事，而是确认他在做对的事。

这个关于组织进化的判断，已经超越了技术范畴。它暗示的终局是：衡量一家企业竞争力的方式，将从“你有多少员工”转变为“你有多少智能体”。DAA不只是一个产品指标，它隐含了百度对于未来劳动和组织全新形态的一种认知。在这种新形态中，AI在提升每个人的能力边界，而传统组织的层级、分工与控制手段，可能反而在压制创造力。

回到李彦宏2024年在WAIC上的那句话：“不是只有10亿DAU才叫成功。”两年后的Create 2026上，他给出了这个回答的下半部分：成功的标准，应该是有多少智能体在真正替人干活、交付结果。百度把这个标准叫做DAA，把驱动它迭代的路径叫做“自我进化”，把支撑它的全栈技术体系概括为“芯云模体”。

DAA是否会成为行业通行的标准？现在下结论还为时过早。但至少，在所有人都在做智能体、却没人认真思考“智能体时代该怎么计分”的2026年上半年，百度是第一个开始系统回答这个问题的组织。

书写最终的答案，还需要时间。

题图来源：百度

来源：互联网

上一篇 2026本地生活AI消费趋势：美团技术重构逻辑深度解析 下一篇 本田调整电动化战略：CEO三部敏宏详解2040年目标调整与未来规划

免责声明

本网站新闻资讯均来自公开渠道，力求准确但不保证绝对无误，内容观点仅代表作者本人，与本站无关。若涉及侵权，请联系我们处理。本站保留对声明的修改权，最终解释权归本站所有。