其他资讯

智能体AI重塑企业架构与Token经济学排行榜

2026-05-30

阅读 0

热度 0

作者菜鸟AI编辑部

摘要

在B2B技术领域，一年周期或许不算长。但人工智能赛道的迭代速度，足以让企业架构的底层

在B2B技术领域，一年周期或许不算长。但人工智能赛道的迭代速度，足以让企业架构的底层逻辑在12个月内被彻底重写。

智能体AI正在重塑企业架构与Token经济学

拉斯维加斯戴尔技术世界大会上，戴尔全球首席技术官约翰·罗斯（John Roese）向媒体释放了一个关键信号：智能体AI的成熟正迫使IT决策者从基础设施、数据治理和运营成本三个维度重新布局。

“我们使用AI的基本前提已经发生了质变。它不再是聊天机器人那样完成单项任务。”罗斯指出，“当前模式是，你把一个目标扔给AI系统，它自主拆解并执行。这正是智能体当前在做的事。”

他以谷歌搜索为例：“你输入一个目标，它自行调度多项搜索操作，最终为你拼出完整页面。所有智能体协同运作，朝统一目标推进。”

智能体AI带来了体验上的断层升级——人类从执行者转变为指令发布者。正因如此，企业正加速淘汰早期生成式AI应用场景，全面重构为基于智能体的工作流。

GPU训练迷思：企业并不需要数千块

尽管第一波AI热潮让不少企业疯狂采购GPU用于模型训练，但罗斯强调，企业的基础设施需求与超大规模云服务商存在本质差异。

“外界有种说法，认为企业需要数千块GPU。”罗斯解释，“但戴尔内部最大的AI工作负载仅用了16块GPU，却服务于4万名员工。企业根本不需要数千块。针对每个工作负载、每个智能体或每个项目，你只需要少量GPU——有时半块就够。”

原因明确：企业AI部署的重心完全落在推理而非训练。“对智能体而言，只需要推理能力，不涉及任何训练。”

但推理工作负载的架构也在变化。部署聊天机器人时，CPU负载极轻。而AI智能体需要调用外部工具、通信协议和知识图谱，这些组件天然不在GPU内。

“切换到智能体模式后，算力结构变得均衡。”罗斯说，“CPU与GPU的比例接近1:2。你不能仅靠堆叠GPU来构建AI基础设施，必须将GPU与传统的CPU算力结合。”

前沿模型新选择：气隔部署与边缘落地

企业从强大AI模型的部署方式变化中也获得了显著收益。一年前，最顶尖的前沿模型只能通过云端API调用。

现在情况不同了。随着超大规模云服务商（如谷歌分布式云）支持顶级模型本地运行，罗斯指出，私有模型已拥有多种部署拓扑可选。“你可以在虚拟私有云或自建数据中心中使用它，也可以让它与其他系统完全隔离。而一年前，除了API调用，这些选项根本不存在。”

同时，AI正以有序方式向边缘端延伸。罗斯提到近期出现的OpenClaw等框架，能原生运行在设备和AI PC上。“这些框架为在设备端运行智能体提供了标准化结构。这是真实的进展，绝非一时噱头。”

数据层架构重构进行时

数据策略也随智能体AI同步演进。罗斯给出明确警示：将标准数据存储系统简单挂载到AI计算集群上，已无法满足智能体对性能的要求。

企业需要构建由向量数据库、图数据库和数据标注工具组成的知识与上下文层。而且，这些层级不能孤立存在，必须与计算资源深度融合。

“性能瓶颈之一是数据无法快速传输到GPU完成计算。”罗斯说，“你花重金购置的GPU正在闲置等待数据。”为降低延迟，戴尔AI数据平台已接入Nvidia的Cuda-X接口，使数据层服务能以GPU速度运行。

Token经济学与模型路由：掌控成本

随着不同定价机制下的模型部署选项日益丰富，IT领导者又多了一项任务：管理AI消费成本。即便单个Token的单价预计会随时间下降，但“AI的使用成本不存在变得更低廉的路径”。罗斯认为，企业必须将AI工作负载视为一场套利博弈。

以规范驱动的开发方式为例——让AI根据一份Markdown文档编写软件。他指出，如果智能体框架产生大量编码任务，然后不加区分地全部发送给顶级模型，企业最终会收到高昂账单。

而借助模型路由，情况截然不同。企业可以将创建软件规范这类复杂规划任务发送给昂贵的前沿模型；同时将常规编码任务路由到本地运行的小型开源模型上，后者的运营成本仅为电力消耗。

“开发一款软件并进行规范驱动开发，可能有四五种不同的经济路径，最终实现最优整体经济效益。”罗斯补充，掌握模型路由将成为企业的核心竞争优势，并有助于降低产品开发成本。

人的因素：变革管理成为核心

归根结底，智能体AI运营中最棘手的环节在于人。罗斯将传统人类工作描述为一个“工作容器”，里面装着日常事务、效率提升、协调配合和专业任务等各种活计。智能体无法承担完整工作，但在这个容器内，它们能高效完成特定类型任务。

戴尔已对公司内部6400个岗位进行审计，评估AI智能体将对员工队伍产生的影响。

“我们意识到的第一件事，是公司里每一个岗位都将发生变化。”罗斯说，“我正在把工作从岗位中抽离，把东西从容器里拿走。如果容器现在只装了一半，我需要减少一半员工吗？还是用更多内容填满剩余空间？我能否让员工承担更多专业性工作？”

事实上，AI对职场的深远影响，已使变革管理成为IT领导层的核心职责之一。

“过去四个月里，我有50%的时间都在处理人的问题。”罗斯说，“AI已经不再是一个技术讨论或投资回报率讨论的话题。它现在更多是关于组织与人的动态变化的讨论。除非你完全理解如何引导身边的人去适应这些变化，否则你根本无法有效使用这些工具。”

Q&A

Q1：企业部署AI智能体到底需要多少GPU？

根据戴尔全球CTO约翰·罗斯的观点，企业并不需要数千块GPU。戴尔内部最大AI工作负载仅使用16块GPU，却服务4万名员工。对于每个工作负载或智能体项目，通常只需少量GPU，有时半块就够。核心原因在于企业AI聚焦推理而非训练，推理算力远低于训练阶段。

Q2：企业应该如何控制AI智能体带来的Token成本？

企业可通过模型路由优化成本。具体做法：将复杂规划任务（如软件规范制定）路由至高性能前沿模型；将常规编码等简单任务交由本地运行的小型开源模型处理，后者运营成本仅为电力。一个软件开发项目可能存在四五种不同经济路径，合理的模型路由策略能帮助企业实现最优整体经济效益。

Q3：AI智能体对企业员工和组织架构会产生哪些影响？

戴尔对内部6400个岗位审计后发现，每一个岗位都会因AI智能体而发生变化。智能体承接工作中的特定任务，使原有“工作容器”出现空缺。企业需要抉择：是缩减人员，还是让员工承担更多专业性工作。戴尔CTO表示，过去四个月他有50%时间处理人的问题。AI的推进已从技术议题彻底转变为组织与人员动态管理的核心课题。

来源：互联网

上一篇 2024年中国工业新闻网站权威精选排行榜TOP10 下一篇 微软《工作趋势指数》报告：2024打工人AI效率排行榜

免责声明

本网站新闻资讯均来自公开渠道，力求准确但不保证绝对无误，内容观点仅代表作者本人，与本站无关。若涉及侵权，请联系我们处理。本站保留对声明的修改权，最终解释权归本站所有。