菜鸟AI - 让提示词生成更简单! 全站导航 全站导航
AI工具安装 新手教程 进阶教程 辅助资源 AI提示词 热点资讯 技术资讯 产业资讯 内容生成 模型技术 AI信息库

已有账号?

首页 > 资讯 > 智能体AI重塑企业架构与Token经济学排行榜
其他资讯

智能体AI重塑企业架构与Token经济学排行榜

2026-05-30
阅读 0
热度 0
作者 菜鸟AI编辑部
摘要

摘要

在B2B技术领域,一年周期或许不算长。但人工智能赛道的迭代速度,足以让企业架构的底层

在B2B技术领域,一年周期或许不算长。但人工智能赛道的迭代速度,足以让企业架构的底层逻辑在12个月内被彻底重写。

智能体AI正在重塑企业架构与Token经济学

拉斯维加斯戴尔技术世界大会上,戴尔全球首席技术官约翰·罗斯(John Roese)向媒体释放了一个关键信号:智能体AI的成熟正迫使IT决策者从基础设施、数据治理和运营成本三个维度重新布局。

“我们使用AI的基本前提已经发生了质变。它不再是聊天机器人那样完成单项任务。”罗斯指出,“当前模式是,你把一个目标扔给AI系统,它自主拆解并执行。这正是智能体当前在做的事。”

他以谷歌搜索为例:“你输入一个目标,它自行调度多项搜索操作,最终为你拼出完整页面。所有智能体协同运作,朝统一目标推进。”

智能体AI带来了体验上的断层升级——人类从执行者转变为指令发布者。正因如此,企业正加速淘汰早期生成式AI应用场景,全面重构为基于智能体的工作流。

GPU训练迷思:企业并不需要数千块

尽管第一波AI热潮让不少企业疯狂采购GPU用于模型训练,但罗斯强调,企业的基础设施需求与超大规模云服务商存在本质差异。

“外界有种说法,认为企业需要数千块GPU。”罗斯解释,“但戴尔内部最大的AI工作负载仅用了16块GPU,却服务于4万名员工。企业根本不需要数千块。针对每个工作负载、每个智能体或每个项目,你只需要少量GPU——有时半块就够。”

原因明确:企业AI部署的重心完全落在推理而非训练。“对智能体而言,只需要推理能力,不涉及任何训练。”

但推理工作负载的架构也在变化。部署聊天机器人时,CPU负载极轻。而AI智能体需要调用外部工具、通信协议和知识图谱,这些组件天然不在GPU内。

“切换到智能体模式后,算力结构变得均衡。”罗斯说,“CPU与GPU的比例接近1:2。你不能仅靠堆叠GPU来构建AI基础设施,必须将GPU与传统的CPU算力结合。”

前沿模型新选择:气隔部署与边缘落地

企业从强大AI模型的部署方式变化中也获得了显著收益。一年前,最顶尖的前沿模型只能通过云端API调用。

现在情况不同了。随着超大规模云服务商(如谷歌分布式云)支持顶级模型本地运行,罗斯指出,私有模型已拥有多种部署拓扑可选。“你可以在虚拟私有云或自建数据中心中使用它,也可以让它与其他系统完全隔离。而一年前,除了API调用,这些选项根本不存在。”

同时,AI正以有序方式向边缘端延伸。罗斯提到近期出现的OpenClaw等框架,能原生运行在设备和AI PC上。“这些框架为在设备端运行智能体提供了标准化结构。这是真实的进展,绝非一时噱头。”

数据层架构重构进行时

数据策略也随智能体AI同步演进。罗斯给出明确警示:将标准数据存储系统简单挂载到AI计算集群上,已无法满足智能体对性能的要求。

企业需要构建由向量数据库、图数据库和数据标注工具组成的知识与上下文层。而且,这些层级不能孤立存在,必须与计算资源深度融合。

“性能瓶颈之一是数据无法快速传输到GPU完成计算。”罗斯说,“你花重金购置的GPU正在闲置等待数据。”为降低延迟,戴尔AI数据平台已接入Nvidia的Cuda-X接口,使数据层服务能以GPU速度运行。

Token经济学与模型路由:掌控成本

随着不同定价机制下的模型部署选项日益丰富,IT领导者又多了一项任务:管理AI消费成本。即便单个Token的单价预计会随时间下降,但“AI的使用成本不存在变得更低廉的路径”。罗斯认为,企业必须将AI工作负载视为一场套利博弈。

以规范驱动的开发方式为例——让AI根据一份Markdown文档编写软件。他指出,如果智能体框架产生大量编码任务,然后不加区分地全部发送给顶级模型,企业最终会收到高昂账单。

而借助模型路由,情况截然不同。企业可以将创建软件规范这类复杂规划任务发送给昂贵的前沿模型;同时将常规编码任务路由到本地运行的小型开源模型上,后者的运营成本仅为电力消耗。

“开发一款软件并进行规范驱动开发,可能有四五种不同的经济路径,最终实现最优整体经济效益。”罗斯补充,掌握模型路由将成为企业的核心竞争优势,并有助于降低产品开发成本。

人的因素:变革管理成为核心

归根结底,智能体AI运营中最棘手的环节在于人。罗斯将传统人类工作描述为一个“工作容器”,里面装着日常事务、效率提升、协调配合和专业任务等各种活计。智能体无法承担完整工作,但在这个容器内,它们能高效完成特定类型任务。

戴尔已对公司内部6400个岗位进行审计,评估AI智能体将对员工队伍产生的影响。

“我们意识到的第一件事,是公司里每一个岗位都将发生变化。”罗斯说,“我正在把工作从岗位中抽离,把东西从容器里拿走。如果容器现在只装了一半,我需要减少一半员工吗?还是用更多内容填满剩余空间?我能否让员工承担更多专业性工作?”

事实上,AI对职场的深远影响,已使变革管理成为IT领导层的核心职责之一。

“过去四个月里,我有50%的时间都在处理人的问题。”罗斯说,“AI已经不再是一个技术讨论或投资回报率讨论的话题。它现在更多是关于组织与人的动态变化的讨论。除非你完全理解如何引导身边的人去适应这些变化,否则你根本无法有效使用这些工具。”

Q&A

Q1:企业部署AI智能体到底需要多少GPU?

根据戴尔全球CTO约翰·罗斯的观点,企业并不需要数千块GPU。戴尔内部最大AI工作负载仅使用16块GPU,却服务4万名员工。对于每个工作负载或智能体项目,通常只需少量GPU,有时半块就够。核心原因在于企业AI聚焦推理而非训练,推理算力远低于训练阶段。

Q2:企业应该如何控制AI智能体带来的Token成本?

企业可通过模型路由优化成本。具体做法:将复杂规划任务(如软件规范制定)路由至高性能前沿模型;将常规编码等简单任务交由本地运行的小型开源模型处理,后者运营成本仅为电力。一个软件开发项目可能存在四五种不同经济路径,合理的模型路由策略能帮助企业实现最优整体经济效益。

Q3:AI智能体对企业员工和组织架构会产生哪些影响?

戴尔对内部6400个岗位审计后发现,每一个岗位都会因AI智能体而发生变化。智能体承接工作中的特定任务,使原有“工作容器”出现空缺。企业需要抉择:是缩减人员,还是让员工承担更多专业性工作。戴尔CTO表示,过去四个月他有50%时间处理人的问题。AI的推进已从技术议题彻底转变为组织与人员动态管理的核心课题。

来源:互联网

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

同类文章推荐

相关文章推荐

更多