菜鸟AI - 让提示词生成更简单! 全站导航 全站导航
AI工具安装 新手教程 进阶教程 辅助资源 AI提示词 热点资讯 技术资讯 产业资讯 内容生成 模型技术 AI信息库

已有账号?

首页 > 资讯 > 2024权威排行榜精选:昇腾软硬件全栈领先,Agent时代未至路已铺好
其他资讯

2024权威排行榜精选:昇腾软硬件全栈领先,Agent时代未至路已铺好

2026-05-30
阅读 0
热度 0
作者 菜鸟AI编辑部
摘要

摘要

昇腾为迎接Agent时代,从硬件到软件全面重构算力底座。超节点实现全域内存统一编址,通

中国大模型的进展在过去两年成绩亮眼。从去年起,头部模型的能力已稳居全球第一梯队。M2.5、K2.5在OpenRouter上的Token消耗量长期领跑,V4也常被拿来与GPT-5对标。但一个关键前提常被忽视——这些模型之所以能运作,依赖的是现有算力底座的“勉强支撑”。

那么,“够用”什么时候会变成“不够用”?答案就在Agent时代。到了这个节点,“能跑”和“跑得顺”完全是两个概念。

在今年的鲲鹏昇腾开发者大会2026——昇腾AI开发者峰会2026上,昇腾给出了一个底层量化洞察:过去一年,模型调用频次暴涨50到100倍,序列长度从Chatbot时代的4K飙升至接近1M,跨度高达250倍。更关键的是,MoE推理对时延的要求正从10毫秒级向1毫秒级逼近。

这不再是“模型变大”的量变问题,而是一个质变信号——整个算力底座的底层逻辑需要被重写。真正的问题不是“现有算力够不够”,而是当Agent的胃口以指数级增长,不仅消耗更多,还创造井喷式新需求时,现有算力架构的“够用”还能撑多久?

从这个角度切入,就会发现昇腾今年在峰会上强调的三件事——超节点架构创新、软件全面开源开放、开发者体验升级——本质上都在回答同一个问题:算力底座如何从“能跑模型”进化到“天然亲和Agent”?

这并非三个独立议题,而是一条从硬件到软件再到开发者的完整技术链,必须在Agent前夜完成的一次系统性重构。

超节点:让数千个NPU协同形成更强合力

Chatbot时代,序列长度约4K,KVCache命中一次即够,NPU间的通信压力不大,基本可控。

但进入Agent时代,推理链路被拉长到接近1M tokens,KVCache需频繁在不同NPU间跳跃。这时,问题不只是“带宽够不够”,而是架构级命题——NPU间的通信方式直接决定系统的性能上限。

传统方案是每个NPU挂载独立内存,跨NPU访问走消息语义(send/recv),单次通信耗时微秒级。

昇腾超节点天然亲和Agent负载。判断超节点的核心标准只有一个——是否实现“全域内存统一编址”。昇腾950芯片的架构创新,实现了SIMT与SIMD双编程模式的一体化融合,并在三方面同时达成目标。

第一是内存语义的革命。基于灵衢互联协议和总线控制器,AIC/AIV通过MTE指令直接访存远端内存,无需拷贝。对比传统以太网,超节点架构下MTE指令一个操作即可完成。这之间的差距不是量的优化,而是质的重构。

第二是全域内存统一编址。全局单一虚拟地址空间下,NPU和CPU可直接用虚拟地址访问任意位置,无需改代码、无需路由、无需拷贝。KV Cache实现全局共享,超长上下文可无缝扩展。

第三是内存池化带来的效率跃迁。通过片上内存和DDR的分层池化能力,实现“以查代算”,KV Cache查询命中率大幅提高。在LLM、推荐、Engram等典型场景,查询时延降低3到4倍,训练和推理吞吐相比传统集群提升3到4倍。

这三层叠加,通信RTT时延被压缩至3微秒,带宽达到TB级。这才是超节点的真正价值——不是“堆更多的NPU”,而是让每个Token更高效、更经济。

因此,峰会给出的核心判断很直接:互联能力决定超节点能力,系统综合性能取决于超节点规模与单芯片性能规格的乘积。当互联带宽达到T级,超节点要做的不是“堆更多的NPU”,而是重新定义芯片之间的通信方式。

但物理上限只是入场券。真正决定算力生态命运的,是硬件造出来后的另一个核心问题:软件门槛有多高?开发者是否愿意投入?

昇腾要走自己的路

吸引开发者的关键是开源。但开源的底层逻辑已经改变。

过去许多硬件的所谓“开源”,不过是在围墙外开一扇窗——能看到代码,但不能改核心层,更不能参与路线决策。这是“开放姿态”,不是“开源生态”。为何要计较这个区别?因为开源与“看上去像开源”,打开的是两种完全不同的生态前景。

真开源意味着开发者敢于在平台上持续投入——代码可修改、路线可参与、技术迭代不会在某天突然停止。假开源则意味着开发者永远需要留退路,每做一步优化都可能白费。在Agent时代,当软件需求井喷、新场景以周为单位涌现,开发者选择哪个生态来建设基础设施,本质上是选择信任——信任这个平台不会因封闭而让其走回头路。

因此,“开放姿态”能吸引围观,“开源生态”才能留住人。

昇腾这次在开源开放的道路上走得更彻底。核心区别在于,它正在构建一个完整、高效、开放的算子开发体系,让开发者从任何入口进入,都能找到自己的路径。

追求极致性能的工程师,可用Ascend C做细粒度控制——计算、访存、流水,每一步都可调。同时,昇腾还推出了Tensor API、支持Host-device混合编程、新增了CCU通信能力。

注重快速创新的AI算法工程师,则可用TileLang或Triton——这两个主流开源生态接口已实现100%兼容,性能达到Ascend C的0.6到0.9倍,开发周期压缩至一周。目前已支持超过600个Triton算子和300个TileLang算子。

想在性能与效率间找甜点区的开发者,还有PyPTO可选。

在这套多路径算子编程体系的另一侧,CANNBot算子智能体把“最后一公里”也打通了。它将微架构优化经验融入技能库,单个Vector算子生成仅需3小时,从生成到部署全流程只需1天,相比传统人工开发效率提升5倍以上。加上覆盖22类典型算子的评测集和内置4000多个评测点的自动化验证体系,开发者完全无需从零摸索。

以上这些,加上AscendNPU IR编译底座的全面开源、联合30余家企业与高校共建的15个以上生态算子库,昇腾正向外界抛出一个关键橄榄枝——在这里,从零写一个算子,已经不需要“专家身份”。

换个角度看,开源真正的分水岭从来不是放出了多少代码,而是开发者能否在昇腾上从头写一个算子。现在,答案开始变成“能”。

当然,开了门是一回事,让人留下来又是另一回事。这取决于第三个维度——开发者体验。

开发者体验的飞轮已全面转动

过去,一个模型从想法到部署的路径是:调研生态兼容性、手工适配算子、搭建验证环境、手动量化、部署调试……整套下来,周期往往以周计。且每一步都需要全方位能力,而“全方位”就意味着高门槛。

但在DeepSeek-V4-Flash的昇腾实际部署中,我们看到不同的路径——1分钟完成模型状态检索,一天内完成适配,再经小时级自动验证和量化后,30分钟输出部署服务和模型文档。相比传统方式,效率提升4倍,若考虑环境差异,远不止4倍。

这是如何实现的?不是工具变多了,而是昇腾将“专家经验”变成了“系统能力”。

具体来看,有两套机制驱动着这一变化。

第一套是Skills体系。4000多名昇腾工程师多年调优积累的经验、踩过的坑、验证过的最佳实践,在这里被结构化沉淀为200多个可调用的Skills模块。它们兼容Claude Code、Codex、OpenClaw等主流Agent平台,两行命令即可调用。以往需要找对人才能解决的问题,现在Skills里直接就有。

第二套是Agentic工作流。如今,开发者只需描述意图,7个基础Agent会自动编排接力,调研、适配、优化、部署全流程自动化。以前是“人找工具”,现在变成了“工具找人”——昇腾从根本上改写了开发者的工作范式。

以上更多是从技术层面拉升开发者体验。但要让开发者体验的飞轮全面转起来,光靠技术还不够。昇腾进一步给出了两套新体验。

一是零成本的试错空间。一键自动部署、平均两分钟跑通首个Demo、上万卡算力资源投放支持开源社区——这里要解决的不仅是算力成本,更是“第一次尝试”的心理门槛。很多开发者不是不想用新平台,而是怕花了时间还跑不通。昇腾将“试一试”的成本大幅降低,本质上就是在消除这个心理阻力。

二是可兑现的职业回报。联合头部互联网企业打造三层认证体系,附带简历推荐、大厂实习等权益。昇腾正在让“我能用好昇腾”这件事本身具有商业化的职业流动性。开发者留在一个生态里,从来不只是因为工具好用,而是因为他在这里积累的技能能换取实打实的外部回报。正视这一需求,远比想象中重要。

这两样东西叠加后,传递给开发者的信息很清晰:来昇腾,不需要从头开始。不管是对于开发者,还是对于昇腾,飞轮已全面转动。

写在最后

在超节点巅峰对话直播中,我们看到了一个来自产业端的判断:“当智能生产软件的方式变得更高效,人类对软件的需求会井喷。以前的软件太昂贵,很多需求被压抑了。”

对应来说,Agent时代不仅在消耗更多Token,还在创造过去不存在的新需求——软件不再是标准化产品的复用,而是每个人、每个场景的即时定制。这种需求一旦释放,对算力的渴求就不再是线性的,而是爆炸式的。正如Anthropic联创Jack Clark的判断,2028年Agent可能进入自主进化,届时Token消耗将进入非线性增长通道。

两条线指向同一个结论:Agent时代的到来不能等。你不可能等Agent全面爆发后再补架构课、开软件源、降开发者门槛——那相当于堵车时才开始修路。

因此,回头看昇腾在峰会上铺开的三件事,本质上是对这一判断的三重回应。

首先,超节点重新定义了NPU间的通信范式,让Agent时代的算力消耗不再被延迟墙锁死。这是为Agent时代打好硬件基础。

其次,CANN的多路径算子编程体系加CANNBot,让任何一个开发者都能在昇腾上从零写出高性能算子。这是为Agent时代夯实软件能力。

最后,Skills体系和Agentic工作流,把4000个工程师的经验打包成每个新手的起点。这是为开发者铺好“好用易用”的路径。

三道能力叠加,解释了昇腾今天要做的事——不是在应对当下,而是在对标一个尚未到来、但已在路上的Agent时代。

来源:互联网

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

同类文章推荐

相关文章推荐

更多