菜鸟AI - 让提示词生成更简单! 全站导航 全站导航
AI工具安装 新手教程 进阶教程 辅助资源 AI提示词 热点资讯 技术资讯 产业资讯 内容生成 模型技术 AI信息库

已有账号?

首页 > 资讯 > AMD AI开发者日深度解析:从GPU堆叠到系统工程的全路径部署指南
其他资讯

AMD AI开发者日深度解析:从GPU堆叠到系统工程的全路径部署指南

2026-05-23
阅读 0
热度 0
作者 菜鸟AI编辑部
摘要

摘要

AMD开发者大会指出AI正转向推理普及,面临算力与隐私挑战。AMD通过开放生态应对,强调系

AI用起来是方便,智能体也火得一塌糊涂,但真到了要落地的时候,算力成本像个无底洞,数据隐私又成了谁也不敢碰的高压线——这大概就是眼下AI行业最真实的尴尬。

怎么破局?在今年的AMD AI开发者大会上,AMD董事会主席及首席执行官苏姿丰博士(Dr. Lisa Su)给出了他们的答案。她认为,AI应该无处不在,服务于每一个人、每一种工作负载和每一种设备形态。而AMD的使命,不仅是提供高性能计算,更是通过开放的软硬件生态,赋能开发者应对智能时代的算力挑战。

算力拐点已至:从“堆GPU”到“系统工程”

眼下,AI正处在一个关键拐点:从以训练为主导,转向推理的全面普及。智能体AI的崛起,让计算需求从简单的“一问一答”,演变成了“多步、多调用、多智能体”的复杂协作。这一转变对算力提出了全新要求:光有强大的GPU已经不够了,更需要系统级的协同、高带宽大容量的统一内存,以及一张覆盖从端到云的完整计算谱系。

挑战有多严峻?AMD高级副总裁、计算与图形总经理Jack Huynh用一组数据揭示了现状:到2030年,全球预计将有50亿人使用AI。Token需求正呈指数级飙升,仅OpenRouter一个平台,从2025年2月到2026年初,处理的Token数量就从2万亿猛增到42万亿。而中国市场的消耗量更为惊人,每天达140万亿Token,两年内增长超过100倍。

算力,早已不是唯一的约束条件了。Jack Huynh进一步指出,计算对预填充固然重要,但内存在今天扮演的角色比过去关键得多。内存大小,直接决定了你能在上下文中运行多大的模型;而内存带宽,则决定了解码速度的快慢。这一洞察,正是AMD推出锐龙AI Max+系列处理器的核心逻辑所在。

对此,AMD高级副总裁、大中华区总裁潘晓明在大会欢迎辞中也有深刻阐述。他认为,中国正走在全球AI发展的最前沿。而AMD的策略,是通过覆盖云、边、端的计算产品组合,加上开源的ROCm软件平台,为开发者提供开放的全栈式AI算力支持;同时不断优化开发环境与工具链,助力创意从孵化到落地;并通过开发者社区与校园计划,积极推动人才培养和生态共建。

锐龙AI Max+系列:重新定义智能体主机

为了应对本地化、低延迟、高隐私的AI推理需求,AMD率先提出了“智能体主机”这一新概念,并推出了锐龙AI Max+系列处理器。该系列最高支持128GB的统一内存,其中96GB可作为GPU专属显存,能够原生运行高达2000亿参数的本地大模型,例如Qwen 3.5 122B、阶跃星辰Step 3.5等。

零一万物创始人兼CEO李开复博士在与苏姿丰的对话中,点明了智能体经济的本质其实是推理经济:一个用户查询可能会“扇出”触发多个智能体调用,再汇聚、再扇出。这就要求处理必须本地优先、设备端完成,且延迟需低于100毫秒。他特别强调,AMD的统一内存架构和本地化算力,为企业提供了安全、可控、高效的AI部署新范式。

Jack Huynh在现场演示中印证了这一点:我们可以在单一设备中完整运行整个模型,无需分片,也无需卸载到云端。锐龙AI Max系列将成为AI开发最智能、成本最高效的选择。目前,惠普、华硕、联想、宏碁及众多本地创新品牌,已推出超过35款基于该系列处理器的产品,涵盖一体机、笔记本、Mini AI工作站等多种形态。

阶跃星辰联合创始人兼CTO朱亦博博士也在大会上展示了其Step 3.5模型在AMD平台上的表现。他表示,在AMD笔记本电脑上实现了近每秒100个Token的解码速度,这甚至比许多云端模型的API还要快。这意味着,开发者可以在本地以极低的成本运行2000亿参数的模型,这彻底改变了AI应用的开发与部署方式。

ROCm软件栈:打通AI部署的全路径

硬件是基础,软件则是灵魂。AMD正通过开放的ROCm软件栈,构建一个从笔记本到数据中心的统一开发平台。ROCm支持所有AMD GPU,真正实现了“一次编写,全路径运行”,极大提升了开发、测试、微调和部署的效率。

AMD AI软件负责人Nick Ni在演讲中,介绍了ROCm的三大战略支柱:首先是开源,所有主流框架都已原生支持AMD GPU;其次是抽象化,开发者无需深入GPU底层架构即可获得高性能;最后是AI辅助开发,团队已经利用AI智能体来自动生成GPU内核、识别性能差距、并优化基准测试。

Nick Ni特别提到,ROCm目前已支持超过300万个模型开箱即用,并在PyTorch等框架中实现了零代码改动即可运行。他分享了一个有趣的细节:我们的工程师从每周提交几个PR(Pull Request),发展到如今每天提交多个PR,这背后正是AI智能体在发挥作用。

此外,AMD还宣布在中国推出首个面向AI开发者的免费Radeon GPU开发者云,并与阿里云魔搭社区(ModelScope)合作,使得AMD GPU可以直接在魔搭Studio中使用。Nick Ni表示,我们听到了开发者的声音,他们需要便捷地访问云端AMD GPU资源。今天,这个免费的云服务正式推出,开发者扫码即可注册使用。

深耕中国:开放生态与人才培养的双向奔赴

当前,全球AI发展已驶入快车道,而中国更是走在了世界前列。这里不仅汇聚了顶尖的AI人才,创新企业也如雨后春笋般涌现。

潘晓明表示,AMD选择将北美之外唯一一场AI开发者日放在上海,正是为了与中国顶尖的AI人才和生态伙伴进行深度交流。他进一步阐述了AMD将从“开放、构建、创新、连接”四个维度来赋能开发者的具体路径。

苏姿丰博士同样强调:中国拥有全球最具活力的AI生态系统。AMD在华已有超过30年的历史,上海研发中心是AMD全球最大的研发中心之一,深度参与芯片设计、系统开发以及AI软件生态建设。AMD致力于与中国云厂商、基础模型公司、开源社区携手,共同推动开放创新。

为了赋能本地开发者,AMD推出了一系列专属项目:包括基于Radeon GPU的免费开发者云、与阿里云魔搭社区的合作、通过微信提供专属技术支持、AI学院课程、积分奖励等。AMD还发布了“AI开发手册”(AI Playbooks),覆盖本地推理、微调、视频生成等主流工作负载,支持Windows和Linux系统,旨在帮助开发者从零开始快速上手。

在大会的“作品说话”开发者分论坛上,多位本土开发者展示了基于AMD平台的端侧智能体应用,从多智能体协作到机器人控制,从Vibe Coding到OpenClaw,充分展现了在开放生态下迸发的创新活力。

2026年,恰逢AMD上海研发中心成立二十周年。二十年来,该中心已从最初的芯片设计支持部门,成长为覆盖全栈技术能力的全球研发支柱。站在新的起点上,上海研发中心将继续聚焦高性能计算与人工智能的前沿布局,强化全球协同与本地赋能,为下一代智能计算贡献“芯”力量。

写在最后:共同加速下一波AI创新浪潮

面对AI时代带来的算力挑战,AMD正在通过端到端的AI算力方案、统一的ROCm软件平台,以及深耕中国的生态投入,试图为开发者打造一个从创意到落地的完整闭环。这场首次登陆中国的AMD AI开发者大会,不仅是一次技术的集中展示,更是一次关于开放与协作的深刻实践。

正如苏姿丰博士在大会上所言,我们仍处在AI发展的早期阶段。未来,每个开发者都有可能通过智能体实现效率十倍、百倍的提升。AMD将继续携手中国开发者与生态伙伴,共同加速下一波AI创新浪潮。

来源:互联网

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

同类文章推荐

相关文章推荐

更多