其他资讯

AMD AI开发者日深度解析：从GPU堆叠到系统工程的全路径部署指南

2026-05-23

阅读 0

热度 0

作者菜鸟AI编辑部

摘要

AMD开发者大会指出AI正转向推理普及，面临算力与隐私挑战。AMD通过开放生态应对，强调系

AI用起来是方便，智能体也火得一塌糊涂，但真到了要落地的时候，算力成本像个无底洞，数据隐私又成了谁也不敢碰的高压线——这大概就是眼下AI行业最真实的尴尬。

怎么破局？在今年的AMD AI开发者大会上，AMD董事会主席及首席执行官苏姿丰博士（Dr. Lisa Su）给出了他们的答案。她认为，AI应该无处不在，服务于每一个人、每一种工作负载和每一种设备形态。而AMD的使命，不仅是提供高性能计算，更是通过开放的软硬件生态，赋能开发者应对智能时代的算力挑战。

算力拐点已至：从“堆GPU”到“系统工程”

眼下，AI正处在一个关键拐点：从以训练为主导，转向推理的全面普及。智能体AI的崛起，让计算需求从简单的“一问一答”，演变成了“多步、多调用、多智能体”的复杂协作。这一转变对算力提出了全新要求：光有强大的GPU已经不够了，更需要系统级的协同、高带宽大容量的统一内存，以及一张覆盖从端到云的完整计算谱系。

挑战有多严峻？AMD高级副总裁、计算与图形总经理Jack Huynh用一组数据揭示了现状：到2030年，全球预计将有50亿人使用AI。Token需求正呈指数级飙升，仅OpenRouter一个平台，从2025年2月到2026年初，处理的Token数量就从2万亿猛增到42万亿。而中国市场的消耗量更为惊人，每天达140万亿Token，两年内增长超过100倍。

算力，早已不是唯一的约束条件了。Jack Huynh进一步指出，计算对预填充固然重要，但内存在今天扮演的角色比过去关键得多。内存大小，直接决定了你能在上下文中运行多大的模型；而内存带宽，则决定了解码速度的快慢。这一洞察，正是AMD推出锐龙AI Max+系列处理器的核心逻辑所在。

对此，AMD高级副总裁、大中华区总裁潘晓明在大会欢迎辞中也有深刻阐述。他认为，中国正走在全球AI发展的最前沿。而AMD的策略，是通过覆盖云、边、端的计算产品组合，加上开源的ROCm软件平台，为开发者提供开放的全栈式AI算力支持；同时不断优化开发环境与工具链，助力创意从孵化到落地；并通过开发者社区与校园计划，积极推动人才培养和生态共建。

锐龙AI Max+系列：重新定义智能体主机

为了应对本地化、低延迟、高隐私的AI推理需求，AMD率先提出了“智能体主机”这一新概念，并推出了锐龙AI Max+系列处理器。该系列最高支持128GB的统一内存，其中96GB可作为GPU专属显存，能够原生运行高达2000亿参数的本地大模型，例如Qwen 3.5 122B、阶跃星辰Step 3.5等。

零一万物创始人兼CEO李开复博士在与苏姿丰的对话中，点明了智能体经济的本质其实是推理经济：一个用户查询可能会“扇出”触发多个智能体调用，再汇聚、再扇出。这就要求处理必须本地优先、设备端完成，且延迟需低于100毫秒。他特别强调，AMD的统一内存架构和本地化算力，为企业提供了安全、可控、高效的AI部署新范式。

Jack Huynh在现场演示中印证了这一点：我们可以在单一设备中完整运行整个模型，无需分片，也无需卸载到云端。锐龙AI Max系列将成为AI开发最智能、成本最高效的选择。目前，惠普、华硕、联想、宏碁及众多本地创新品牌，已推出超过35款基于该系列处理器的产品，涵盖一体机、笔记本、Mini AI工作站等多种形态。

阶跃星辰联合创始人兼CTO朱亦博博士也在大会上展示了其Step 3.5模型在AMD平台上的表现。他表示，在AMD笔记本电脑上实现了近每秒100个Token的解码速度，这甚至比许多云端模型的API还要快。这意味着，开发者可以在本地以极低的成本运行2000亿参数的模型，这彻底改变了AI应用的开发与部署方式。

ROCm软件栈：打通AI部署的全路径

硬件是基础，软件则是灵魂。AMD正通过开放的ROCm软件栈，构建一个从笔记本到数据中心的统一开发平台。ROCm支持所有AMD GPU，真正实现了“一次编写，全路径运行”，极大提升了开发、测试、微调和部署的效率。

AMD AI软件负责人Nick Ni在演讲中，介绍了ROCm的三大战略支柱：首先是开源，所有主流框架都已原生支持AMD GPU；其次是抽象化，开发者无需深入GPU底层架构即可获得高性能；最后是AI辅助开发，团队已经利用AI智能体来自动生成GPU内核、识别性能差距、并优化基准测试。

Nick Ni特别提到，ROCm目前已支持超过300万个模型开箱即用，并在PyTorch等框架中实现了零代码改动即可运行。他分享了一个有趣的细节：我们的工程师从每周提交几个PR（Pull Request），发展到如今每天提交多个PR，这背后正是AI智能体在发挥作用。

此外，AMD还宣布在中国推出首个面向AI开发者的免费Radeon GPU开发者云，并与阿里云魔搭社区（ModelScope）合作，使得AMD GPU可以直接在魔搭Studio中使用。Nick Ni表示，我们听到了开发者的声音，他们需要便捷地访问云端AMD GPU资源。今天，这个免费的云服务正式推出，开发者扫码即可注册使用。

深耕中国：开放生态与人才培养的双向奔赴

当前，全球AI发展已驶入快车道，而中国更是走在了世界前列。这里不仅汇聚了顶尖的AI人才，创新企业也如雨后春笋般涌现。

潘晓明表示，AMD选择将北美之外唯一一场AI开发者日放在上海，正是为了与中国顶尖的AI人才和生态伙伴进行深度交流。他进一步阐述了AMD将从“开放、构建、创新、连接”四个维度来赋能开发者的具体路径。

苏姿丰博士同样强调：中国拥有全球最具活力的AI生态系统。AMD在华已有超过30年的历史，上海研发中心是AMD全球最大的研发中心之一，深度参与芯片设计、系统开发以及AI软件生态建设。AMD致力于与中国云厂商、基础模型公司、开源社区携手，共同推动开放创新。

为了赋能本地开发者，AMD推出了一系列专属项目：包括基于Radeon GPU的免费开发者云、与阿里云魔搭社区的合作、通过微信提供专属技术支持、AI学院课程、积分奖励等。AMD还发布了“AI开发手册”（AI Playbooks），覆盖本地推理、微调、视频生成等主流工作负载，支持Windows和Linux系统，旨在帮助开发者从零开始快速上手。

在大会的“作品说话”开发者分论坛上，多位本土开发者展示了基于AMD平台的端侧智能体应用，从多智能体协作到机器人控制，从Vibe Coding到OpenClaw，充分展现了在开放生态下迸发的创新活力。

2026年，恰逢AMD上海研发中心成立二十周年。二十年来，该中心已从最初的芯片设计支持部门，成长为覆盖全栈技术能力的全球研发支柱。站在新的起点上，上海研发中心将继续聚焦高性能计算与人工智能的前沿布局，强化全球协同与本地赋能，为下一代智能计算贡献“芯”力量。

写在最后：共同加速下一波AI创新浪潮

面对AI时代带来的算力挑战，AMD正在通过端到端的AI算力方案、统一的ROCm软件平台，以及深耕中国的生态投入，试图为开发者打造一个从创意到落地的完整闭环。这场首次登陆中国的AMD AI开发者大会，不仅是一次技术的集中展示，更是一次关于开放与协作的深刻实践。

正如苏姿丰博士在大会上所言，我们仍处在AI发展的早期阶段。未来，每个开发者都有可能通过智能体实现效率十倍、百倍的提升。AMD将继续携手中国开发者与生态伙伴，共同加速下一波AI创新浪潮。

来源：互联网

上一篇 2026家用咖啡机TOP5测评：咖博士H3凭商用级性能登顶精选榜单 下一篇 2026年轻薄本视频剪辑测评：5款超薄本便携性能权威榜单

免责声明

本网站新闻资讯均来自公开渠道，力求准确但不保证绝对无误，内容观点仅代表作者本人，与本站无关。若涉及侵权，请联系我们处理。本站保留对声明的修改权，最终解释权归本站所有。