其他资讯
微软自研Maia 200芯片全面深度评测:性能与功耗解析
摘要
微软力推自研AI芯片 "迈亚200 ",剑指大模型推理成本优化 微软近期正式宣布全面推广自研
### 微软力推自研AI芯片"迈亚200",剑指大模型推理成本优化
微软近期正式宣布全面推广自研AI芯片"迈亚200"(Maia 200),核心目标锁定在大模型推理场景的成本压降。一组实测数据说明问题:在典型GPT-4级别推理任务中,Maia 200的单位算力成本较英伟达A100 GPU降低约15%,比H100 GPU降低10%。成本优势根源于芯片架构对推理场景的深度定制——内存带宽提升20%,功耗下降12%,每瓦算力输出效率显著提升。
台积电3纳米工艺支撑了单芯片超过1400亿个晶体管的集成,原生FP8/FP4张量核心成为标配。内存子系统配备216GB HBM3e高带宽内存,读写速度达7TB/s,加上272MB片上SRAM与专用DMA引擎,整体数据传输架构保障海量参数的高效流转。
在750W SoC热设计功耗范围内,Maia 200提供超过10 PetaFLOPS的FP4性能和超过5 PetaFLOPS的FP8性能。微软云与AI业务负责人Scott Guthrie称其为"所有超大规模云服务商中性能最强的自研芯片",FP4性能是亚马逊第三代Trainium的三倍,FP8性能超越谷歌第七代TPU。换算为经济指标,每美元性能比当前部署的最新硬件提升30%。
目前Maia 200已在微软多项内部服务中运行,包括Bing Chat、Copilot、Microsoft 365 Copilot和Microsoft Foundry,运行稳定率高达99.9%。芯片部署选址在美国中部数据中心区域(爱荷华州德梅因附近),后续扩展至美国西部3区(亚利桑那州菲尼克斯附近)及更多区域。
Azure方面披露,2025年其AI服务成本中GPU采购与运维占比超过45%,Maia 200的部署有望将该比例压缩至30%以内。微软计划2026年内向部分头部企业客户开放Maia 200的云服务接入权限,首批覆盖金融、医疗等对推理成本高度敏感的行业。客户无需修改现有模型代码即可快速部署,部署时间缩短约30%。
为协助开发者充分挖掘新硬件性能,微软于5月21日同步开放Maia SDK预览版,包含PyTorch集成、Triton编译器、优化内核库以及Maia底层编程语言访问权限,支持开发者在代码生命周期早期阶段即展开效率优化。
微软CEO纳德拉明确表示,公司坚持"自研+外购"双轨策略,将继续向英伟达和AMD采购芯片,维持与两家厂商的紧密合作。Maia 200并非替代英伟达,而是在推理这一AI成本占比最高的环节——麦肯锡报告指出推理成本占企业AI总支出60%以上——构建自主可控的算力底座。
据The Information报道,Anthropic正与微软谈判,计划租用Maia 200芯片驱动的服务器,为旗下Claude模型获取更多算力以应对快速增长的需求。若谈判成功,微软将获得首个重量级外部客户,助力其在自研芯片领域追赶谷歌与亚马逊。
英伟达亦未停滞。据《华尔街日报》报道,其计划在6月GTC大会上发布新一代推理GPU,针对性优化云服务商成本与功耗;AMD的MI300X芯片也在积极拓展云服务市场,与Maia 200形成直接竞争。AI芯片自主化已成为云服务商提升竞争力的核心策略,Maia 200的推出将进一步加速这一格局演变。
台积电3纳米工艺支撑了单芯片超过1400亿个晶体管的集成,原生FP8/FP4张量核心成为标配。内存子系统配备216GB HBM3e高带宽内存,读写速度达7TB/s,加上272MB片上SRAM与专用DMA引擎,整体数据传输架构保障海量参数的高效流转。
在750W SoC热设计功耗范围内,Maia 200提供超过10 PetaFLOPS的FP4性能和超过5 PetaFLOPS的FP8性能。微软云与AI业务负责人Scott Guthrie称其为"所有超大规模云服务商中性能最强的自研芯片",FP4性能是亚马逊第三代Trainium的三倍,FP8性能超越谷歌第七代TPU。换算为经济指标,每美元性能比当前部署的最新硬件提升30%。
目前Maia 200已在微软多项内部服务中运行,包括Bing Chat、Copilot、Microsoft 365 Copilot和Microsoft Foundry,运行稳定率高达99.9%。芯片部署选址在美国中部数据中心区域(爱荷华州德梅因附近),后续扩展至美国西部3区(亚利桑那州菲尼克斯附近)及更多区域。
Azure方面披露,2025年其AI服务成本中GPU采购与运维占比超过45%,Maia 200的部署有望将该比例压缩至30%以内。微软计划2026年内向部分头部企业客户开放Maia 200的云服务接入权限,首批覆盖金融、医疗等对推理成本高度敏感的行业。客户无需修改现有模型代码即可快速部署,部署时间缩短约30%。
为协助开发者充分挖掘新硬件性能,微软于5月21日同步开放Maia SDK预览版,包含PyTorch集成、Triton编译器、优化内核库以及Maia底层编程语言访问权限,支持开发者在代码生命周期早期阶段即展开效率优化。
微软CEO纳德拉明确表示,公司坚持"自研+外购"双轨策略,将继续向英伟达和AMD采购芯片,维持与两家厂商的紧密合作。Maia 200并非替代英伟达,而是在推理这一AI成本占比最高的环节——麦肯锡报告指出推理成本占企业AI总支出60%以上——构建自主可控的算力底座。
据The Information报道,Anthropic正与微软谈判,计划租用Maia 200芯片驱动的服务器,为旗下Claude模型获取更多算力以应对快速增长的需求。若谈判成功,微软将获得首个重量级外部客户,助力其在自研芯片领域追赶谷歌与亚马逊。
英伟达亦未停滞。据《华尔街日报》报道,其计划在6月GTC大会上发布新一代推理GPU,针对性优化云服务商成本与功耗;AMD的MI300X芯片也在积极拓展云服务市场,与Maia 200形成直接竞争。AI芯片自主化已成为云服务商提升竞争力的核心策略,Maia 200的推出将进一步加速这一格局演变。 来源:互联网
免责声明
本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。