其他资讯

微软自研Maia 200芯片全面深度评测：性能与功耗解析

2026-05-28

阅读 0

热度 0

作者菜鸟AI编辑部

摘要

微软力推自研AI芯片 "迈亚200 "，剑指大模型推理成本优化微软近期正式宣布全面推广自研

### 微软力推自研AI芯片"迈亚200"，剑指大模型推理成本优化微软近期正式宣布全面推广自研AI芯片"迈亚200"（Maia 200），核心目标锁定在大模型推理场景的成本压降。一组实测数据说明问题：在典型GPT-4级别推理任务中，Maia 200的单位算力成本较英伟达A100 GPU降低约15%，比H100 GPU降低10%。成本优势根源于芯片架构对推理场景的深度定制——内存带宽提升20%，功耗下降12%，每瓦算力输出效率显著提升。微软力推自研Maia 200芯片

台积电3纳米工艺支撑了单芯片超过1400亿个晶体管的集成，原生FP8/FP4张量核心成为标配。内存子系统配备216GB HBM3e高带宽内存，读写速度达7TB/s，加上272MB片上SRAM与专用DMA引擎，整体数据传输架构保障海量参数的高效流转。在750W SoC热设计功耗范围内，Maia 200提供超过10 PetaFLOPS的FP4性能和超过5 PetaFLOPS的FP8性能。微软云与AI业务负责人Scott Guthrie称其为"所有超大规模云服务商中性能最强的自研芯片"，FP4性能是亚马逊第三代Trainium的三倍，FP8性能超越谷歌第七代TPU。换算为经济指标，每美元性能比当前部署的最新硬件提升30%。目前Maia 200已在微软多项内部服务中运行，包括Bing Chat、Copilot、Microsoft 365 Copilot和Microsoft Foundry，运行稳定率高达99.9%。芯片部署选址在美国中部数据中心区域（爱荷华州德梅因附近），后续扩展至美国西部3区（亚利桑那州菲尼克斯附近）及更多区域。 Azure方面披露，2025年其AI服务成本中GPU采购与运维占比超过45%，Maia 200的部署有望将该比例压缩至30%以内。微软计划2026年内向部分头部企业客户开放Maia 200的云服务接入权限，首批覆盖金融、医疗等对推理成本高度敏感的行业。客户无需修改现有模型代码即可快速部署，部署时间缩短约30%。为协助开发者充分挖掘新硬件性能，微软于5月21日同步开放Maia SDK预览版，包含PyTorch集成、Triton编译器、优化内核库以及Maia底层编程语言访问权限，支持开发者在代码生命周期早期阶段即展开效率优化。微软CEO纳德拉明确表示，公司坚持"自研+外购"双轨策略，将继续向英伟达和AMD采购芯片，维持与两家厂商的紧密合作。Maia 200并非替代英伟达，而是在推理这一AI成本占比最高的环节——麦肯锡报告指出推理成本占企业AI总支出60%以上——构建自主可控的算力底座。据The Information报道，Anthropic正与微软谈判，计划租用Maia 200芯片驱动的服务器，为旗下Claude模型获取更多算力以应对快速增长的需求。若谈判成功，微软将获得首个重量级外部客户，助力其在自研芯片领域追赶谷歌与亚马逊。英伟达亦未停滞。据《华尔街日报》报道，其计划在6月GTC大会上发布新一代推理GPU，针对性优化云服务商成本与功耗；AMD的MI300X芯片也在积极拓展云服务市场，与Maia 200形成直接竞争。AI芯片自主化已成为云服务商提升竞争力的核心策略，Maia 200的推出将进一步加速这一格局演变。

来源：互联网

上一篇 智谱清影儿童简笔画逐笔教学视频教程 下一篇 通义万象猫咪各国传统服饰风格教程

免责声明

本网站新闻资讯均来自公开渠道，力求准确但不保证绝对无误，内容观点仅代表作者本人，与本站无关。若涉及侵权，请联系我们处理。本站保留对声明的修改权，最终解释权归本站所有。

微软自研Maia 200芯片全面深度评测：性能与功耗解析

摘要

相关文章推荐