Cerebras背靠OpenAI上市暴涨51%挑战英伟达算力霸权
摘要
Cerebras上市首日大涨51%,市值突破602亿美元,募资55 5亿美元。其晶圆级引擎WSE-3在AI推理任
图片来源: Cerebras Systems 官方产品照片
“AI算力变天?”
纽约/旧金山,2026年5月16日。当地时间5月14日,AI芯片领域的一匹“黑马”——Cerebras Systems,正式在纳斯达克挂牌交易,股票代码CBRS。上市首日盘中一度暴涨108%触发熔断,收盘涨幅虽回落至68%,但截至5月16日收盘,股价仍较185美元的发行价大涨51%,市值一举突破602亿美元。这不仅是2026年全球最大规模的IPO,募资额高达55.5亿美元,更打破了自Uber以来美国科技行业的IPO纪录。
这家以“晶圆级引擎”技术著称的芯片公司,凭借与OpenAI一份价值超200亿美元的战略合作协议,正沿着一条独特的技术路线,向英伟达盘踞长达十年的AI算力霸主地位发起正面挑战。整个科技产业,也因此开始重新审视AI基础设施的未来。
01 二十倍超额认购,定价屡创新高
Cerebras的IPO之路,可以说是一场现象级的资本狂欢。最初发行价区间定在115-125美元,但市场需求太过火爆,又上调至150-160美元。最终,定价直接锁定在185美元,较上调后的区间上限还高出16%。据承销商透露,这次IPO获得了超过20倍的超额认购,主权财富基金、对冲基金和科技巨头悉数入场。
“这不仅仅是一次IPO,更像是市场对AI算力架构变革的一次集体投票。”摩根士丹利科技行业分析师Michael Ng对此评价道,“Cerebras的估值,已经不能用传统芯片公司的标尺来衡量,投资者真正押注的,是它在AI推理领域的碘伏性潜力。”
55.5亿美元的募资规模,如果承销商行使超额配售权,总额将触及6.38亿美元。这个数字,不仅远超2025年芯片行业最大的IPO——Arm的51亿美元,也让Cerebras成为继Snowflake(2020年)之后,美国科技行业最大的IPO案例。一个值得注意的细节是,Cerebras目前仍处于亏损状态——2025年营收约5.1亿美元,净亏损却达12亿美元。但显然,资本市场更看重它的增长故事:自2026年1月与OpenAI正式牵手以来,公司订单量暴增370%,2026年第一季度营收同比增长215%。
02 晶圆级引擎,重新定义AI计算
Cerebras的看家本领,是它独创的Wafer Scale Engine(WSE)晶圆级引擎技术。这与英伟达惯用的多GPU集群方案,完全是两条截然不同的技术路径。传统GPU芯片只是晶圆上切割出的一小部分,而Cerebras直接将整个12英寸晶圆做成了一颗单一芯片——面积相当于约56个传统GPU,集成了1.2万亿个晶体管,片上内存高达188GB,带宽达到惊人的24PB/s。
“这不只是把芯片尺寸放大那么简单,这是计算架构的一次革命。”Cerebras首席技术官Sean Lie解释道,“传统GPU集群要靠网络来传输数据,但我们的WSE-3芯片,把所有计算和存储都集成在单一晶圆上,数据移动的瓶颈被彻底消除,这才是实现超低延迟推理的关键。”

图片来源:《Cerebras WSE-3 vs Nvidia H100/H200/B200: 详细技术对比 —— 谁才是 AI 时代真正的 “芯片之王“》
实测数据很有说服力。在AI推理任务上,Cerebras的CS-3系统展现出压倒性优势:
- 在Llama 3.3 70B模型推理中,CS-3速度达到2140 tokens/秒,而英伟达旗舰DGX B200仅为120 tokens/秒——快了整整18倍。
- 在GPT-OSS-120B模型上,CS-3实现了3000 tokens/秒的推理速度,是GPU方案的15倍。
- 总体拥有成本(TCO)比DGX B200低32%,功耗还降低了33%。
这种性能优势,在实时应用场景里尤为关键。比如在OpenAI的Codex-Spark代码生成服务中,基于Cerebras算力的版本能做到“打字即响应”,延迟从GPU方案的数百毫秒直接降至数十毫秒,开发者的工作效率因此提升了40%以上。
03 OpenAI 200亿美元押注,重塑算力格局
Cerebras敢于正面挑战英伟达,底气很大一部分来自OpenAI。2026年1月,双方达成了一项里程碑式的合作协议:OpenAI承诺在未来数年内支付超过200亿美元,采购Cerebras约750兆瓦的AI算力容量,并联合进行AI模型与硬件的协同设计。此外,OpenAI还向Cerebras提供了10亿美元的营运资金贷款,用于支持其算力基础设施建设。
“这不是简单的供应商关系,而是战略级的技术协同。”OpenAI基础设施副总裁Sachin Katti如此定义这次合作,“Cerebras为我们提供了专用的低延迟推理解决方案,这意味着更快的响应速度、更自然的交互体验,以及一个能把实时AI扩展到更多用户的坚实基础。”这项合作直指AI产业的“推理瓶颈”。当大模型参数突破万亿级别,推理成本已经占到AI总支出的60%以上,成为制约应用普及的关键因素。OpenAI的ChatGPT目前周活跃用户已超9亿,推理成本巨大,而Cerebras的技术能够将每token成本降低32%,同时延迟降低90%以上。
具体部署分三个阶段推进:2026年下半年开始,Cerebras为OpenAI提供首批150兆瓦算力,主要用于Codex系列产品;2027年扩展至400兆瓦,支持GPT-5系列的实时推理;2028年全面部署750兆瓦,覆盖OpenAI所有核心服务。这将是全球最大规模的高速AI推理部署,足以支撑每秒处理超过10亿个token的请求量。
04 差异化竞争,撕开垄断裂缝
Cerebras的崛起,恰好发生在AI算力市场格局剧变的关键节点。长期以来,英伟达凭借CUDA软件生态和高性能GPU,牢牢占据AI训练市场90%、推理市场80%的份额,2026财年营收达2159亿美元,是Cerebras的423倍。但Cerebras没有选择正面硬碰硬,而是通过差异化定位寻找突破口。
“我们不是要取代英伟达,而是要填补市场空白。”Cerebras首席执行官Andrew Feldman说得直白,“英伟达在训练和通用计算领域的优势无可替代,但在超大规模、低延迟推理这个场景,我们的技术路线更具优势。”这套差异化战略已经开始见效。除OpenAI之外,Cerebras还与AWS达成了战略合作,为其提供专用推理算力;和Core42(原G42)合作部署了OpenAI的GPT-OSS-120B模型,为企业客户提供每秒3000 tokens的推理服务。在金融、医疗这些对实时性要求极高的行业,Cerebras的解决方案已经开始替代部分GPU集群。
举个例子,摩根大通采用Cerebras系统处理高频交易数据,风险评估的响应时间从2秒缩短到0.1秒,同时算力成本降低了40%;梅奥诊所利用Cerebras加速医学影像分析,AI辅助诊断的周转时间从4小时缩短到15分钟,紧急病例的救治效率显著提升。
05 生态构建与产能爬坡
不过,市场前景虽然广阔,Cerebras面临的挑战也不小。最核心的问题还是软件生态——英伟达的CUDA平台已经积累了15年,拥有90%的AI开发者用户基础,而Cerebras的软件开发工具链还在完善中。此外,晶圆级芯片的生产良率和供应链稳定性,也是长期需要啃的硬骨头。
“生态系统是英伟达最坚固的护城河。”SemiAnalysis分析师Myron Xie指出,“Cerebras需要吸引更多开发者为其平台优化模型,这既需要时间,也需要持续投入。”产能方面,Cerebras目前依赖台积电的先进工艺,而晶圆级芯片的生产难度远超传统GPU,良率控制是关键。据行业消息,Cerebras WSE-3的良率已从早期的30%提升到75%,但离传统芯片90%以上的水平还有差距。
面对这些挑战,Cerebras正在加速构建自己的生态系统。近期推出了Model Zoo计划,提供100多个主流大模型的WSE优化版本;同时与Hugging Face合作,简化模型迁移流程。按照规划,Cerebras还计划在2027年推出WSE-4芯片,集成2.4万亿个晶体管,性能将再翻一倍。

图片来源:Cerebras Systems 公司纳斯达克上市敲钟仪式
Cerebras上市大涨51%,不仅代表着资本市场对一家芯片公司的认可,更是对整个AI算力新范式的集体押注。在OpenAI等巨头的推动下,AI产业正从“追求参数规模”转向“追求实时体验”,而Cerebras的晶圆级技术恰好踩在了这个趋势的节拍上。“AI的下一个十年将由推理速度决定。”Andrew Feldman在敲钟仪式上说,“我们与OpenAI的合作只是一个开始,未来会有更多企业意识到低延迟推理的价值,这将彻底重塑整个AI算力市场格局。”
对英伟达来说,Cerebras的崛起并不等于末日,反倒更像一剂加速创新的催化剂。据悉,英伟达已经在开发针对推理优化的专用芯片,预计2027年推出的GB200 NVL将重点提升单芯片推理性能。不管最终的竞争格局如何演变,Cerebras的上市都标志着AI芯片行业正在进入一个多元化时代,这对于整个AI产业的健康发展,无疑是一件好事。算力成本在降低,性能在提升,AI技术也必将更快地渗透到各行各业,真正朝着“普惠AI”的愿景迈进。
来源:互联网
本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。