产业资讯
综合资讯
2025年AI超连接光子计算最新深度测评与光通信技术排行榜精选
摘要
AI时代网络高速互联成为算力释放的关键瓶颈,CPO(共封装光学)技术通过将光引擎与交换
自22年底ChatGPT横空出世以来,从算力(GPU)、存力(存储)到指挥调度力(CPU),AI已经催生了一个又一个半导体领域的超级产业机会,也孵化出一个又一个万亿美金市值的巨头公司。
如果说在AI基础设施中,还有一个板块尚未诞生出下一个万亿市值“待爆者”的话,海豚君接下来最看好的,就是AI时代的“超级连接”。打个比方:**算力决定了AI的“智商”,存力决定了AI的“记忆力”,而运力要解决的,则是如何让这些长、短期记忆以“坐上火箭般的速度”高速出入大脑中枢。**
用AI教*父黄仁勋的话来说,随着算力和内存瓶颈逐步缓解,而能源问题又是一个十年级的持续难题,那么下一个核心卡点,就是AI时代**网络的高速互联**。原因很简单,传统云时代的网络基础设施,完全无法匹配Agentic AI时代下,数万亿模型参数、混合专家(MoE)、局部激活等机制对网络带宽的苛刻需求。
接下来,我们顺着AI网络传输速度提升的脉络,聚焦一个正在逐步切换的光电传输技术方向——**CPO**,来深入探讨一下AI时代的网络传输。海豚君对CPO的分析将围绕以下几个核心问题展开:
**一、什么是CPO?它真的能替代传统的铜连接吗?**
**二、它又能否完全替代当前主流的可插拔光模块?**
**三、在此趋势下,产业链上下游公司的竞争格局又将如何演变?**
在本篇文章中,我们先对产业链的基本问题做一个系统梳理。
## 01 什么是CPO?
在传统数据中心架构中,有一个重要部件叫“光模块”。它的作用就像一座“桥梁”和“翻译官”:把光纤传来的光信号转换成电信号交给数据中心,或者把数据中心产生的电信号转换成光信号送进光纤。
从功能上看,CPO(共封装光学)架构同样包含了传统光模块的功能,但有两个显著的不同点:
**1、结构不同**
传统光模块是可插拔的,外观上有点像家里网线端口的水晶头。而CPO则完全不同——它将负责光电转换的光引擎,和芯片(这里主要是指教换机的ASIC芯片)直接集成在同一封装基板或中介层上。
**2、应用场景不同**
光模块通常用于机柜之间(即Scale-out)的连接;而CPO既能用于机柜之间,也能用于机柜内部(Scale-up)。用于机柜间时,它替代的是传统光模块;用于机柜内时,它替代的则是目前主流的铜连接。
**图:传统可插拔模式与CPO方案示意**

资料来源:GTC 2025,Dolphin Research
可以看到,近期无论是英伟达还是博通,都在积极推动其CPO交换机方案。
那么,CPO技术为何如此受重视?核心原因在于:数据中心对算力的需求持续飙升,数据传输带宽需求呈爆发式增长,数据中心正朝着超大规模算力集群的方向演进。在此过程中,传统数据传输技术面临诸多瓶颈:
**1、带宽瓶颈**
对于机柜间场景,传统交换机面板空间有限,而可插拔光模块的尺寸又难以缩小,导致单台交换机能够提供的端口数受限,无法支撑越来越高的带宽需求。目前可插拔模块最高支持单模块1.6Tbps带宽,单个交换机面板最多可支持51.2Tbps带宽。未来即使推出3.2Tbps模块,交换机最高也只能支持102.4Tbps——这几乎已触及可插拔光模块的物理极限。
**2、信号完整性瓶颈**
在机柜内场景,随着传输速率提升,传统铜缆面临严重的信号衰减和失真问题,传输距离也越来越受限。目前铜缆最高可支持1.8TB/s带宽(比如英伟达的NVLink铜缆),且距离被严格限制在2米以内。但单GPU对带宽的需求正在向3.6TB/s迈进。
**3、散热和功耗瓶颈**
传输速率提高后,传统通信链路的功耗大幅上升,散热也变得越来越棘手。目前美国数据中心建设正面临巨大的能源障碍,功耗问题带来的成本压力不容小觑。
CPO理论上可以有效解决上述问题。据英伟达的数据,采用CPO后,功率效率可以提升3.5倍。
## 02 具体而言,数据中心的数据传输场景有哪些?
接下来,我们拆解一下数据中心在不同场景和不同环节中的数据传输技术路线。
**图:Scale-out和Scale-up示例**

资料来源:NADDOD,Dolphin Research
**1、Scale-up,主要涉及机柜内互联**
这部分主要涉及机柜内部,尤其是服务器内部的硬件互连,包括CPU、GPU、网卡、DDR内存以及硬盘之间的连接。目前,这部分连接主要以铜为介质,包括连接CPU、GPU和网卡的PCIe插槽、内存插槽(PCB铜走线)、SATA线等各类铜缆。而CPO有可能碘伏这一主流方案。
**2、Scale-out,主要涉及机柜间互联**
这部分主要涉及机柜或服务器与交换机之间的连接。这类连接需要以光作为传输介质,目前主要以光纤和可插拔光模块为主。同样,CPO是重要的发展趋势,且相比机柜内场景,进展速度更快。
3、再往上,还有数据中心之间以及数据中心与外部的互连,但这部分不是本文的重点。

从巨头的布局来看,CPO现阶段主要面向机柜间场景,但未来很可能向机柜内场景延伸。
## 03 CPO目前仍处于初步推广阶段,面临哪些主要瓶颈?
**1、先进封装技术的成熟度**
从底层技术来看,CPO与传统可插拔光模块方案截然不同。传统光电子零部件的生产工艺与广义的光电子元器件及模组相差不大,但CPO需要将光引擎封装到基板或中介层,其核心依赖的是**先进封装技术,如CoWoS**。
更关键的是,CPO不仅要集成电子集成电路,还要集成光子集成电路。这种异质集成需要通过台积电的COUPE等专用技术进行混合键合。问题在于,这些先进封装技术工艺难度极大。无论是英伟达还是博通,都高度依赖台积电的产能,而产能本身是有限的。此外,所需的光耦设备、混合键合设备、测试设备,以及ABF基板等材料的供应,也可能成为障碍。
而且,现阶段这些先进封装技术,特别是异质集成,生产良率还有很大的提升空间,导致成本远高于可插拔方案。台积电正在努力提升先进封装良率,但这需要时间。
**2、检修与维护问题**
传统可插拔方案的好处是“可插拔”,检修和维护非常方便。但CPO完全不同——它的光电模块与基板、中介层甚至芯片直接封装在一起,检修和维护的难度显著增大。
当然,这些问题也有解决思路,比如从设计上提高容错率,或在运营层面布局一定的冗余。
**3、热管理问题**
光引擎与芯片进行高密度封装,运行时会导致局部升温明显,甚至可能超过激光器的耐受极限。因此,热管理是一个大问题。需要引入更高效的散热方案,但这又会涉及成本。
**4、标准化问题**
目前,英伟达、博通等厂商为了抢占市场先机,都在积极推出自己完整且独立的CPO交换机方案。但与此同时,行业标准(包括接口标准、封装标准等)尚未形成。没有统一标准,上下游企业就难以协同研发、生产和配置,这无疑是商业化推广的一大难点。
总体来看,以上问题都有对应的解决方案,但关键是依赖技术的成熟和标准的制定,而这一切都需要时间。
另一方面,从根本上说,CPO必须在综合成本上形成优势。这就引出一个问题:无论哪种方案,成本始终是核心考量。除了CPO,还有哪些更激进或更保守的技术路线在推进?它们之间又是什么关系?我们先来区分一下不同技术路线的差异。
## 04 技术路线比较
**1、CPO**
CPO,即共封装光学(Co-Packaged Optics),如上文所述,是指将光引擎和芯片封装在同一基板上。这里的芯片可以是交换芯片(ASIC),也可以是GPU等计算芯片,但通常指的是交换芯片。
**2、NPO**
NPO是近封装光学(Near-Packaged Optics),比CPO初级一些。它并没有做到封装在同一基板甚至中介层这样的尺度,而是封装在同一块PCB母板上。国内包括阿里、华&为等企业在推动NPO方案。这更多可以看作是在缺乏先进封装产能情况下的一种妥协方案,但可能在一段时间内会成为中国市场的主流。这在一定程度上会影响英伟达方案在中国的渗透。
**图:不同集成方式展示(从上到下分别为:可插拔方式、NPO、CPO集成在封装基板、CPO集成在中介层,以及后面要说的OIO)**

资料来源:ASE,Dolphin Research
**3、OIO**
OIO(Optical I/O)可以看作是CPO的进阶版。这里不再涉及交换芯片,主要与计算芯片相关,指的是将光引擎与计算芯片封装在一起,甚至直接在芯片层面上结合。它面向的完全是机柜内场景。
**图:不同集成方式展示:可插拔、CPO、OIO**

资料来源:台积电,Openlight,Dolphin Research
**到这里,我们再来明确一下数据中心的架构:**
数据中心可以看作是以下几个部分互相连接:
- **服务器**:专注于计算任务,内部装载GPU、CPU等计算芯片,以及内存、硬盘等。
- **交换机**:负责服务器之间以及服务器向外部的网络通信,通过ASIC芯片实现数据交换。
- **存储系统**:在目前主流数据中心架构中,存储器主要分散布置在服务器节点内部,与服务器结合在一起。
基于上述架构,我们就能想象CPO的应用场景。在此基础上,讨论一个问题:**为什么CPO率先从交换芯片开始?**
用个类比:交换机可以看作是数据中心内部的立交桥。可以想象,交换机所承担的数据传输带宽压力、端口密度,以及随之而来的功耗瓶颈是最大的,因此对CPO的需求也最为迫切。
**4、CPC**
CPC,即共封装铜互联(Co-Packaged Copper),是指把高速铜连接器直接集成在封装基板上。这种技术路线的成本优势非常明显,但仍然无法解决铜介质的带宽瓶颈和衰减问题,所以应用场景比较受限。它可以部分应用于机柜内部的GPU/CPU节点与交换机及存储芯片之间的连接。目前英伟达的机柜内方案仍采用铜连接,但未来很可能向光互连切换。
**5、LPO**
LPO,即线性驱动可插拔光学(Linear-Drive Pluggable Optics),是一种瘦身版的可插拔光学方案。它通过去除**内部的DSP/CDR芯片**,仅保留并强化模拟芯片Driver和TIA,实现信号直驱。说白了,就是直接在光模块中踢掉功耗大的DSP芯片,放弃信号纠错;同时强化模拟芯片,无论信号准确与否,通过模拟放大,直接让交换机ASIC的电信号冲进来驱动激光器。
**图:传统模式与LPO结构对比示意**


资料来源:Bryon Moyer,Semiconductor Engineering,Dolphin Research
但这里同样存在问题:PCB走线并没有省略(会导致信号衰减),同时对信号质量要求又更高,因此长距离传输仍然受限。当速率迈向更高维度(1.6T以上)时,信号完整性问题会格外凸显。也就是说,简化结构的同时,性能上也会有所牺牲。

综合来看,尽管存在NPO、CPC、LPO这些折中路线,但随着数据中心向更高速率、更大集群发展,这些折中方案终将遇到瓶颈。**CPO是未来必须突破的下一代方案。**
**6、光电路交换机(OCS)会威胁CPO吗?**
谈到这个,OCS(Optical Circuit Switch)是绕不开的话题。OCS的核心特点是全程没有光电转换,通过光开关矩阵,直接在光域内建立物理光路。
**图:OCS示意**

资料来源:Orbray,Dolphin Research
可以直观地想象,它就像由一排排反射镜(微镜阵列)组成,可以根据指令调整反射镜的角度,向不同方向反射光线。
表面上看起来,OCS直接转发光信号,替代了传统交换机的光电和电光转换过程,似乎有了它就不需要CPO了(至少不需要交换机环节的CPO)。但实际情况并非如此。
**这里梳理一下数据中心中交换机的架构:**
**(1)主板内**:数据中心最核心的计算通过GPU完成。GPU计算完毕后,需要将数据传递给CPU,CPU处理后再传递给网卡(内含ASIC),或者GPU也可以直接传输给网卡。以上环节可以在同一块主板上实现,至少可以在同一台服务器内实现。
**(2)机柜内**:之后,数据要从服务器传递到机柜的交换机上。一个机柜内可以有多台服务器高速互联,但机柜顶部必须有一个交换机,用于与外部通信,交换机柜内外的数据。这个交换机叫做ToR(Top of Rack)交换机。以上环节是在同一机柜内实现的。
**(3)机柜间**:数据中心由多个机柜组成集群,机柜之间的通信如何调度?这就需要Spine交换机发挥作用了。Spine交换机负责管理所有Leaf交换机之间,以及向数据中心外部的高速连接,它是数据中心整个交换机网络的枢纽。
**图:数据中心中Spine交换机和Leaf交换机示意**

资料来源:Bryon Moyer,Semiconductor Engineering,Dolphin Research
**而OCS主要替代的是Spine交换机。**
首先,Spine交换机价格高、功耗大,替代方案的需求最为迫切。其次,OCS的作用是有限的:它只能转发信号(反射光线),就像一面反光镜。但传统交换机的功能更完整,它需要拆解数据包、查看IP地址,然后决定往哪里转。由于OCS只能执行指令,没有判断能力,因此它适合充当Spine交换机,但如果要替代Leaf交换机,就需要新增其他部件来执行“封包处理”功能,比如智能网卡(SmartNIC)。这样一来,架构会变得复杂,不一定是最优方案。
**这样一来,架构就很清晰了:**
虽然现阶段,英伟达推出的Quantum X800-Q3450、博通推出的Tomahawk 6 - Da visson等CPO路线的交换机都是Spine交换机,而Google推动的OCS交换机,替代的也是传统Spine交换机,两者之间确实存在直接竞争关系。但从终局来看,OCS有机会替代Spine交换机,但再往下,对于用量更大的Leaf交换机上光引擎与ASIC芯片之间的电光转换,到服务器内主板与主板之间的连接(通过网卡ASIC或NVSwitch等),再到主板上计算芯片之间、计算芯片与网卡ASIC之间的连接,仍然需要使用CPO。因此,未来两者更多是相辅相成的关系。
## 05 涉及到的产业链环节有哪些?
**(一)首先解析CPO的原理和架构**
CPO可以看作是升级版的光引擎,而光引擎的作用是进行光电转换,主要包括以下几个部分:
**1、光子电路部分**
- 调制器:通过控制光的强弱和相位,把电信号(0/1数字)写入光信号。
- 探测器(PD,光电二极管):把光信号转换成电信号。
- 波导:可以理解为芯片内部印上去的微型光纤。
**2、电子电路部分**
- Driver(驱动器):将交换机或服务器传来的微弱电信号放大,变成能精确控制激光器发光的电信号。Driver的下一个环节就是调制器。
- TIA(跨阻放大器):将PD产生的极其微弱的电信号,放大并转换成可供后续电路处理的电压信号。TIA是PD的下一个环节。
**3、光源,也就是激光器**
调制器本身不能发光,但它能控制光,因此需要一个发光部件与之配合,也就是激光器。
**图:光引擎结构示意**

资料来源:宗泽国等,《400G FR4硅光收发模块的研究》,Dolphin Research
另外还有两个部件:
**4、DSP和CDR**:它们都是用来修复电信号的。DSP补偿电信号的物理损伤,CDR从受损信号中提取精确时钟并重整数据时序。其中DSP芯片通常集成CDR功能。
CPO与LPO有一点类似:它们都将高功耗、高成本、产生延迟的DSP从光引擎中移除。但在CPO方案下,DSP的部分功能集成到了交换ASIC中(而LPO是用模拟芯片放大硬刚的方案)。另外,CPO会将CDR集成到高速SerDes。
那么什么是**高速SerDes**?高速SerDes包括Ser(串行器)和Des(解串器),它们位于ASIC芯片内部,分别负责将芯片内部的并行数据打包成高速串行数据流,或者将高速串行数据流解包还原成多路低速并行数据。
**(二)再看整个CPO产业链涉及哪些环节**
**1、首先是CPO整体**
CPO中的光引擎包含了上述提到的光子电路部分和电子电路部分,然后光引擎与ASIC芯片构成CPO交换机的主体。这里有一个核心问题:谁来做这个CPO?
传统光模块是由光学组件、分立器件等组成的独立模块,可以由专业的生产厂商完整提供,比如我们耳熟能详的中际旭创、新易盛、Coherent。那么CPO呢?显然不可能再由它们来主导了。
我们倾向于认为,CPO下的产业价值走向会是这样的:
- **掌握核心技术的交换厂商和平台商**:比如英伟达、Google、博通、Marvell这类数据中心系统平台方及交换芯片厂商来定义架构和标准,同时销售整套产品。
- **代工厂**:台积电、日月光、Amkor这些Fab厂/封测厂来进行晶圆制造、光电集成和先进封装代工。
- **上游供应商**:Coherent、Lumentum这些器件厂继续进行光电器件的生产和供应。
- **传统光模块厂商**:中际旭创、新易盛等在过渡期内提供NPO、LPO等中间路线,以及基于可维护性考量的折中CPO设计方案,继续提供光引擎模块。
**2、除了CPO的核心光引擎,还有几个组件值得关注**
**(1)激光器**
CPO目前只能集成光电转换部件,直接集成激光器还存在难度,因此仍然需要外置激光器。与此同时,CPO对激光器的功率要求大幅增加(至少增加3-4倍),对应的性能和可靠性要求也大幅提高,因此价值量也会大幅增加。
这里存在技术路线的选择:
- **EML激光器**:传统路线,将激光器和调制器集成在一起,优势是适合200G以上高带宽和长距离通信。这个路线被Lumentum、II-VI(Coherent)、住友等巨头垄断。
- **CW激光器**:新兴路线,它把激光器完全独立出来,在成本和功耗上有优势,也更匹配未来的CPO路线。CW激光器的供应相对灵活,中国的源杰科技、仕佳光子、长光华芯等厂商已实现70mW/100mW产品的量产,并获得大额订单。
**图:EML和CW激光器的区别示意**

资料来源:住友电工,Dolphin Research
接下来是四大光纤组件,这些组件在传统可插拔光模块路线下很少用到:
**(2)光纤阵列单元(FAU,Fiber Array Unit)**:用于将光纤精确安装,实现光纤与波导之间的高精度对准。
**图:Fiber Array Unit**

资料来源:Corning,Dolphin Research
**(3)保偏光纤(PMF,Polarization Maintaining Fiber)**:一种特殊光纤,用于保持光波的偏振态不变。
**(4)光纤分配盒(Fiber Shuffle)**:用于排列光纤,可以将复杂的高密度设备中的光纤位置顺序重新排列。
**图:Fiber Shuffle示意**

资料来源:Hyoptic,Dolphin Research
**(5)光纤连接器(MPO,Multi-Fiber Push On)**:用于多芯光纤之间的相互连接。
**图:MPO端口示意**

资料来源:Senko,US Conec,Dolphin Research
为什么传统光模块很少用到上述组件?
- 传统模式下,光纤直接插入标准化接口,但在CPO下,光纤需要与光芯片表面的波导进行高精度耦合,因此需要FAU。
- 传统模式是直接调制,对光波的偏振态不敏感,且此前保偏光纤(PMF)成本极高,不适合产业化应用。但CPO通过外部激光器供给光源,激光偏振态会导致巨大能量损耗,因此必须用到PMF。
- 传统模式通常只有1发1收两路光纤,没有那么复杂的光纤需要连接到背板,人工操作即可,不需要Fiber Shuffle。但CPO下必须使用Fiber Shuffle。
- 同样,传统模块也不需要很多接口,但CPO下如果达到400G以上,需要8根甚至16根光纤并行传输,而面板空间有限,因此需要MPO这种多芯连接器。
至于市场空间以及CPO所涉及产业环节的投资机会,我们将在下篇中进行分析。
来源:互联网
免责声明
本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。