线性光学(LPO)和CPO对于数据中心节能很重要
线性光收发器和共封装光学器件是针对不断攀升的功耗而发展起来的互连技术,这类技术将成为未来高性能计算系统实现的关键。

当前计算机设计界流传着一个流行口号:必须紧急遏制电力消耗的增长。业内人士争论不休,认为人工智能数据中心的电力需求已变得不可持续,威胁着电网的承载能力和可靠性。数据中心能源消耗巨大,必须解决日益增长的散热问题。人工智能数据中心的环境影响,使得可持续性成为新建数据中心设计的重要考量。
如今这些数据中心占地面积已达数百英亩。部分运营商已采用“后置计量”策略,包括为单个数据中心建造专用发电系统。人工智能数据中心对电力的无止境需求,促使人们开始认真考虑新建模块化核电站。

数据中心异常高的能耗问题由来已久。早期使用真空管的计算机耗电量惊人,1946年问世的ENIAC计算机就配备了超过1.7万个真空管,耗电量高达175千瓦。由此产生的过热现象导致电子元件频繁故障。如今在高级半导体中,传输或处理单个数据位的能效已达到每比特皮焦耳级别。虽然单个数据位的能耗微乎其微,但当这个数值乘以数十亿次运算时,总能耗就会迅速累积。随着人工智能的兴起及其庞大的运算需求,降低能耗已成为新系统设计的首要任务。
随着传输速度的提升,铜导体的能量损耗会增加,需要更大功率电源才能维持可靠的信号传输。当信号传输路径(传输距离)延长时,可能需要对信道进行增强,确保达到最低误码率。

要确保接收端的数据流具备足够的信号强度,同时避免受到串扰、反射、信号偏斜和电磁干扰等多种因素的破坏,通常需要通过放大和纠错技术进行补偿。
工程师们在高速铜缆传输电信号方面取得了卓越成就,但物理定律表明,为确保信号完整性而增加的附加功能也会提升整体功耗。如今的先进AI计算机集群往往基于“万物互联”的理念构建,这导致互连线路数量激增,功耗也随之大幅攀升。
除了改进设计实践外,工程师们还采取了一些旨在对能源消耗的上升产生重大影响的策略。

鉴于光互连在带宽、容量和传输距离方面的优势,系统设计者已在众多输入/输出(I/O)应用中采用可插拔光模块。
QSFP/QSFP-DD和OSFP光收发器在I/O面板上将电信号高效转换为光脉冲,可实现120公里以上的稳定传输。最新用户调查显示,自2026年起,预计将有越来越多用户部署800G相干光可插拔模块。众多竞争性模块制造商组成的庞大生态系统,提供了多种兼容插拔的光源选择。这种可插拔光收发器不仅部署便捷,还能根据系统需求变化轻松进行重新配置。

没有一项技术或解决方案是完美的,可插拔设备也存在自身局限。先进的计算系统,尤其是人工智能集群,需要极高的连接性。当服务器I/O面板上需要安装物理空间允许的最大数量收发器时,可能无法提供足够的I/O容量来支撑系统运行,从而成为数据瓶颈。
随着传输速率和覆盖范围的提升,可插拔式光收发器的功耗也随之增加。QSFP-DD收发器的功耗范围可达7至25瓦。由于全配置I/O面板内部热量不断积聚,收发器插座制造商不得不研发先进的散热管理技术,将热量有效导出模块。

TE Connectivity最近展示了一种连接在光收发器插座上的冷板。
为了降低可插拔收发器的能耗,业界对线性光收发器的关注度持续攀升。这类设备通过省去部分或全部数字信号处理器(DSP),有效降低功耗。
低功耗光学/线性可插拔光学(LPO)通过省去标准可插拔光模块设计中的特定组件来实现这一目标。组件数量减少,功耗降低,发热量减少,可靠性可能提高。
传统光收发器在发射和接收电路中均配备重定时器。重定时器可补偿更高的信道损耗,并能承受更大的噪声和串扰。当与多模光纤耦合时,这些收发器的功耗为12-13瓦。与单模光纤耦合时,功耗为15-16瓦。

半定时模块仅对发射端进行定时,接收端不进行定时。当与多模光纤耦合时,功耗为8-10瓦。与单模光纤耦合时,功耗为10-13瓦。

非定时模块省去了所有定时DSP,功耗最低。这类收发器可能需要主机交换机的均衡处理,并严格符合信号完整性标准。当与多模光纤耦合时功耗为4-5瓦,与单模光纤耦合时功耗为7-8瓦。

早期的线性光收发器存在无法完全实现即插即用的问题,通常需要调整系统电路和参数才能保证性能。为解决这一难题,OIF发布了多项规范,明确了电路要求,确保即插即用性能。
当由半导体、网络和光学设备制造商组成的联盟发布LPO线性可插拔光学多源协议时,该标准获得了更多关注。这项倡议致力于制定规范,旨在构建互操作的LPO解决方案生态系统。LPO多源协议规范将定义电气和光学要求,确保来自不同厂商的LPO收发器在机械、电气和光学层面实现兼容。
共封装光器件(CPO)通过将电信号传输路径压缩至最小,为降低系统功耗提供了第二种解决方案。CPO架构将光引擎部署在高速交换机或专用集成电路(ASIC)附近,缩短ASIC芯片与光引擎之间的铜线长度,有效减少信号失真和功耗。转换后的光信号传输至I/O面板时,采用高密度光连接器的方案比传统插接式光器件节省大量空间。这种设计不仅显著降低功耗,还大幅提升I/O面板的信号传输容量与密度。
CPO的演进始于传统铜缆与铜基板线路的直接连接,从而演变出高性能器件。随后近封装光学(NPO)技术的引入,使光纤更靠近器件,同时缩短了铜导体的长度。

最新一代CPO采用微型光引擎芯片,这些芯片与ASIC同属一个基板,环绕在有源装置周围。

铜线长度被压缩到最小。未来几代CPO可能会将光引擎直接集成到ASIC或交换设备中。
某些CPO配置将激光源与器件集成在同一基板上,这会带来可靠性、可维修性和散热管理方面的挑战。另一种解决方案是采用安装在I/O面板上的外置激光器。这种小型化ELSFP模块可直接从前板更换,一旦激光器发生故障即可快速修复。

光网络论坛(OIF)已就3.2Tb光模块及ELSFP外形规格达成实施协议,旨在通过提供设计指导方案,加速CPO技术的普及应用。
线性光收发器与共封装光器件目前仍处于研发初期,用户使用体验和供应链体系尚不完善。凭借40%至70%的能耗降低潜力,共封装光器件(CPO)已引发英伟达、微软、AMD等业界巨头的关注。
当技术完全成熟并形成标准化规范后,CPO凭借其高封装密度、便捷维护、易量产、高可靠性等优势,以及向更高带宽发展的技术路径,展现出强大的市场吸引力。224Gb/通道设计的工程师会发现CPO实用价值,在448Gb/通道及以上规格中,它将成为不可或缺的关键技术。众多业内人士认为,CPO的全面普及已成必然趋势。
高性能计算与人工智能集群需要大规模的网络连接。随着高速低延迟数据传输链路数量的激增,高密度低功耗光输入输出技术已成为必然选择。尽管光输入输出技术(CPO)要成为主流技术,但仍需大量研发。市场预测显示,到2027年,非光输入输出(NPO)与光输入输出(CPO)市场的总规模将达55亿美元。
线性光收发器和共封装光学是不断发展的互连技术的例子,它们针对的是不断增长的功耗,并将成为实现未来几代高性能计算系统的关键。
广告
暂无评论