国盛通信 | 800G LPO:AI 时代最具潜力的技术路线

This article is not available in the current language yet. Showing the original version.
LPO:解决高功耗、高成本、高延迟问题

摘要

LPO方案:低功耗、低延迟、低成本、可插拔。LPO通过线性直驱技术替换传统的DSP,将其功能集成到交换芯片中,只留下driver和TIA芯片。LPO光模块中用到的TIA、driver芯片性能也有所提升,从而实现更好的线性度。


目前主流方案有进一步性能提升空间。目前主流的PAM4+DSP解决方案具有较好的信号处理能力,表现在电口适应性强、光电性能好等,但在功耗和成本上有进一步提高空间。在400G ZR中DSP模块功耗占比49%。在成本上,DSP价格较高,400G光模块中,DSP的BOM成本约占20-40%。


LPO方案解决了高功耗、高成本、高延迟的问题。LPO功耗相较可插拔光模块下降50%,与CPO接近。根据Macom的数据,具有DSP功能的800G多模光模块的功耗可超过13W,而利用MACOM PURE DRIVE技术的800G多模光模块功耗低于4W。延迟上,去掉DSP芯片后,系统减少了对信号复原的时间,延迟大幅降低。另外,相比于CPO,LPO采用可插拔模块,便于维护,并且可以充分利用现有的成熟技术。


AI算力需求爆发带动800G光模块放量。大模型、大数据、大算力日益成为AIGC应用的核心制约。大模型和数据集是AIGC发展的软件基础,而算力是最为重要的基础设施。AI以并行计算为主,核心处理器主要为GPU,但除了GPU性能外,通信因素也会成为制约超算的短板,只要有一条链路出现网络阻塞,就会产生数据延迟。因此,AI服务器对于底层数据传输速率和延时要求非常苛刻,需要高速率的光模块匹配。


我们认为,LPO技术是800G时代最具潜力路线。DSP芯片由7nm制程向5nm制程演进,设计、制造成本水涨船高。而LPO方案能够大幅降低功耗和延时,并具有成本优势。而其系统误码率和传输距离较短的缺陷,在AI计算中心短距离应用场景下也得到弥补。因此,LPO方案能够高度契合AI计算中心短距离、大带宽、低功耗、低延时的需求。


LPO有望在2024年底迎来量产。LightCounting预计业内将在2024年底首次部署LPO光模块。目前新易盛、剑桥科技等已发布相关产品,中际旭创已有技术储备和产品开发,海信推出800G线性互联光缆。高线性度的TIA、Driver芯片作为LPO技术的核心零部件,目前有Macom、Semtech、美信等主要供应商,博通也在推进相关产品研发。目前,剑桥科技与Macom深入合作,且正在向微软供货高速光模块,我们认为,北美云厂商正在积极扩充算力资源,未来微软、Meta、AWS、谷歌都有可能逐步接受LPO方案,建议持续关注。


风险提示:光模块市场需求不及预期;相关技术研发进度不及预期。



一、800G LPO:AI时代最具潜力的技术路线

LPO简介:LPO(linear drive pluggable optics,线性驱动可插拨光模块),主要运用于高速光模块领域,就是通过线性直驱技术替换传统的DSP,实现系统降功耗、降延迟的优势,但系统误码率和传输距离有所牺牲。该技术适用于数据中心等短距离传输场景。

 

LPO技术主要用于高速率光模块中。光模块传输速率涵盖很大的范围,根据传输速率的不同,光模块可分为155M、622M、1.25G、2.5G、8G、10G、16G、25G、32G、40G、50G、100G、200G、400G等。传输速率越高的光模块,结构越复杂。根据封装类型的不同,光模块可分为SFP、eSFP、SFP+、XFP、SFP28、QSFP28、QSFP+、CXP、CFP、CSFP等。



400G及以上速率的光模块主要有QSFP-DD、CFP8和OSFP封装。随着5G建设、数据要素规模的演进以及AIGC对海量数据传输的需求,电信、数通领域需要更强性能的光交换机,也因此需要更高速率的光模块。目前主流的200G/400G/800G的产品都是基于PAM4技术+DSP芯片来实现高速信号的调制、传输和恢复。



PAM4(4-Level Pulse Amplitude Modulation,四电平脉冲幅度调制)是一种调制技术,采用4个不同的信号电平来进行信号传输,每个信号周期可以传输2bit信息。而传统数字信号通过不归零编码(Non-Return-to-Zero,NRZ)来传输信号,只有高、低电平代表1、0两种信号,每个信号周期能够传输1bit信息。这样一来,PAM4就能携带NRZ两倍的信息量,从而实现传输速率的倍增。PAM4的优势在于可以在不增加带宽的情况下提高传输速率,缺陷在于对噪声更敏感,其眼图开口更小,难以将原始信号区分开来。



PAM4的调制方法包括基于DSP的数字DAC实现方法和基于模拟的组合方法。主流模拟模式可以通过添加两个NRZ信号通道来工作,数字模型基于高速DAC,可实现0/1/2/3电平的快速输出。DSP是数字信号处理技术,主要用于解决光通信系统中的数字时钟恢复、色散、带宽不足引起的低通滤波效应、偏振旋转等问题,消除噪声和非线性干扰。对于100G以上的单波应用,目前的电驱动芯片和接收端光器件无法达到50GHz以上的带宽,相当于在发射端引入低通滤波器,造成码间干扰,使得接收器无法恢复正确信号。引入DSP后,信号可以在发送端进行压缩,在接收端通过自适应非递归(FIR)滤波器恢复,从而减少对光器件带宽的要求。PAM4+DSP解决方案具有较好的信号处理能力,表现在电口适应性强、光电性能好等,但具有更高的功耗和成本。下图可以看到,在400G ZR中DSP模块功耗占比49%。



LPO方案相较于PAM4+DSP有何优势?


为了降低DSP的功耗和延迟,LPO概念应运而生。LPO技术去掉了DSP芯片,将其功能集成到交换芯片中,只留下驱动(Driver)和跨阻放大(Transimpedance Amplifier,TIA)芯片。LPO光模块中用到的TIA、driver芯片性能有所提升,从而实现更好的线性度。但是,LPO的系统误码率和传输距离有所影响,因此这项技术只适用于短距离的应用场景,例如数据中心服务器到架顶交换机的链接。



LPO技术具有以下几个优点:

(1)低功耗。LPO功耗相较可插拔光模块下降50%,与CPO接近。图表8显示采用Linear-drive方案后,硅光、VCSEL、薄膜铌酸锂功耗均下降50%左右。根据Macom的数据,具有DSP功能的800G多模光模块的功耗可超过13W。而利用MACOM PURE DRIVE技术的800G多模光模块功耗低于4W,下降70%。低功耗不仅节省电能,而且能够减少模块内组件的发热。

(2)低延迟。去掉DSP芯片后,系统减少了对信号复原的时间,延迟大幅降低。DSP/重定时功能增加了延迟,以MACOM PURE DRIVE技术为例,因采用信号串行方案,LPO光模块可以做到皮秒级别的延迟时间。

(3)低成本。DSP价格较高,400G光模块中,DSP的BOM成本约占20-40%;LPO的Driver和TIA里集成了EQ功能,成本会较DSP上浮少许,但LPO方案还是可以将光模块成本下降许多。

(4)可热插拔。相比于CPO,LPO没有显著改变光模块的封装形式,采用可插拔模块,便于维护,并且可以充分利用现有的成熟技术。



半导体厂商Macom已发布LPO解决方案MACOM PURE DRIVE,与标准的DSP架构相比具有以下优势:(1)将光互连功耗降低50%以上;(2)最小化链路延迟,对机器学习和人工智能应用至关重要;(3)消除了成本高昂且冗余的信号重定时模块;(4)解决了独立的DSP芯片发热的问题;(5)简化了模块实现,具有更大的灵活性;(6)减少占地面积以满足空间受限的设计要求;(7)可扩展至1.6T速率。


LPO产业进度:国内外并驾齐驱。LPO作为一种新技术,预计2024年年底量产,目前新易盛、剑桥科技等已发布相关产品,中际旭创已有技术储备和产品开发,海信宽带推出800G线性互联光缆。高线性度的TIA、Driver芯片作为LPO技术的核心零部件,目前有Macom、Semtech、美信等主要供应商,博通也在推进相关产品研发。目前,剑桥科技与Macom深入合作,且正在向微软供货高速光模块,我们认为,北美云厂商正在积极扩充算力资源,未来微软、Meta、AWS、谷歌都有可能逐步接受LPO方案,建议持续关注。



值得注意的是,LPO方案需要和交换机进行配合,对光模块厂商在产业内上下游合作协同要求更高,龙头公司如中际旭创、新易盛将更加具备优势。



二、行业:量产将至,800G光模块最具潜力方案

AI算力需求爆发带动800G光模块放量。随着AI技术的发展,大模型、大数据、大算力日益成为AIGC应用的核心制约。大模型和数据集是AIGC发展的软件基础,而算力是最为重要的基础设施。AI以并行计算为主,核心处理器主要为GPU,但除了GPU性能外,通信因素也会成为制约超算的短板,只要有一条链路出现网络阻塞,就会产生数据延迟。因此,AI服务器对于底层数据传输速率和延时要求非常苛刻,需要高速率的光模块匹配,因此AI服务器对800G光模块的需求很大。以英伟达DGX H100服务器为例,H100 + NVLink Network + IB架构中,一个服务器对应5+4+4+5个连接外部的4xNVLink通道,即18个800G光口,36个800G,即一张H100在该架构下,用于显存互联的部分就需要4.5个800G光模块。



LPO技术是800G时代最具潜力的方案。随着DSP芯片由7nm制程向5nm制程演进,DSP芯片的设计、制造成本也水涨船高。而LPO方案在光模块中去掉DSP芯片,能够大幅降低功耗和延时,并具有成本优势,而其系统误码率和传输距离较短的缺陷,在AI计算中心短距离应用场景下也得到弥补。因此,LPO方案能够高度契合AI计算中心短距离、大带宽、低功耗、低延时的需求。LightCounting预计业内将在2024年底首次部署LPO光模块。



短距离传输场景高景气,潜在市场巨大。新一代的大型数据中心为了应对数据流量的增长以及兼顾更灵活的扩容升级和备份功能,普遍开始采用叶脊网络架构,数据中心内部的数据交换和吞吐能力更强,同时网络结构也更加扁平化。在一个典型的叶脊架构数据中心内部交换网络中,大多数场景的传输距离都小于2km,叶脊方案用短距离、密集布线替代传统三层拓扑结构的中长距离、相对稀疏的布线,因此带来了短距离光模块的可观需求量。短距离场景下,LPO无需考虑误码率问题,同时LPO凭借低功耗低成本优势,未来有望率先抢占数据中心内部交换网络这一庞大市场。


三、风险提示

光模块市场需求不及预期。

光模块受到AIGC催化算力需求发展而拉高光模块需求弹性,如果AIGC、算力发展不及预期,将影响云厂商光模块采购量。


相关技术研发进度不及预期。

LPO作为一种正在小范围开发、测试和应用的新技术路线,本身具有不确定性。若LPO量产失败,或者市场主动放弃这一方案,将可能影响相关个股的行情走势。



本文节选自国盛证券研究所已于2023年5月16日发布的报告《国盛通信 800G LPO:AI 时代最具潜力的技术路线,具体内容请详见相关报告。


宋嘉吉

S0680519010002

songjiaji@gszq.com

黄瀚

S0680519050002

huanghan@gszq.com
赵丕业

S0680522050002

zhaopiye@gszq.com

特别声明:《证券期货投资者适当性管理办法》于2017年7月1日起正式实施。通过微信形式制作的本资料仅面向国盛证券客户中的专业投资者。请勿对本资料进行任何形式的转发。若您非国盛证券客户中的专业投资者,为保证服务质量、控制投资风险,请取消关注,请勿订阅、接受或使用本资料中的任何信息。因本订阅号难以设置访问权限,若给您造成不便,烦请谅解!感谢您给予的理解和配合。

 

重要声明:本订阅号是国盛证券通信团队设立的。本订阅号不是国盛通信团队研究报告的发布平台。本订阅号所载的信息仅面向专业投资机构,仅供在新媒体背景下研究观点的及时交流。本订阅号所载的信息均摘编自国盛证券研究所已经发布的研究报告或者系对已发布报告的后续解读,若因对报告的摘编而产生歧义,应以报告发布当日的完整内容为准。本资料仅代表报告发布当日的判断,相关的分析意见及推测可在不发出通知的情形下做出更改,读者参考时还须及时跟踪后续最新的研究进展。


本资料不构成对具体证券在具体价位、具体时点、具体市场表现的判断或投资建议,不能够等同于指导具体投资的操作性意见,普通的个人投资者若使用本资料,有可能会因缺乏解读服务而对报告中的关键假设、评级、目标价等内容产生理解上的歧义,进而造成投资损失。因此个人投资者还须寻求专业投资顾问的指导。本资料仅供参考之用,接收人不应单纯依靠本资料的信息而取代自身的独立判断,应自主作出投资决策并自行承担投资风险。

 

版权所有,未经许可禁止转载或传播。


Share to:

Author: 吉时通信

Opinions belong to the column author and do not represent PANews.

This content is not investment advice.

Image source: 吉时通信. If there is any infringement, please contact the author for removal.

Follow PANews official accounts, navigate bull and bear markets together
PANews APP
Bitget launches VIP Fast Track Program, breaking down the barriers to entry for static holdings.
PANews Newsflash