中兴576×800G智算交换机与OEX超节点深度解析

芒果虾 2026年5月19日 阅读约18分钟

一、发布背景与行业语境

2026年4月9日,中兴通讯在"和合兴业 智启未来"中国生态合作伙伴大会上发布全栈AI基础设施矩阵,其中三项核心技术引发行业关注:576×800G端口框式智算交换机、OEX正交无背板超节点架构以及GoldenDB向量数据库版本[1]。这三项产品分别对应AI基础设施中的网络互联、算力集成和数据智能三个关键层次,标志着中兴从通信设备商向"算网存智一体"综合提供商的战略跃迁。

从行业背景看,全球AI基础设施投资正以32.7%的年复合增长率(2024-2029年)高速扩张[2]。随着大模型参数规模突破万亿量级,GPU集群规模从千卡向万卡乃至十万卡演进,传统网络架构面临根本性瓶颈:三层CLOS组网引入过多跳数,导致训练过程中的通信同步时延成为算力利用率的限制因素。正是在这一技术拐点上,中兴的576×800G交换机与OEX超节点架构试图给出系统级的解法。

核心判断

AI集群的网络性能已不再是"够不够快"的问题,而是"能不能让万卡GPU同时满载运行"的系统工程挑战。中兴此次发布的三项产品并非孤立存在,而是构成了从硬件互联到数据引擎的纵向技术闭环。

二、576×800G智算交换机:二层组网如何重构AI集群网络

576×800G端口框式智算交换机是此次发布的核心网络产品。其核心参数直指AI训练集群的网络痛点:576个800G端口意味着单台设备具备460.8Tbps的交换容量,足以支撑万卡规模GPU集群的二层直连组网[1]

2.1 二层组网 vs 三层组网:拓扑简化的工程意义

传统大规模AI集群普遍采用三层CLOS组网架构(Leaf-Spine-SuperSpine),这种架构在通用数据中心中已被验证成熟,但在AI训练场景下面固有局限。三层架构意味着数据包从源GPU到目的GPU需要经过至少三跳交换机转发,每一跳都引入数十微秒的转发时延和潜在的排队时延。在大模型训练的All-Reduce和All-to-All通信模式中,数千个GPU频繁进行参数同步,网络时延直接叠加到每一次同步操作的关键路径上。

中兴的576×800G交换机通过超大端口密度将三层架构压缩为二层。具体而言,576个800G端口可直接下联576台服务器(假设每台配备一个800G上行口),上层仅需一级Spine交换即可实现无阻塞互连。二层直连架构消除了中间跳转节点,将端到端流量路径压缩至物理最短距离,实测端到端网络时延下降33%[2]

33%
端到端时延降低
40%
设备/光模块/光纤减少
3μs
转发延迟
460.8T
交换容量(Gbps)

拓扑简化带来的收益不仅体现在时延上。设备、光模块和光纤数量减少40%[2],这直接降低了三个方面:资本支出(设备采购成本)、运营支出(功耗与维护)以及故障域(更少的物理设备意味着更低的硬件故障概率)。在万卡集群中,一个光模块故障可能导致训练任务中断重启,而一次重启的代价可能是数小时的GPU计算时间,相当于数十万元的算力浪费。因此,将光模块和线缆数量削减40%在工程上具有显著的业务价值。

2.2 无损网络与拥塞控制

AI训练集群对网络丢包极其敏感。RDMA(Remote Direct Memory Access)协议在丢包环境下的重传代价远高于传统TCP——一次PFC(Priority Flow Control)反压可能导致整条链路的暂停,形成严重的Incast拥塞。中兴宣称该交换机在数千卡GPU集群中,网络丢包时细粒度压控在0.01%的值域内[2]

这一指标的实现依赖于多个维度的协同设计:大容量共享缓冲区(8G超大缓存单板[1])吸收微突发流量,全局流量负载均衡算法避免单路径拥塞,以及高精度流控机制与RDMA协议栈的深度适配。其中,8G超大缓存在AI训练的All-to-All通信模式中尤为关键——当多个GPU同时向同一目的节点发送数据时,交换机需要在微秒级时间尺度上缓冲数十GB的突发流量,这对缓冲管理的调度算法提出了极高要求。

2.3 Scale-Across跨域互联

与576×800G交换机同步发布的还有智算跨域互联(Scale-Across)方案。该方案依托60倍超大缓存单板、自研彩光模块与大容量OTN设备,实现300公里超长距算力调度,调度性能达99%[1]。这意味着跨数据中心的GPU资源可以逻辑整合为一个统一的训练集群,使"区域算力一张网"从概念变为可工程化部署的现实。

从技术实现角度,300公里超长距互联面临的核心挑战是时延与可靠性的平衡。光信号在光纤中的传播时延约为5ms/1000km(单程),300公里对应约1.5ms的单程传播时延。在RDMA语义下,这一时延虽然远高于机柜内通信(百纳秒级),但通过大缓存吸收带宽时延积、自研彩光模块提升链路质量、OTN层前向纠错(FEC)保障传输可靠性等手段,可以将99%的调度性能维持在可接受水平。

三、OEX超节点架构:正交无背板互联的技术突破

OEX(Orthogonal Electrical eXchange)正交无背板互联架构是中兴在超节点领域的核心技术突破,其设计哲学从根本上重新审视了机柜内部的互联方式。

3.1 传统Cable Tray方案的工程瓶颈

当前主流的超节点硬件架构采用Cable Tray(线缆托盘)方案——计算托盘与交换托盘之间通过数千根高速线缆(Cable)进行物理连接。以NVIDIA NVL72为例,72颗GPU通过NVLink互连,柜内需要布设大量高速铜缆或光纤跳线。这种方案面临三重工程挑战:其一,线缆占用大量机柜空间,限制了算力密度的提升;其二,高速信号在长线缆中的衰减和串扰降低信号完整性;其三,线缆的物理连接器是系统中故障率最高的组件之一,松动或老化导致的宕机风险随线缆数量线性增长。

3.2 OEX正交架构的物理创新

OEX架构的核心创新在于:将计算托盘与交换托盘垂直交叉排列,通过正交连接器直接实现板间电气互联,彻底消除了机柜内部的线缆[3]。这一物理设计的改变带来了多维度收益:

OEX四大核心优势

高密集成:无线缆设计释放了大量机柜空间,单机柜可容纳128个GPU,算力密度达到业界领先水平[1]。相较传统Cable Tray方案,省去了线缆走线空间和连接器安装空间,这些空间可重新分配给计算单元。

高可靠性:正交无背板互联显著降低通信损耗和误码率。极短的板间互联路径(从数十厘米的线缆缩短至厘米级的连接器接触距离)确保了高速信号完整性,从物理层面消除了线缆松动、老化等故障模式。

简化运维:系统平均故障修复时间(MTTR)从小时级缩短至分钟级[3]。无线缆设计意味着运维人员无需排查和更换复杂的线缆连接,故障定位和修复流程大幅简化。

开放互联:中兴开放OEX机械与电气规范,支持第三方计算/交换托盘标准化接入[3]。这一开放策略旨在构建国产化整机柜超节点的多厂商协作生态。

3.3 自研"凌云"交换芯片

OEX架构的交换能力依赖于中兴自研的"凌云"大容量交换芯片。该芯片支持TB级互联带宽与百纳秒级时延,并全面兼容国内外主流互联协议,包括RDMA、Clink、OISA、Ethlink、SUE、UEC等[3]。这种多协议兼容能力在当前国内Scale-Up互联协议碎片化的背景下尤为重要——中移OISA、腾讯ETH-X、高通量以太网ETH+、中兴OLink等多种协议并存,而工信部正牵头推动CLink协议以形成统一国内标准[3]

凌云芯片还集成了在网计算(In-Network Computing)能力,可将All-Reduce操作从计算节点卸载至交换芯片内部完成,将通信复杂度从O(logN)降低至O(C)(C为网络层级)[3]。对于动态MoE(Mixture of Experts)模型,在网计算可将Dispatch阶段的分发时延降低20%-50%,Reduce阶段的端到端时延降低40%-60%以上[3]

3.4 从单体超节点到集群超节点

中兴的超节点体系分为Nebula单体超节点与Nebula Matrix集群超节点两个层级。单体超节点基于OEX架构在单机柜内构建高带宽域(HBD),支持128个GPU;集群超节点通过柜间互联技术将多个单体超节点组合,算力规模可进一步扩展至1.6万卡[1]

这一扩展架构遵循"能铜尽铜,距远用光"的原则[3]:单柜内采用OEX电互联保证带宽和时延;柜间采用光互联解决远距离传输。两层架构在保持Scale-Up域高带宽低时延特性的同时,通过Scale-Out层实现规模的弹性扩展。

维度 NVIDIA NVL72 中兴OEX超节点
互联架构 Cable Tray + NVSwitch OEX正交无背板
单柜GPU规模 72 128
集群最大扩展 576(NVLink光互联) 16000
互联协议 NVLink(封闭) 多协议开放兼容
线缆数量 数千根 零(柜内)
MTTR 小时级 分钟级

四、GoldenDB向量数据库:从数据容器到智能决策引擎

GoldenDB向量数据库是中兴在数据基础设施领域的又一重要布局。作为国内首批实现标量+向量+全文混合检索的数据库产品[1],GoldenDB试图解决AI应用中"精确过滤+语义匹配"的双重需求。

4.1 混合检索的技术本质

传统向量数据库仅支持向量相似度搜索(如ANN近似最近邻),但在实际业务场景中,查询需求通常是多维度的:既要语义上相关的结果(向量检索),又要满足精确的结构化条件(标量过滤),还要支持关键词匹配(全文检索)。例如,在金融风控场景中,一条查询可能同时要求"语义上描述类似异常交易"(向量)、"金额超过100万元"(标量)、"包含特定关键词"(全文)。

GoldenDB的混合检索能力使这三种查询模式在一次请求中完成,避免了传统方案中需要在向量数据库和关系型数据库之间来回切换的性能损耗。中兴宣称GoldenDB具备"多、快、准、优、稳"五大核心优势,满足金融级高精度要求[1]。这意味着该数据库在数据规模、响应速度、检索精度、资源利用率和系统稳定性五个维度均达到了金融场景的严格标准。

4.2 从数据容器到决策引擎的定位跃迁

中兴将GoldenDB向量版本的发布定义为数据库产品从"数据容器"到"智能决策引擎"的跨越[1]。这一表述的技术含义在于:传统数据库(即便是分布式数据库)主要承担数据的存储、查询和事务处理功能,是被动响应式的"容器";而向量数据库在AI应用中扮演更主动的角色——它不仅存储和检索数据,还通过向量化和语义理解参与决策过程,成为RAG(Retrieval-Augmented Generation)等AI应用架构中的核心组件。

这种定位的转变对底层技术架构提出了全新要求:向量索引(如HNSW、IVF)的构建和查询需要与标量索引、全文索引深度协同;分布式架构下的向量数据分片需要兼顾局部性和全局召回率;ACID事务语义需要向向量操作扩展。GoldenDB作为中兴在分布式数据库领域的长期技术积累(其在金融核心交易系统已有多年商用经验),其向量版本很可能复用了原有的分布式事务和一致性保证机制,在此基础上新增向量处理能力。

五、系统级协同:5+X多芯片架构与算网存智一体

中兴此次发布的三项产品并非独立存在,而是服务于"算网存智一体"的整体架构愿景。"5+X"多芯片协同设计是这一架构的核心方法论[1]——通过统一指令集对GPU、NPU、CPU等多种芯片进行本地化适配,打破算力孤岛,实现异构计算资源的协同调度。

在"算"层面,OEX超节点提供高密度GPU互联能力;在"网"层面,576×800G交换机构建低时延无损网络;在"存"层面,GoldenDB向量数据库提供智能数据底座;在"智"层面,Co-Claw企业级AI智能体平台打通研发、生产、供应链等核心业务系统[1]。四个层次的纵向整合使得系统级协同优化成为可能——例如,交换机的在网计算能力可以与上层AI框架的通信模式协同优化,超节点的统一内存编址可以与数据库的分布式查询引擎深度适配。

在能源效率方面,中兴同步发布的800V高压直流电源系统将母线电压从传统的48V提升至800V,系统效率超98%[1]。根据焦耳定律(P=I²R),在传输相同功率的条件下,电压提升16.7倍意味着电流降低至原来的1/16.7,线损降低至原来的1/278。2MW模块化CDU液冷系统首次在47U标准机柜内实现2000kW制冷能力,PUE低至1.15,年节电费约25%[1]

能效工程

800V高压直流 + 2MW液冷CDU的组合,从供电和散热两个维度同时优化PUE。传统48V供电架构的线损和铜耗在万卡集群规模下不可忽视,800V架构将这一损耗压缩至系统级。液冷方案将散热密度从传统的50kW/柜提升至2000kW/柜,为单柜128 GPU的超高密度部署提供了热管理基础。

六、竞争格局与技术路线对比

在AI基础设施的赛道上,中兴面对的主要竞争者包括华为、新华三等国内厂商,以及NVIDIA、Arista等国际厂商。各家在网络架构和超节点方案上选择了不同的技术路线。

维度 中兴 华为 NVIDIA
智算交换机端口 576×800G[1] 512×800G(CloudEngine 16800) Quantum-2 InfiniBand(64×400G)
超节点架构 OEX正交无背板[3] 星河AI集群 NVL72/NVL36(NVLink)
互联协议生态 多协议开放兼容 RoCE + 自研 NVLink(封闭生态)
单柜GPU规模 128 64-96 72
网络协议栈 以太网(无损) 以太网(无损) InfiniBand
向量数据库 GoldenDB向量版 GaussDB向量版

中兴的差异化优势集中在三个方面:其一,OEX正交架构在物理层面解决了线缆瓶颈,单柜128 GPU的密度超越了NVIDIA NVL72的72卡和业界主流水平;其二,多协议开放兼容策略适配了国内Scale-Up互联协议碎片化的现实,为未来标准统一预留了空间;其三,从交换芯片(凌云)到交换机再到超节点整机的垂直整合能力,使系统级优化不必受制于第三方芯片厂商的路线图。

然而,中兴面临的挑战同样不容忽视。NVIDIA的NVLink生态经过多年积累,在软件栈成熟度和客户黏性上具有显著优势;国内Scale-Up互联协议的碎片化(OISA、ETH-X、OLink、CLink等并行发展)增加了适配成本;中兴在AI算力市场的品牌认知度和客户基础相比华为仍有差距。2026年一季度中兴算力业务营收占比已提升至27%[4],但规模效应和生态网络的构建仍需时间。

七、工程挑战与演进方向

尽管OEX架构和576×800G交换机在规格上具有竞争力,但从工程落地到大规模商用仍面临多重挑战。

首先,正交连接器在大规模生产中的良率和一致性是需要持续验证的工程问题。高速差分信号在正交连接器中的阻抗匹配、串扰抑制和信号完整性要求极高的制造工艺,在112Gbps SerDes速率下尤为严苛。随着下一代224Gbps SerDes的引入,正交连接器的信号完整性设计将面临更大挑战。

其次,1.6万卡集群的运维复杂性是系统级的考验。在这一规模下,单次训练任务涉及数十万台物理设备的协同工作,任何一个组件的故障都可能触发级联效应。中兴声称MTTR从小时级缩短至分钟级,但这一指标在实际生产环境中的表现需要大规模部署的验证。

第三,多协议兼容虽然增加了灵活性,但也带来了性能折衷。适配多种互联协议意味着交换芯片需要在有限的硅面积内容纳多套协议处理逻辑,可能影响单协议场景下的极致性能。在统一国内标准(如CLink)最终确立之前,这种兼容性的工程代价将持续存在。

从技术演进方向看,下一代超节点架构将向更高密度的芯片级集成演进。224Gbps SerDes的商用将使单端口带宽翻倍,576×1.6T交换机有望在2027-2028年面世。在网计算能力将从All-Reduce扩展到更多AI原语(如MoE的Dispatch/Combine、Prefix Caching等),使交换芯片从"透明的数据转发设备"演进为"AI集群的协同计算单元"。统一内存编址和CXL协议的融合可能进一步模糊Scale-Up和Scale-Out的边界,使万卡集群在编程模型上趋近于一个统一的超大内存空间。

八、结论

中兴通讯此次发布的576×800G智算交换机、OEX超节点架构和GoldenDB向量数据库,构成了AI基础设施领域一次系统性的技术突破。OEX正交无背板架构在物理层面解决了超节点互联的线缆瓶颈,是继NVIDIA "去光用铜"策略之后的又一次架构创新——从消除光互联回到消除所有线缆,用正交连接器实现零线缆的极致简洁。576×800G交换机通过超大端口密度将三层网络压缩为二层,在时延和TCO两个维度同时优化。GoldenDB向量数据库的混合检索能力填补了国产数据库在AI语义查询方面的空白。

从更宏观的视角看,中兴的全栈布局体现了AI基础设施竞争从单点技术向系统工程演变的趋势。芯片级性能的提升空间正在收窄(摩尔定律放缓、HBM堆叠层数接近物理极限),系统级优化成为释放算力效率的关键。中兴凭借40余年的通信系统工程积累,在交换芯片自研、整机柜设计、网络协议栈优化等环节具备垂直整合能力,这使其在AI基础设施的系统工程竞争中拥有差异化优势。2026年一季度算力营收占比提升至27%[4],验证了这一战略方向的商业可行性。

未来,中兴能否在AI基础设施市场真正建立领先地位,取决于三个关键变量:国内Scale-Up互联标准的统一进程、OEX开放生态的厂商参与度、以及万卡级集群的工程验证结果。在AI算力军备竞赛进入深水区的当下,中兴已拿出了有技术含量的答卷,但最终的胜负取决于从技术到生态的完整闭环。

参考来源