近日,紫光股份旗下新华三集团(以下简称“新华三”)重磅发布基于DDC(Diversity Dynamic-Connectivity,多元动态联接)架构的新一代无损网络解决方案及算力集群交换机H3C S12500AI,直面万卡级算力互联场景需求,重塑智算中心网络架构。实测数据显示,相比传统方案,该组网方案有效带宽提升达107%,带宽利用率可媲美InfiniBand网络,并可灵活适配1K至70K节点的多样化集群部署需求。
随着大模型参数规模跃升至万亿级,全球AI技术演进正从算法创新延展至基础设施的全面升级。数据显示,网络性能波动可导致训练效率下降30%,训练时长增加25%。尽管网络投资占比相对较小,但其对整体算力效能和经济收益的影响至关重要,已成为推动智算中心升级的关键变量。新华三集团推出基于DDC架构的新一代无损网络解决方案,聚焦“超大规模、极致性能、开放解耦、智能运维”四大技术突破,高效解决智算网络中流量拥塞与调度难题,全面提升智算网络效能。
高性能网元支持超大规模组网
灵活适配千卡至万卡集群规模
新一代算力集群交换机H3C S12500AI 面向超大规模智算场景,全面支持DDC架构,拥有卓越的扩展性与适配能力。其网络交换单元(NCF)采用盒式设计,支持高达 128 *800G OSFP信元端口,网络处理单元(NCP)下行端口兼容36*400G Q112以太端口与18*800G ?OSFP以太端口,灵活适配主流网卡形态,确保高效稳定的接入体验。基于NCF+NCP的多级组网模式,DDC架构可实现超7万卡的大规模集群互联。同时,采用独立网元的开放式组网方式,省去集中式网络控制单元,有效规避单点故障带来的管理风险。实测数据显示,DDC架构相较传统组网方案有效带宽提升107%,显著增强智算网络的吞吐能力与运行稳定性。
先进信元交换机制
构建100%无阻塞智算网络
DDC架构采用信元交换机制,确保网络无拥塞、高效传输,并彻底消除流量失衡问题。通过采用字节级等长信元切片,信元交换机制保证了全链路流量均衡,能够有效应对All-to-All全线速流量冲击。结合信源转发,报文切片后能够消除对流量模式和数据包特征的敏感性,实现100%负载均衡,彻底解耦GPU、网卡。根据Tolly测试报告,在All-to-All流量模型下,基于DDC架构的RoCE网络总线带宽与InfiniBand网络相当,且在1G以上带宽场景下展现出更为优越的性能,平均提升达到2.5%。这一结果充分验证了DDC架构在AI训练场景中的领先性能。
制定DDC核心框架标准
构建开放智算生态
随着智算进程的加速推进,算力基础设施生态日益完善,多元算力组件的适配挑战也愈发凸显。新华三秉持开放共建的理念,携手业界生态伙伴基于 OSF(人工智能网络开放调度架构)制定DDC核心框架标准,采用BGP协议发布隧道出口点(TEP),优化AI网络的流量调度能力,重点解决负载均衡、拥塞控制、网络可靠性三大核心问题,推动网元级的灵活异构与互联互通。该标准体系的制定不仅展示了新华三在无损以太技术领域的深厚积累,还将促进产业协同,打破厂商壁垒,构建开放智算生态。
智能运维
智算网络全生命周期管理
智算网络联接海量设备和异构算力、故障复杂多样,对于运维的挑战巨大。对此,新华三推出AD-DC智算版智能管控分析平台,实现对于智算网络全生命周期运维管理。平台具备一键自动上线功能,设备即插即用,无需复杂调优,大幅简化部署流程。同时,依托端到端互联可视化和全链路智能监控,可实时洞察网络运行状态,确保高效运维。更进一步,平台支持端网协同的跨域问题定位,保障业务连续性,为智算网络提供更稳定、更智能、更高效的管理体验。
对DDC架构的持续探索和升级,不仅代表了技术的革新,更是新华三对智算网络范式的全新定义。其开放解耦的架构突破了传统封闭系统的局限,支持多元算力生态的无缝接入,为AI产业提供可持续发展的联接基础。未来,新华三将持续推动智算网络技术创新,加速AI赋能各行各业。在生成式AI重塑产业格局的时代背景下,这场从网络架构层发起的变革,必将开启智能计算的全新纪元。
审核:马国香 付强
校对:米果 晓符