7月11日,中國移動完成了業(yè)界首次百公里級800G以太網(wǎng)智算協(xié)同訓練的現(xiàn)網(wǎng)技術試驗,標志著智算中心互聯(lián)技術取得重要進展,為高效聚合分散算力資源提供了關鍵技術支撐。
本次試驗主要面向城市群(如京津冀、長三角城市群)智算中心分布在多地,需要聚合零散算力資源進行模型訓練的場景。本次試驗采用了中國移動提出的全調(diào)度以太網(wǎng)與高速光網(wǎng)絡融合的技術體系(GSE-DCI),單臺設備將路由功能和長距光傳輸融合,單光纖可支持高達32個800G波長通道的超大容量傳輸,相比傳統(tǒng)智算中心互聯(lián)技術實現(xiàn)了單比特成本降低40%,功耗降低35%,節(jié)點時延降低20%。在700億級參數(shù)大模型的并行訓練場景下,其訓練效率可達同等GPU規(guī)模單一節(jié)點的98%。該方案可最大限度協(xié)同智算中心內(nèi)外網(wǎng)絡,大幅提升跨智算中心訓練算效,有效解決算力碎片化問題。
800G以太網(wǎng)是面向未來智算與互聯(lián)網(wǎng)需求制定的新一代互聯(lián)標準。中國移動引領了全球最大技術組織IEEE(國際電氣電子工程師學會)的中長距800G以太網(wǎng)標準制定,IEEE是全球電子、計算機、通信等領域制定行業(yè)國際標準的核心機構。
下一步,中國移動將依托算力網(wǎng)絡試驗裝置(CFITI)開展更多基礎網(wǎng)絡前沿技術驗證。