隨著人工智能(AI)模型規模的持續擴大,智算芯片間、算力節點間的通信帶寬不足的問題愈發突出。傳(chuan) 統電子互連方式已難以滿足GPU集群、超級計算中心和雲(yun) 計算平台對高速、大容量、高效能數據交換的需求。尤其是在大模型訓練過程中,海量參數需要在計算節點之間頻繁傳(chuan) 輸,互連帶寬不足不僅(jin) 降低係統響應速度,甚至可能導致宕機,嚴(yan) 重影響計算效率與(yu) 用戶體(ti) 驗。
如何突破電子傳(chuan) 輸在帶寬與(yu) 能耗方麵的物理限製,構建以光子為(wei) 信息載體(ti) 的新型互連架構?
日前,複旦大學信息科學與(yu) 工程學院張俊文研究員、遲楠教授與(yu) 相關(guan) 研究團隊開展合作,通過精確設計和優(you) 化,將多維複用技術引入片上光互連架構,不僅(jin) 顯著提升了數據傳(chuan) 輸吞吐量,同時在功耗和延遲方麵表現卓越,具備極強的擴展性和兼容性,適用於(yu) 多種高性能計算場景。
在此基礎上,團隊設計並研製了一款矽光集成高階模式複用器芯片,實現了超大容量的片上光數據傳(chuan) 輸。實驗結果表明,該芯片可支持每秒38Tb的數據傳(chuan) 輸速度,意味著未來1秒可完成大模型4.75萬(wan) 億(yi) 的參數傳(chuan) 遞,這顯著提升了大模型訓練與(yu) 計算集群間的通信性能和可靠性,為(wei) 人工智能、大模型訓練及GPU加速計算等應用提供了強有力的支持。
這一技術突破不僅(jin) 為(wei) 數據中心和高性能計算服務器的光互連係統提供了新的解決(jue) 方案,也為(wei) 人工智能、大規模並行計算及大模型訓練奠定了堅實的技術基礎。相關(guan) 研究成果發表在國際期刊《自然·通訊》上。
轉載請注明出處。