新浪科技訊 1月16日下午消息,近日,特斯聯(lián)發(fā)布升級版T-Cluster 512超節(jié)點架構(gòu)。新版本T-Cluster 512針對高速互聯(lián)、能效優(yōu)化、穩(wěn)定性三個層面進行了全面優(yōu)化,實現(xiàn)互聯(lián)帶寬超8倍提升,液冷超70%覆蓋,PUE低至1.08?;赥-Cluster 512,1MW智算中心可實現(xiàn)年節(jié)電10%以上。
據(jù)介紹,T-Cluster 512是特斯聯(lián)專為異構(gòu)混合訓(xùn)推打造的超節(jié)點產(chǎn)品。包含8個計算機柜及2個交換機柜,單柜可配64張AI加速卡,通過16個高性能計算節(jié)點與8個專用交換節(jié)點的協(xié)同設(shè)計,實現(xiàn)共512異構(gòu)智算節(jié)點的全向互聯(lián),能夠在有限空間內(nèi)迸發(fā)極致算力,總算力規(guī)模超過500PFlops。
在系統(tǒng)設(shè)計層面,T-Cluster 512采用分層級的算力配置,以高密度集成計算單元(如GPU/NPU)為核心,通過Scale-up與Scale-out網(wǎng)絡(luò)協(xié)同優(yōu)化,突破傳統(tǒng)分布式計算的異構(gòu)兼容、通信瓶頸與資源碎片化挑戰(zhàn)。
T-Cluster 512兼容GPGPU、ASIC等架構(gòu),支持多種異構(gòu)AI加速卡協(xié)同高效運行,實現(xiàn)從國產(chǎn)AI芯片到國際主流硬件的無縫適配。截至目前,T-Cluster 512業(yè)已實現(xiàn)對昆侖芯、燧原、天數(shù)智芯、摩爾線程、沐曦、壁仞、曦望等10+信創(chuàng)芯片的兼容適配。
在高擴展性與靈活性方面,T-Cluster 512采用柜內(nèi)卡間全互聯(lián)通信設(shè)計,片間互聯(lián)帶寬提升8倍,單機柜訓(xùn)練性能提升10倍,單卡推理效率提升80%。集群支持從512張AI加速卡擴展到萬卡級別,算力規(guī)模可彈性擴展至10+ EFlops。
通過集成多個計算節(jié)點,T-Cluster 512實現(xiàn)近似單機的性能擴展效率,顯著降低分布式計算中的通信開銷和資源碎片化問題。系統(tǒng)同時支持動態(tài)資源分配,可根據(jù)任務(wù)類型智能調(diào)度算力,整體資源利用率提升至70%。除此之外,T-Cluster 512還尤其具備超高速互聯(lián)、綠色高效、安全穩(wěn)定的特性。
據(jù)介紹,在算力端,特斯聯(lián)聚焦異構(gòu)信創(chuàng)芯片的融合訓(xùn)推,現(xiàn)已推出T-Nexus系列智算服務(wù)器、T-Infer系列場景一體機、T-Cluster系列智算集群及超節(jié)點等代表性產(chǎn)品,并通過搭載ThiCP混合智算平臺,實現(xiàn)對CANN、Neuware、MUSA、MXMACA等不同計算架構(gòu)的兼容。面向物理AI時代,特斯聯(lián)依托成立十年來沉淀的近萬空間智能項目案例,亦構(gòu)建了基于異構(gòu)智算集群的空間數(shù)據(jù)生成引擎及仿真模擬平臺,以加速空間智能及具身智能的訓(xùn)練。