亚洲第一福利视频,欧美黑人粗大xxxxpp,国内精品一区二区三区,国产精品久久久久影院色

智快網 - 新科技與新能源行業(yè)網絡媒體

SIGCOMM2024收錄阿里云HPN 7.0論文 展示AI智算新架構

   發(fā)布時間:2024-05-13 15:55

【智快網】5月13日消息,近日,備受矚目的網絡通信領域國際頂級會議SIGCOMM2024公布了其收錄的論文名單。在這份名單中,中國企業(yè)阿里云表現出色,共有6篇論文被選中。其中一篇詳細闡述了阿里云最新研發(fā)的智算集群網絡架構HPN 7.0,該論文在SIGCOMM的歷史上標志著首次涉及AI智算集群網絡架構領域。據悉,SIGCOMM2024將于今年8月在悉尼舉行線下會議。

隨著大型模型的熱度不斷升溫,AI基礎設施的需求也日益嚴苛。為了滿足這一時代的需求,阿里云針對性地研發(fā)了HPN7.0架構。該架構特別針對大模型訓練過程中的特點,如規(guī)模大、數據流多、突發(fā)性強以及對穩(wěn)定性的高要求,進行了獨特的設計。它采用了“雙上聯(lián)+多軌+雙平面”的網絡結構,并配備了最新一代的51.2Tbps單芯片以太網交換機和400G高性能網卡。此外,通過自研的Solar-RDMA和ACCL通信庫,實現了單層千卡、兩層萬卡的高效穩(wěn)定互聯(lián)。

據智快網了解,自2023年9月起,HPN7.0已在阿里云進行大規(guī)模部署。與上一代架構相比,在典型場景下,大模型的訓練性能提升了14.9%,同時顯著增強了智能計算網絡的穩(wěn)定性。近期,阿里云發(fā)布的通義千問2.5版大模型就是基于HPN7.0高性能網絡架構進行訓練的。與2.1版本相比,新模型在理解能力、邏輯推理、指令遵循和代碼能力方面分別提升了9%、16%、19%和10%,其中文性能已全面超越GPT-4Turbo。

阿里云基礎設施網絡負責人蔡德忠指出,公司自2017年就開始了對端網融合可預期網絡的探索。而HPN7.0不僅延續(xù)了這一探索,更將端網融合的體系結構從網絡協(xié)議棧層面擴展到網絡架構和通信庫,實現了針對AI智能計算時代的新型網絡集群架構創(chuàng)新。

網絡架構作為網絡技術和系統(tǒng)的核心,其重大創(chuàng)新極為罕見。此前,SIGCOMM關于傳統(tǒng)數據中心網絡架構的經典文章是Google提出的Jupiter網絡,它已成為行業(yè)內的標準架構模式。專家表示,阿里云提出的新一代網絡架構HPN7.0有望成為下一代AI高性能網絡架構的新標準。

回顧SIGCOMM近50年的歷史,僅有50余篇論文來自中國大陸,其中阿里云就占據了25篇,是國內科技公司中收錄最多的。這反映了阿里云在高性能網絡領域的深厚底蘊和持續(xù)創(chuàng)新。阿里云不僅提出了端網融合的可預期網絡技術體系,還在業(yè)界率先實現了RDMA低延遲網絡和智算集群網絡架構HPN 7.0等先進技術的廣泛應用。阿里巴巴也因此榮獲權威機構AMiner評選的全球十大最具影響力的網絡研究機構之一。

 
 
更多>同類內容
全站最新
熱門內容
本欄最新
 
智快科技微信賬號
微信群

微信掃一掃
加微信拉群
電動汽車群
科技數碼群