系統級調優
Atlas 900 AI訓練集群通過華為集合通信庫和作業調度平臺,整合HCCS、 PCIe 4.0 和100G RoCE三種高速接口,充分釋放昇騰910 AI處理器的強大性能。
華為集合通信庫提供訓練網絡所需的分布式并行庫,通信庫+網絡拓撲+訓練算法進行系統級調優,實現集群線性度>80%,極大提升了作業調度效率。
極致散熱系統
傳統數據中心多以風冷技術對設備進行散熱,但在人工智能時代傳統數據中心卻面臨非常大的挑戰。高功耗器件比如CPU和AI芯片帶來更大的熱島效應要求更高效的冷卻方式。液冷技術可以滿足數據中心高功率、高密部署、低PUE的超高需求。
Atlas 900 AI訓練集群采用全液冷方案,創新性設計業界最強柜級密閉絕熱技術,支撐>95%液冷占比。單機柜支持高達50kW超高散熱功耗,實現PUE
另外,在空間節省方面,與8kW風冷機柜相比,節省機房空間79%。極致的液冷散熱技術滿足了高功率、高密設備部署、低PUE的需求,極大地降低了客戶的TCO。
Atlas 900AI訓練集群領先的Benchmark指標
華為已在華為云上部署了一個Atlas 900 AI訓練集群,集群規模為1024顆昇騰910 AI處理器。基于當前最典型的ResNet-50 v1.5模型”和“ ImageNet-1k數據集”,Atlas 900AI訓練集群只需59.8秒就可完成訓練,排名全球第一。
“ ImageNet-1k數據集”包含128萬張圖片,精度為75.9%,在同等精度下,其他兩家業界主流廠家測試成績分別是70.2s和76.8s,Atlas 900 AI訓練集群比第2名快15%。
Atlas 900 AI 集群適用場景
Atlas 900 AI集群主要為大型數據集神經網絡訓練提供超強算力,可廣泛應用于科學研究與商業創新,讓研究人員更快地進行圖像、視頻和語音等AI模型訓練,讓人類更高效地探索宇宙奧秘、預測天氣、勘探石油和加速自動駕駛的商用進程。
Atlas 900 AI集群也可以提供云服務,以云的方式提供充裕的、經濟的算力資源,簡單易用、高效率、全流程的AI平臺,為客戶帶來極致體驗的“易獲取、用得起、方便用”的普惠AI算力。
責任編輯:楊林宇
特別聲明:本網登載內容出于更直觀傳遞信息之目的。該內容版權歸原作者所有,并不代表本網贊同其觀點和對其真實性負責。如該內容涉及任何第三方合法權利,請及時與ts@hxnews.com聯系或者請點擊右側投訴按鈕,我們會及時反饋并處理完畢。
- 華為“企業智慧屏”曝光,可連接電腦和手機2020-02-21
- 華為回應美司法部提起新訴訟:新指控缺乏依據2020-02-14
- 華為手機新設計專利曝光:后置“X”五攝2020-01-21
- 最新科技前沿 頻道推薦
-
CETV4課堂怎么回看直播 CETV4課堂直播回看教2020-02-24
- 進入圖片頻道最新圖文
- 進入視頻頻道最新視頻


已有0人發表了評論