Atlas 900 AI 訓練集群介紹
在大型數據集上進行訓練的神經網絡架構涵蓋從圖像識別、自然語言處理、視頻實時分析和智能推薦系統等各個方面,訓練這些神經網絡模型需要大量浮點計算能力。近年來單個AI處理器算力和訓練方法上均取得了重大進步,但是在單一機器上,AI訓練所需要的時間仍然長得不切實際,因此需要借助大規模分布式AI集群環境來提升神經網絡訓練系統的浮點計算能力。
此次發布的Atlas 900 AI訓練集群由數千顆昇騰910 AI處理器互聯構成,是當前全球最快的AI訓練集群,代表了當今全球的算力巔峰。其總算力達到256P~1024P FLOPS @FP16,相當于50萬臺PC的計算能力。
Atlas 900 AI訓練集群領先技術優勢
AI算力業界領先
Atlas 900 AI訓練集群采用業界單芯片算力最強的昇騰910 AI處理器,每顆昇騰910 AI處理器內置32個達芬奇AI Core,單芯片提供比業界高一倍的算力(256TFLOPS@FP16)。Atlas 900 AI訓練集群將數千顆昇騰910 AI處理器互聯,打造業界第一的算力集群。
昇騰910 AI處理器采用SoC設計,集成“AI算力、通用算力、高速大帶寬I/O”,大幅度卸載Host CPU的數據預處理任務,充分提升訓練效率。
最佳集群網絡
Atlas 900 AI訓練集群采用“HCCS、 PCIe 4.0、100G以太”三類高速互聯方式,百TB全互聯無阻塞專屬參數同步網絡,降低網絡時延,梯度同步時延縮短10~70%。
在AI服務器內部,昇騰910 AI處理器之間通過HCCS高速總線互聯;昇騰910 AI處理器和CPU之間以最新的PCIe 4.0(速率16Gb/s)技術互聯,其速率是業界主流采用的PCIe 3.0(8.0Gb/s)技術的兩倍,使得數據傳輸更加快速和高效。在集群層面,采用面向數據中心的CloudEngine 8800系列交換機,提供單端口100Gbps的交換速率,將集群內的所有AI服務器接入高速交換網絡。
獨創iLossless 智能無損交換算法,對集群內的網絡流量進行實時的學習訓練,實現網絡0丟包與E2E μs級時延。
責任編輯:楊林宇
特別聲明:本網登載內容出于更直觀傳遞信息之目的。該內容版權歸原作者所有,并不代表本網贊同其觀點和對其真實性負責。如該內容涉及任何第三方合法權利,請及時與ts@hxnews.com聯系或者請點擊右側投訴按鈕,我們會及時反饋并處理完畢。
- 華為“企業智慧屏”曝光,可連接電腦和手機2020-02-21
- 華為回應美司法部提起新訴訟:新指控缺乏依據2020-02-14
- 華為手機新設計專利曝光:后置“X”五攝2020-01-21
- 最新科技前沿 頻道推薦
-
CETV4課堂怎么回看直播 CETV4課堂直播回看教2020-02-24
- 進入圖片頻道最新圖文
- 進入視頻頻道最新視頻


已有0人發表了評論