亚洲精品无码AV人在线播放,亚洲精品国产精品,国产精品亚洲色婷婷99久久精品

Atlas 900 AI 訓練集群介紹

在大型數據集上進行訓練的神經網絡架構涵蓋從圖像識別、自然語言處理、視頻實時分析和智能推薦系統等各個方面，訓練這些神經網絡模型需要大量浮點計算能力。近年來單個AI處理器算力和訓練方法上均取得了重大進步，但是在單一機器上，AI訓練所需要的時間仍然長得不切實際，因此需要借助大規模分布式AI集群環境來提升神經網絡訓練系統的浮點計算能力。

此次發布的Atlas 900 AI訓練集群由數千顆昇騰910 AI處理器互聯構成，是當前全球最快的AI訓練集群，代表了當今全球的算力巔峰。其總算力達到256P~1024P FLOPS @FP16，相當于50萬臺PC的計算能力。

　Atlas 900 AI訓練集群領先技術優勢

AI算力業界領先

Atlas 900 AI訓練集群采用業界單芯片算力最強的昇騰910 AI處理器，每顆昇騰910 AI處理器內置32個達芬奇AI Core，單芯片提供比業界高一倍的算力(256TFLOPS@FP16)。Atlas 900 AI訓練集群將數千顆昇騰910 AI處理器互聯，打造業界第一的算力集群。

昇騰910 AI處理器采用SoC設計，集成“AI算力、通用算力、高速大帶寬I/O”，大幅度卸載Host CPU的數據預處理任務，充分提升訓練效率。

最佳集群網絡

Atlas 900 AI訓練集群采用“HCCS、 PCIe 4.0、100G以太”三類高速互聯方式，百TB全互聯無阻塞專屬參數同步網絡，降低網絡時延，梯度同步時延縮短10~70%。

在AI服務器內部，昇騰910 AI處理器之間通過HCCS高速總線互聯;昇騰910 AI處理器和CPU之間以最新的PCIe 4.0(速率16Gb/s)技術互聯，其速率是業界主流采用的PCIe 3.0(8.0Gb/s)技術的兩倍，使得數據傳輸更加快速和高效。在集群層面，采用面向數據中心的CloudEngine 8800系列交換機，提供單端口100Gbps的交換速率，將集群內的所有AI服務器接入高速交換網絡。

獨創iLossless 智能無損交換算法，對集群內的網絡流量進行實時的學習訓練，實現網絡0丟包與E2E μs級時延。

華為推出全球最快AI訓練集群！首次發布計算戰略華為AI訓練集群是什么？（3）