• <li id="00i08"><input id="00i08"></input></li>
  • <sup id="00i08"><tbody id="00i08"></tbody></sup>
    <abbr id="00i08"></abbr>
  • 新聞中心

    EEPW首頁 > 智能計算 > 業界動態 > 華為首次線下展出昇騰384超節點

    華為首次線下展出昇騰384超節點

    作者: 時間:2025-07-29 來源: 收藏

    7月26日,2025世界人工智能大會(WAIC)在上海世博中心啟幕,首次線下展出超節點,即Atlas 900 A3 SuperPoD。具體性能上,超節點單集群BF16稠密算力300PFLOPs,約為英偉達GB200 NVL72的1.7倍。

    640-4.jpeg

    據介紹,該產品基于超節點架構,采用全對等(Peer-to-Peer)UB總線,將384顆NPU+192顆CPU通過無阻塞Clos架構互聯,單跳時延<200ns,帶寬392GB/s,比傳統RoCE提升15倍。3168根光纖+6912個400G光模塊實現百納秒級互聯,支持2m以上長距部署,突破了銅纜距離限制。

    這些大帶寬低時延互聯技術,解決了超節點集群內計算、存儲等各資源之間的通信瓶頸,通過系統工程的優化,實現資源的高效調度 —— 能效比(MFU)從行業平均30%提升到45%以上,已用于訓練7180億參數的盤古Ultra MoE大模型。

    值得一提的是,在今年5月的昇騰開發者大會上,推出了昇騰超節點( 384),成功實現業界最大規模的384卡高速總線互聯。表示 384超節點算力集群可實現業界最大單卡推理吞吐量2300Tokens/s,業界最大集群算力6萬卡。

    640-5.jpeg

    據國際知名半導體研究和咨詢機構SemiAnalysis披露,華為云CM384基于384顆昇騰芯片構建,通過全互連拓撲架構實現芯片間高效協同,可提供高達300PFLOPs的密集BF16算力,接近達到英偉達GB200 NVL72系統的兩倍。此外,CM384在內存容量和帶寬方面同樣占據優勢,總內存容量超出英偉達方案3.6倍,內存帶寬也達到2.1倍,為大規模AI訓練和推理提供了更高效的硬件支持。華為云表示,新一代昇騰AI云服務,是最適合大模型應用的算力服務。

    華為云最新推出的AI算力集群解決方案 384憑借其顛覆性的系統架構設計與全棧技術創新,在多項關鍵指標上實現對英偉達旗艦產品GB200 NVL72的超越,標志著中國在人工智能基礎設施領域實現里程碑式突破。SemiAnalysis還特別指出,華為的規?;鉀Q方案“領先于英偉達和AMD目前市場上的產品一代”,并認為中國在AI基礎設施上的突破將對全球AI產業格局產生深遠影響。


    評論


    相關推薦

    技術專區

    關閉
    主站蜘蛛池模板: 布尔津县| 远安县| 麦盖提县| 纳雍县| 崇礼县| 天台县| 尉氏县| 宜城市| 安溪县| 利辛县| 理塘县| 黄骅市| 泰兴市| 兴安县| 阳春市| 连平县| 会同县| 梁山县| 铜梁县| 松江区| 卓尼县| 万宁市| 商丘市| 高安市| 宁夏| 崇礼县| 新津县| 吉林省| 精河县| 葫芦岛市| 同心县| 丘北县| 小金县| 云林县| 和龙市| 沅陵县| 禹城市| 贞丰县| 玉环县| 太原市| 河间市|