華為於 3 月 21 日在華為中國合作夥伴大會 2026 推出搭載昇騰 950PR(Ascend 950PR)處理器的 AI 訓練推理加速卡 Atlas 350。單卡算力達 Nvidia H20 的 2.87 倍,屬中國目前唯一支援 FP4 低精度的推理產品。

華為昇騰計算業務總裁張迪煊介紹,Atlas 350 的 FP4 精度算力達 1.56 PFLOPS,互聯頻寬達 1.4TB/s,功耗 600W,為 H20 的 1.5 倍。晶片採用華為自研 HBM,容量 112GB,為 H20 的 1.16 倍,多模態生成速度提升 60%。
記憶體存取效率提升
昇騰 950PR 將記憶體存取顆粒度從 512 位元組縮減至 128 位元組,小算子存取效率提升 4 倍。Atlas 350 除支援 FP16、FP8 外,新增對 FP4 低精度格式的支援,令整合 Atlas 350 的伺服器能夠處理更大規模模型並實現更低延遲的推理。精度降低後,計算速度更快,暫存器效率亦隨之提升。
三大算力場景
華為副總裁、ICT 產品組合管理與解決方案部總裁馬海旭在大會上宣布推出 Atlas 350。張迪煊表示,基於 Atlas 350 等產品,昇騰將建立大、中、小三大算力場景,協助合作夥伴滿足不同行業的差異化智能化需求。
資料來源:快科技
分享到 :
最新影片