華為常務董事兼華為雲 CEO 張平安近日公開挑戰業界對晶片製程的傳統認知,明確表示 5 納米、7 納米製程並非核心要素,重點在於為客戶提供優質計算結果。他在華為全聯接大會 2025 上宣布,華為雲服務算力效能已突破技術瓶頸,生產效率達到 NVIDIA H20 晶片的 3 倍。
技術突破與性能表現
張平安發布的 CloudMatrix384 超級節點系統實現全資源池化,將運算、記憶體和儲存資源完全整合,將串行任務轉換為分散式並行處理,大幅提升系統推理性能。該系統在 50 毫秒時延條件下,單卡每秒可生成 2,400 個 token,在網上、近線和離線推理場景中,平均每卡推理性能達到 H20 的 3 至 4 倍。
昇騰雲服務的 AI Token Service 已成功適配盤古大模型、DeepSeek、Kimi 等多個第三方模型,為企業提供即時可用的 AI 運算能力。張平安表示,華為期望所有大模型在昇騰雲上都能跑得更快更好,透過技術創新讓用戶以最高效方式使用推理運算能力。
市場地位與競爭格局
根據 Canalys 最新數據,華為雲在 2025 年第 1 季中國雲服務市場排名第二,市場佔有率達到 18%,按年增長 18%。阿里雲仍以 33% 市佔率領跑市場,但華為雲正穩步縮小差距。值得注意的是,阿里雲 AI 相關工作負載已連續 7 個季度實現三位數增長,成為其雲業務核心引擎。
全球 AI 算力部署挑戰
張平安指出,中國「算力黑土地」正成為全球 AI 算力中心,但海外市場面臨基礎設施挑戰。他發現中國大陸智能計算中心普遍採用液冷技術,而海外液冷資料中心仍較罕見。若要改造海外資料中心,除了耗時較長,光纖網絡頻寬也難以滿足需求。
華為雲已在貴州、內蒙古和安徽部署全液冷 AI 資料中心,支援每機櫃 80kW 散熱,將電源使用效率(PUE)降至 1.1,並提供 AI 智能化營運管理。企業只需一對光纖連接,便可存取高效 AI 運算和全棧專屬 AI 雲服務。
客戶增長與未來投資
數據顯示,使用華為雲 AI 運算服務的全球客戶數量從 2024 年的 321 家增長至 2025 年的 1,805 家,增幅達 462%。張平安表示,華為雲將持續加大對 AI 和運算領域的資源投入,培育各行業應用順暢運行的沃土,協助每位客戶成為所屬行業的 AI 先鋒。
盤古模型已應用於 30 多個行業的 500 多個場景,重新定義各行業可能性。華為雲將繼續增加對盤古模型的投資,深入研究行業場景以更好理解客戶需求,支援客戶開發專屬行業模型。
資料來源:ETToday
分享到 :
最新影片
