中國批准首批 Nvidia H200 人工智能晶片進口,涉及數十萬顆晶片,外媒指中國政府正平衡人工智能需求與扶持國內半導體產業的政策轉變。2 名知情人士向 《路透社》透露,這次批准在 Nvidia 行政總裁黃仁勳本周訪華期間落實,基於事件敏感性而要求匿名。
首批配額分配
消息人士指出首批獲批 H200 晶片主要分配予 3 家中國大型互聯網公司,其他企業現正排隊等候後續批次的審批。消息人士拒絕透露獲得首批清關許可的企業名稱。中國工業和信息化部以及 Nvidia 在發稿時尚未回應。
黃仁勳於 1 月 23 日抵達上海,首站前往 Nvidia 位於張江新辦公室與員工會面並回答提問,同時檢視公司 2025 年重要發展。他其後前往北京及其他城市,出席 Nvidia 中國員工例行年度慶祝活動。
中美關係焦點
H200 是 Nvidia 第二強大人工智能晶片,已成為中美關係主要爆發點。雖然中國企業需求強勁且美國已批准出口,但北京遲疑批准進口一直是出貨主要障礙。美國於本月初正式為 Nvidia 向中國銷售 H200 掃除障礙,當地企業對此展現強烈興趣。然而中國當局擁有最終決定權,決定是否允許晶片運入境內。
近幾周尚不清楚北京會否批准,因為政府期望在滿足國內先進人工智能晶片激增需求與培育國內半導體產業之間取得平衡。中國海關當局早前曾告知代理商 H200 晶片不獲准進入中國。但中國科技企業已訂購超過 200 萬顆 H200 晶片,遠超 Nvidia 可用庫存。
市場需求與競爭
業界分析預計 2026 年中國國內人工智能晶片總需求將達約 400 萬顆,而中國企業提交的 H200 晶片採購申請總計約 140 萬至 150 萬顆。專家估計實際供應配額較為保守,樂觀預計可達 40 萬至 50 萬顆。H200 預計佔總需求 10% 至 13%,其餘由國內供應商晶片組成。
H200 性能約為 Nvidia H20 晶片 6 倍。H20 曾是 Nvidia 獲准向中國銷售的最先進人工智能晶片。雖然華為等中國企業現已推出性能媲美 H20 產品,但仍遠遠落後於 H200。華為 Ascend 920 晶片採用 6nm 製程技術,預計提供每張卡超過 900 TFLOPS 性能,並配備 HBM3 記憶體模組提供 4TB/s 記憶體頻寬。
H200 採用 HBM3e 記憶體技術,提供 141GB 記憶體容量及 4.8TB/s 頻寬,較 H100 記憶體容量多 76%,頻寬高 43%。在大型語言模型基準測試中,H200 在 Llama2-70B 模型上達到每秒 31,712 個標記,而 H100 為每秒 21,806 個標記,改良幅度約 45%。
政策平衡考量
這批批准顯示北京正優先考慮中國大型互聯網公司需求,這些企業正投入數十億美元(約港幣 78 億元以上)建設數據中心,以開發人工智能服務並與包括 OpenAI 在內的美國競爭對手競爭。國內供應商方面,華為 Ascend、寒武紀及海光預計合共出貨 160 萬至 170 萬顆晶片,而其他供應商將合共出貨少於 200 萬顆。
《路透社》早前報道,北京曾討論要求企業購買一定配額國內晶片,作為獲批進口外國半導體條件。目前尚不確定有多少額外企業將在後續批次中獲得批准,或北京使用甚麼標準來確定資格。
資料來源:Reuters
分享到 :
最新影片