中國人工智能新創公司 DeepSeek 近日掀起城中熱話。據中國媒體報道,DeepSeek 在訓練大型語言模型時,選擇使用 NVIDIA 的 PTX,而非 CUDA。這項決策可視作 DeepSeek 為適配中國產 GPU 提前做準備,以降低對美國技術的依賴。
據《星島日報》報道,NVIDIA CUDA(統一運算架構,Compute Unified Device Architecture) 是高階運算框架,全球 AI 企業普遍採用 CUDA 訓練深度學習模型。由於 CUDA 高度依賴 NVIDIA GPU,讓 NVIDIA 在 AI 領域建立強勢的市場主導權,同時也限制其他 GPU 供應商的發展空間。
據《中央社》報道,DeepSeek 使用 NVIDIA H800 晶片訓練 AI 時,直接採用底層硬件指令語言 PTX (Parallel Thread Execution)編寫程式碼,令模型訓練時得以繞過 CUDA,減少對 NVIDIA 架構的依賴。據報導,DeepSeek 內部開發團隊精通 PTX 語言,能夠直接操作 GPU 的驅動層,進一步提升適配中國製作 GPU 能力。
若 DeepSeek 成功配合中國 GPU,將有助於擺脫對 NVIDIA 技術與硬件的依賴,同時讓中國 AI 建立更具自主性的硬件生態。業界分析認為,DeepSeek 一旦全面轉向國產 GPU,將影響 NVIDIA 在中國 AI 市場的競爭地位,甚至可能改變全球 AI 晶片產業的發展格局。中國北京航空航太大學副教授黃雷指,這項技術策略將使 DeepSeek 繞過 NVIDIA CUDA,根據 GPU 驅動函數發揮 GPU 計算潛能,並對 GPU 進行更加細微的操作。
圖片來源:Aaljazeera
資料來源:The News Lens、自由時報、星島日報
======
加入 unwire thread 傾傾科技背後黑暗事
========
相關文章:
DeepSeek 初心教學 + 懶人包 AI 人工智能幫你解決生活難題 豐田、三菱、軟銀禁員工使用 DeepSeek 擔憂數據安全問題 日產 N7 搭載 DeepSeek AI 技術 反攻中國市場
分享到 :
最新影片
