Google 最新發表 TurboQuant 記憶體壓縮技術,大幅降低人工智能運算所需硬件資源,觸發市場對儲存設備需求大減恐慌。美股儲存晶片類股股價周三應聲暴跌,惟多間華爾街投行看好效率提升將帶動更大規模應用,呼籲投資者趁機吸納。
Google 發表名為 TurboQuant 記憶體壓縮演算法,市場憂慮儲存硬件長期需求會大幅減少,觸發相關資產拋售潮。Google 團隊指出 TurboQuant 可在不影響準確度下,將大型語言模型執行時佔用快取記憶體減少最少 6 倍。開發團隊成功將鍵值快取無損壓縮至 3-bit,利用 Gemma 及 Mistral 等開源模型測試時,發現在 Nvidia H100 顯示卡上運作效能對比未量化 32-bit 方案最高提升 8 倍。目前人工智能軍備競賽極度依賴硬件規模擴張,任何削減實體記憶體採購量技術進步,均足以令估值偏高晶片類股面臨沉重沽壓。此項新技術將於下月 ICLR 2026 大會上正式發表。
美股儲存晶片類股周三集體下挫,SanDisk 股價一度大跌 6.5%,Micron 亦跌 4%,Western Digital 與 Seagate 分別跌逾 4% 及 5%。市場情緒尾市略為平復,SanDisk 及 Micron 收市均跌逾 3.4%,Seagate 收跌 2.6%,Western Digital 跌幅收窄至 1.6%。當日儲存晶片與硬件供應鏈指數收報 113.03 點,盤中曾低見 109 點。
投資機構從更長遠經濟學角度重新評估 TurboQuant 影響。Morgan Stanley 分析報告指出,TurboQuant 只作用於推理階段鍵值快取,完全不影響模型訓練任務,亦不影響模型權重佔用高頻寬記憶體(HBM)。Morgan Stanley 引用「傑文斯悖論」(Jevons Paradox)解釋,技術效率提升往往降低使用成本,從而激發更龐大總需求。TurboQuant 大幅降低單次查詢服務成本,能讓原本只能在雲端昂貴伺服器上運作模型遷移至本地,有效降低人工智能規模化部署門檻。投行總結效率提升將重塑人工智能部署成本曲線,對算力與記憶體硬件長期影響呈現「中性偏正面」訊號。
資料來源:Tom’s Hardware