AWS re:Invent 2025 於拉斯維加斯踏入倒數第二日,AWS 公用運算高級副總裁 Peter DeSantis 以〈基礎設施創新〉為題發表演講,強調 AI 急速發展未改變雲端運算核心特質,反而令「安全性、可用性、彈性、成本與敏捷性」較以往更重要。
DeSantis 指出 AI 應用改變企業營運,對基礎設施要求亦前所未見。AI 工具令黑客效率更高,安全性須提升至首要位置;大型模型推論要求極高可用性,急增的 AI 工作負載令客戶期待如 Amazon S3 的彈性體驗。面對高昂訓練與推論成本,企業對「高性價比運算力」需求急升。
Nitro 開啟自研晶片之路 成經典教科書案例

AWS 自研晶片策略核心源於早年解決虛擬化瓶頸的經驗。2010 年前後業界普遍認為虛擬化效能難以媲美裸機,但 AWS 透過將虛擬化功能拆解至硬件層,最終開發出 AWS Nitro 系統,完全解決效能不穩問題。Nitro 此後成為 AWS 自研晶片研發基石,成功案例更被納入《Computer Organization and Design》第七版,成為電腦科學教材一部分。
Nitro 成功帶來兩條重要自研產品線:針對通用運算的 AWS Graviton 系列,以及針對 AI 的 Amazon Trainium 系列。這些晶片讓 AWS 能在安全性、效能、成本等方面做到極致最佳化,支援企業級 AI 所需雲端基礎。
向量成為新語言 S3 Vectors 開啟大規模語意搜尋
DeSantis 同場亦重點介紹 Amazon Nova 多模態嵌入模型及 Amazon S3 Vectors。Nova 模型將文字、圖像、影片與音訊映射至統一向量空間,Amazon S3 Vectors 直接將向量儲存能力整合至 S3,讓企業毋須改動數據架構,即可進行規模達數十億向量的語意搜尋。
影片 AI 公司 TwelveLabs 為典型案例,其影片理解模型基於 S3 Vectors,可直接在儲存影片的儲存桶寫入與存取向量,毋須複製或轉移數據,大幅降低成本並提升回應速度。
Trainium3 UltraServers:144 顆晶片構建 AI 超級電腦
AI 專用晶片 Trainium 最新進展亦是全場焦點。Amazon EC2 Trn3 UltraServers 將 144 顆 Trainium3 晶片跨兩機櫃整合為單一 AI 超級電腦,提供高達 360 PFLOPS(FP8)強大運算力,吞吐量較前代提升 4.4 倍。Trainium3 亦首次在單一伺服器主機板整合 Nitro、Graviton 及 Trainium 三類自研晶片,整體設計目標為可維護性、彈性及自動化部署。
AWS 同時預告下一代 Amazon Trainium4 效能將再度躍升:FP4 運算能力提高 6 倍、記憶體頻寬提升 4 倍。
總結:AI 基礎設施決定企業競爭力
DeSantis 指出 AI 仍處於起步階段,但企業已需面對「模型更大、推論更快、數據更多」現實挑戰。AWS 持續加深從 Nitro、Graviton 到 Trainium 的基礎設施投資,目標是為企業移除所有技術限制,協助在 AI 時代安心發展。
他以一句招牌話語作結:「What will you build next?」——既是提問,亦是對所有創造者的邀請。
分享到 :
最新影片