AWS re:Invent 2025 於拉斯維加斯踏入倒數第二日,AWS 公用運算高級副總裁 Peter DeSantis 以〈基礎設施創新〉為題發表演講,強調 AI 急速發展未改變雲端運算核心特質,反而令「安全性、可用性、彈性、成本與敏捷性」較以往更重要。
DeSantis 指出 AI 應用改變企業營運,對基礎設施要求亦前所未見。AI 工具令黑客效率更高,安全性須提升至首要位置;大型模型推論要求極高可用性,急增的 AI 工作負載令客戶期待如 Amazon S3 的彈性體驗。面對高昂訓練與推論成本,企業對「高性價比運算力」需求急升。
AWS 自研晶片策略核心源於早年解決虛擬化瓶頸的經驗。2010 年前後業界普遍認為虛擬化效能難以媲美裸機,但 AWS 透過將虛擬化功能拆解至硬件層,最終開發出 AWS Nitro 系統,完全解決效能不穩問題。Nitro 此後成為 AWS 自研晶片研發基石,成功案例更被納入《Computer Organization and Design》第七版,成為電腦科學教材一部分。
Nitro 成功帶來兩條重要自研產品線:針對通用運算的 AWS Graviton 系列,以及針對 AI 的 Amazon Trainium 系列。這些晶片讓 AWS 能在安全性、效能、成本等方面做到極致最佳化,支援企業級 AI 所需雲端基礎。
DeSantis 同場亦重點介紹 Amazon Nova 多模態嵌入模型及 Amazon S3 Vectors。Nova 模型將文字、圖像、影片與音訊映射至統一向量空間,Amazon S3 Vectors 直接將向量儲存能力整合至 S3,讓企業毋須改動數據架構,即可進行規模達數十億向量的語意搜尋。
影片 AI 公司 TwelveLabs 為典型案例,其影片理解模型基於 S3 Vectors,可直接在儲存影片的儲存桶寫入與存取向量,毋須複製或轉移數據,大幅降低成本並提升回應速度。
AI 專用晶片 Trainium 最新進展亦是全場焦點。Amazon EC2 Trn3 UltraServers 將 144 顆 Trainium3 晶片跨兩機櫃整合為單一 AI 超級電腦,提供高達 360 PFLOPS(FP8)強大運算力,吞吐量較前代提升 4.4 倍。Trainium3 亦首次在單一伺服器主機板整合 Nitro、Graviton 及 Trainium 三類自研晶片,整體設計目標為可維護性、彈性及自動化部署。
AWS 同時預告下一代 Amazon Trainium4 效能將再度躍升:FP4 運算能力提高 6 倍、記憶體頻寬提升 4 倍。
DeSantis 指出 AI 仍處於起步階段,但企業已需面對「模型更大、推論更快、數據更多」現實挑戰。AWS 持續加深從 Nitro、Graviton 到 Trainium 的基礎設施投資,目標是為企業移除所有技術限制,協助在 AI 時代安心發展。
他以一句招牌話語作結:「What will you build next?」——既是提問,亦是對所有創造者的邀請。