GenAI 與雲端科技專區

AWS 推動 AI 創新 re:Invent 大會宣佈數據中心效能重大升級

Published by
藍骨

AWS 2024 年度 re:Invent 會議在美國拉斯維加斯舉行,席間隆重宣佈數據中心組件將會升級,結合了電源、冷卻和硬件設計方面的創新,令可用性和效率都大大提升。大會宣佈的新數據中心組件,旨在支援新一代 AI 創新和客戶與日俱增的需求。AWS 基礎設施服務副總裁 Prasad Kalyanaraman表示:「這些數據中心功能代表著進一步提高能源效率和靈活支援新興工作負載。」

設計改進減低故障機會 同時減低耗電

時至今日,AWS 的數據中心支援全球數百萬活躍客戶,包括使用 AWS AI 和機器學習服務的客戶。AWS 數據中心正支援更高的功率密度,以應付需求。而數據中心設計改進包括簡化電力分配和機械系統,使基礎設施可用性達到 99.9%。系統經簡化後,機架可因電力問題受影響的機會便減少了 89%。

數據中心的電力在到達 IT 設備之前要經過多次轉換和分配系統,每個步驟都自然有機會故障。新設計簡化了電力分配,從而將潛在故障點的數量減少了 20%。簡化又包括將備用電源帶到機架附近,減少使用散熱風扇。AWS 利用自然壓力差來排出熱量,改善了可用於伺服器的電量。以上變化都有助減少耗電,同時最小化故障風險。

冷卻技術、硬件與機架全面提升 支援更高密度 AI 工作負載

AWS 建立了一系列新的和增強的功能,為客戶提供最高性能、可用性和能源效率的基礎設施。當中包括液體冷卻技術,新一代 AI 服務器受益於液體冷卻,以更有效地冷卻高密度運算晶片。AWS 開發了創新的機械冷卻解決方案,在新建和現有數據中心中提供可配置的液體到晶片冷卻。某些 AWS 技術利用無需液體冷卻的網絡和儲存基礎設施,因此更新的冷卻系統將無縫結合空氣和液體冷卻功能,以滿足最強大的 AI 晶片組(如 AWS Trainium2)以及 AWS 的網絡交換機和儲存伺服器的需求。這種靈活的多模式冷卻設計令 AWS 能以最低成本提供最大的性能和效率,加快 AI 工作負載的上市時間。

AWS 又透過改善機架在數據中心的位置來提升功率使用,減少閒置電力。這種設計為 AI 工作負載提供所需的新一代硬件和高密度機架。此外,AWS 還改善了電源傳輸系統,令未來兩年內支援機架功率密度增加 6 倍,並在未來再增加 3 倍。部分得益於新的電源架,它能夠有效地將數據中心電力傳遍整個機架,減少電力轉換損失。這些創新使 AWS 能夠為客戶工作負載提供再多 12% 的運算能力,同時減少實現相同運算能力所需的數據中心數量。

數據中心重視可持續性 減低環境足跡

據研究估計,AWS 的基礎設施目前的效率最高可達自建基礎設施的 4.1 倍,當工作負載在 AWS 上得到改善時,相關碳足跡可減少高達 99%。AWS 的新組件在能源效率和可持續性都有所提升,包括更高效的冷卻系統,在每兆瓦用水量不增加的情況下,機械能源消耗減少高達 46%。另外,AWS 採用了低碳鋼和混凝土,並改善結構設計以減少使用鋼材。這使數據中心建築物外殼混凝土中的隱含碳,與行業平均水平相比減少高達 35%。同時,數據中心的備用發電機將能夠使用可再生柴油,相比化石柴油,其全生命週期的溫室氣體排放量可減少高達 90%。AWS 亦已開始在歐美現有數據中心的備用發電機轉用可再生柴油。

新數據中心組件將在全球範圍內擴展到 AWS 的所有基礎設施。預計於 2025 年初,美國將率先建設具有完整組件套件的新 AWS 數據中心。


相關文章:
  • AWS 使 AI 使用門檻大幅下降 企業採用 Amazon Bedrock 節省 90% 開支
  • AWS re:Invent 2024 重點解析 AWS 科技夢想藍圖 從超級電腦到平民化 AI
  • Apple 選擇 AWS 客製化 AI 加速器 押注 AI 晶片新佈局

  • Published by
    藍骨