歐洲時尚電商 Zalando 透過遷移至 Amazon Redshift,重塑其 Fast-Serving Layer 數據倉庫架構,實現可擴展、高效且具成本效益的分析平台。此舉除了提升運算表現及大幅降低營運成本,也為公司長遠數據策略奠下基礎。
Zalando 於 2008 年成立,最初只是柏林一間專售鞋履的初創公司。短短 10 多年後,業務已擴展至 27 個市場,服務超過 5,200 萬名活躍客戶,年商品交易總額(GMV)超過 140 億歐元(約港幣 1,092 億元)。
Zalando 現時已非單純的電商企業,而是一家以科技為核心的時尚平台。公司深知「時尚規模化」離不開數據支援,數據除了輔助業務,亦推動決策與創新。
Zalando 數據平台規模龐大,擁有逾 20 PB 數據湖,支援個人化尺寸建議、動態定價、需求預測、行銷分析及詐騙偵測等多個 AI 應用程式。
平台由 350 個分散團隊維護,並供超過 6,000 名用戶使用,覆蓋公司 80% 員工。作為自助式平台,它提供 SQL 分析、任務編排、數據探索及品質監控,讓各團隊自主構建數據產品。
規模龐大也意味系統需要進一步現代化,包括提升數據載入效率、具備動態擴展能力及建立可持續的運算基礎設施。
Zalando 的 Fast-Serving Layer 為關鍵數據倉庫,支撐超過 3,000 名分析師及業務人員日常決策。然而舊系統基於單體架構,必須為高峰負載預留容量,例如週一早上的集中運算時段,導致 80% 時間閒置。
過度配置運算資源每月造成逾 3 萬美元(約港幣 23.4 萬元)閒置成本。同時系統並發限制導致查詢延遲及報表中斷;缺乏自動擴展及工作負載隔離能力,也加劇維護負擔,尤其在「黑色星期五」等高峰期風險更大。
為追求成本效益與擴展性,Zalando 選擇以「簡化遷移」(lift-and-shift)方式將 Fast-Serving Layer 遷移至 Amazon Redshift,以測試自動擴展與高並發性能否滿足企業需要,並與現有數據平台整合。
測試結果顯示 Redshift 效能提升達 3 至 5 倍,86% 查詢速度變得更快,短查詢 SLA 達標率高達 100%。同時 Redshift 自動表格最佳化與物化檢視功能,減少團隊手動改良的負擔,大幅提高生產效率。
架構方面 Redshift 透過 Data Sharing 支援工作負載隔離,實現 ETL(資料轉換)與報表分析分離,並無縫整合 Spark 等工具;安全層面則具備端對端加密、稽核及列級與欄級權限控制。
Zalando 採取穩健的 3 步驟遷移模式:
Zalando 於 2024 年 10 月 30 日完成主要轉換,將 80% 分析報表遷移至 Redshift,確保 Cyber Week 高峰期穩定運作,並節省大量授權費用。
效能提升重點包括:
營運穩定性亦顯著改善。報表超時現象幾乎消失,Cyber Week 高峰運行順暢,資料載入延遲問題大幅減少。
實施過程中 Zalando 與 AWS 緊密合作,針對 Redshift 多倉庫架構的自動化最佳化挑戰,採用每日 VACUUM 修復及分配策略(KEY、EVEN、ALL 分佈),有效解決資料傾斜問題。
查詢層面則將重用頻繁的 CTE 轉化為物化檢視或臨時表,以減少重算;資料定義層面則明確限制 VARCHAR 長度以最佳化記憶體使用,減少 disk spill 情況,反映精準定義對效能的影響。
展望未來 Zalando 正推動 Serverless 倉庫架構,以應對業務高峰與專案需求自動水平擴展。公司亦引入 AWS Lake Formation 進行集中式資料治理,確保細緻安全管控,同時培養 FinOps 文化,讓各數據團隊透過成本可視化工具,主動最佳化支出與價值對應。
Zalando 遷移至 Amazon Redshift 後,成功將數據平台轉型為高效、靈活且具成本效益的現代架構。此舉顯著提升查詢效能與穩定性並降低營運風險,為其成為歐洲領先的數據驅動時尚科技企業奠下新基礎。