Amazon Web Services (AWS) 再次擴展其生成式人工智能方案,正式引入中國初創公司 DeepSeek 的最新 AI 模型 DeepSeek-R1 系列,現已可在 AWS Bedrock 和 Amazon SageMaker AI 上部署。
DeepSeek-R1 系列模型於 2025 年 1 月 20 日發佈,包括 DeepSeek-R1 和 DeepSeek-R1-Zero,具備高達 6710 億參數 (671B),並推出多款經過蒸餾的小型化模型(DeepSeek-R1-Distill),參數規模從 15 億 (15B)到 700 億 (700B)不等。這些模型以其卓越的推理能力而聞名,得益於創新的強化學習(RL)訓練技術,能夠以更低的成本提供媲美 OpenAI 和其他商業模型的性能。
DeepSeek-R1 的核心亮點:
AWS 提供了多種方式來部署 DeepSeek-R1 模型,滿足不同類型用戶的需求:
1. Amazon Bedrock Marketplace
AWS Bedrock 是一個無需管理基礎設施 (Serverless)的服務,DeepSeek-R1 模型現已上架 Bedrock Marketplace,用戶可直接透過 API 快速整合至應用程式中。
2. 深度蒸餾模型的靈活選擇
DeepSeek-R1-Distill 模型(基於 Llama 和 Qwen 訓練)現已支援透過 Amazon Bedrock Custom Model Import 功能進行部署。這些模型結合了大模型的卓越推理能力與小模型的高效性,適合需要更低延遲和更高性價比的應用場景。同時,這些蒸餾模型為客戶提供了更多選擇,尤其是那些對成本和性能需求敏感、不需要大模型的企業用戶,能以更經濟的方式滿足實際業務需求。
無論是大型模型還是小型蒸餾模型,DeepSeek-R1 系列均能根據客戶的不同需求靈活部署,幫助企業在生成式 AI 中找到最合適的解決方案。
3. Amazon SageMaker JumpStart
SageMaker JumpStart 是 AWS 的機器學習中心,用戶可以快速部署 DeepSeek-R1 至 SageMaker 平台。
4. AWS Trainium 和 Inferentia 的高性價比部署
使用 AWS 的 Trainium 和 Inferentia 晶片,用戶可以在 Amazon EC2 上運行 DeepSeek-R1-Distill 模型,進一步降低運行成本,同時保持高性能。
DeepSeek-R1 系列模型的引入,為希望探索生成式 AI 應用的企業帶來了更多選擇。無論是快速測試創新點子,還是大規模推動生成式 AI 解決方案落地,AWS 提供的全方位工具和 DeepSeek-R1 的強大性能,都能助您輕鬆實現目標。
如欲了解更多有關 DeepSeek-R1 模型的資訊及部署方式,請瀏覽 AWS 官方網站 或 Amazon Bedrock 頁面。