DeepSeek-R1 模型現已登陸 AWS Bedrock　帶來深度學習新突破

2025-02-19

Published by

藍骨

Amazon Web Services (AWS) 再次擴展其生成式人工智能方案，正式引入中國初創公司 DeepSeek 的最新 AI 模型 DeepSeek-R1 系列，現已可在 AWS Bedrock 和 Amazon SageMaker AI 上部署。

DeepSeek-R1：生成式 AI 的新里程碑

DeepSeek-R1 系列模型於 2025 年 1 月 20 日發佈，包括 DeepSeek-R1 和 DeepSeek-R1-Zero，具備高達 6710 億參數 (671B)，並推出多款經過蒸餾的小型化模型（DeepSeek-R1-Distill），參數規模從 15 億 (15B)到 700 億 (700B)不等。這些模型以其卓越的推理能力而聞名，得益於創新的強化學習（RL）訓練技術，能夠以更低的成本提供媲美 OpenAI 和其他商業模型的性能。

DeepSeek-R1 的核心亮點：

強化學習突破：DeepSeek-R1-Zero 是首個完全基於強化學習而非監督微調（SFT）訓練的模型，實現了自我驗證（self-verification）及長鏈推理（long chain-of-thought, CoT）能力。
多樣化用途：無論是數學推理、代碼生成還是通用推理，DeepSeek-R1 都在多項基準測試中表現卓越，甚至超越了許多行業領先模型。
高性價比與靈活性：DeepSeek 模型的成本僅為同類商業模型的 5–10%，適合需要有效控制開支的企業。

AWS Bedrock 與 SageMaker AI：靈活部署 DeepSeek-R1

AWS 提供了多種方式來部署 DeepSeek-R1 模型，滿足不同類型用戶的需求：

1. Amazon Bedrock Marketplace

AWS Bedrock 是一個無需管理基礎設施 (Serverless)的服務，DeepSeek-R1 模型現已上架 Bedrock Marketplace，用戶可直接透過 API 快速整合至應用程式中。

簡單便捷：用戶只需在 Bedrock 控制台中選擇 DeepSeek-R1，配置端點名稱與實例類型，即可部署模型。
安全可靠：透過 Bedrock Guardrails 等工具，用戶可以過濾不良內容，保證生成式 AI 的安全性與合規性。
即時測試：用戶可使用 Bedrock Playground 測試模型輸出，最佳化提示語設計，從而獲得最佳效果。

2. 深度蒸餾模型的靈活選擇

DeepSeek-R1-Distill 模型（基於 Llama 和 Qwen 訓練）現已支援透過 Amazon Bedrock Custom Model Import 功能進行部署。這些模型結合了大模型的卓越推理能力與小模型的高效性，適合需要更低延遲和更高性價比的應用場景。同時，這些蒸餾模型為客戶提供了更多選擇，尤其是那些對成本和性能需求敏感、不需要大模型的企業用戶，能以更經濟的方式滿足實際業務需求。

無論是大型模型還是小型蒸餾模型，DeepSeek-R1 系列均能根據客戶的不同需求靈活部署，幫助企業在生成式 AI 中找到最合適的解決方案。

3. Amazon SageMaker JumpStart

SageMaker JumpStart 是 AWS 的機器學習中心，用戶可以快速部署 DeepSeek-R1 至 SageMaker 平台。