中國 AI DeepSeek 號稱超越 OpenAI o1 具備推理能力、能輸出「AI 思考過程」

2024-11-23

Published by

Lawton

中國 AI 公司 DeepSeek 宣佈推出全新推理人工智能模型 DeepSeek-R1-Lite-Preview，聲稱其性能媲美甚至超越 OpenAI 的 o1-preview 模型。該模型主攻「推理」能力，具備規劃思路與逐步解決問題的功能，並計劃將其程式碼開放源碼。

DeepSeek-R1-Lite-Preview 模型專注於模仿人類思考過程，根據問題逐步構建推理鏈條，並詳細解釋答案背後邏輯。與 OpenAI 的 o1-preview 類似，該模型需要更多時間處理複雜問題，但能提供更可靠的結果。DeepSeek 表示，其模型在兩大 AI 基準測試 AIME 和 MATH 上取得與 o1-preview 相若的成績。其中，AIME 測試透過其他 AI 模型評估性能，MATH 則是解決複雜文字數學題目。

但該模型仍存不足。有評論指出，DeepSeek-R1 於某些邏輯遊戲（如井字棋）表現欠佳，亦容易被用戶繞過安全限制。此外模型拒絕回答有政治敏感性的問題。外媒 TechCrunch 就對部份問題進行測試，均獲得「抱歉，未能思考此類問題」的回覆。

DeepSeek 與其他推理模型如 OpenAI 的 o1-preview 一樣，採用「測試期運算」技術（test-time compute）。此技術為模型提供額外運算資源處理任務，擺脫單純依賴更多數據與計算資源提升性能的限制。Microsoft CEO 納德拉亦表示，這類推理模型展示了新的 AI 擴展潛力。

DeepSeek 背後的高飛資本管理公司（High-Flyer Capital Management）是中國一家依賴 AI 技術進行量化交易的對沖基金。該公司投入10,000台 Nvidia A100 GPU、價值約1億日元（約港幣7.8億元），建立伺服器集群進行訓練。DeepSeek 計劃開放 R1-Lite-Preview 的程式碼及 API，冀能吸引更多開發者參與。

資料來源：TechCrunch