OpenAI 發布了名為 GPT-OSS 的開源模型,這是該公司自 2019 年 GPT-2 以來首個開放權重模型。該模型提供兩個版本:1200 億參數的 gpt-oss-120b 和 200 億參數的 gpt-oss-20b,較大版本可在單個 Nvidia GPU 上運行,性能與現有 o4-mini 模型相近;較小版本僅需 16GB 記憶體即可運行,性能與 o3-mini 相當。兩個版本均採用 Apache 2.0 授權,允許商業用途修改,並可在 Hugging Face 等平台免費下載。
策略轉向開源競爭 回應中國 DeepSeek 挑戰
OpenAI 行政總裁 Sam Altman 早前承認公司在開源模型方面「站錯了歷史一邊」,特別是在中國初創企業 DeepSeek 今年初發布成本低廉的開源模型震驚矽谷後。Altman 明確表示希望開源模型創新在美國進行,並強調這些模型「基於民主價值觀,免費提供給所有人使用」。聯合創辦人 Greg Brockman 將此次發布視為現有付費服務的「補充」,而非競爭。
採用思維鏈推理 支援多項功能
GPT-OSS 模型採用 OpenAI 去年秋季在 o1 模型中首次部署的思維鏈推理方法,透過多個步驟來回答提示。這些純文字模型雖非多模態,但支援網頁瀏覽、呼叫雲端模型協助任務、執行程式碼及作為 AI 代理程式操作軟件。與 ChatGPT 不同,GPT-OSS 可在無網絡連接及防火牆後運行。
史上最嚴格安全測試 降低濫用風險
由於開放權重模型移除了使用門檻,任何人都可嘗試微調模型作不當用途,OpenAI 為此進行了史上最嚴格的安全測試。安全研究員 Eric Wallace 表示,團隊內部對模型在風險領域進行微調測試,並測量可達到的風險程度。根據 OpenAI 的準備框架評估,開放權重模型未達到高風險水平。模型會顯示「思維鏈」過程,讓用戶監察模型行為、欺騙和濫用情況。
效能媲美專有模型 挑戰 Meta 領導地位
研究員 Chris Koch 表示,gpt-oss-120b 的表現與 OpenAI 專有的 o3 和 o4-mini 模型相近,在某些評估中甚至表現更佳。此次發布對目前開源領域領導者 Meta 構成挑戰。Meta 自 2023 年推出首個 Llama 系列模型,最近發布的 Llama 4 仍是市場主流。然而,Mark Zuckerberg 曾暗示公司可能因安全考慮而在未來模型中放棄開源策略。
人才爭奪戰升級 行業競爭加劇
此次發布正值 OpenAI 與 Meta 等公司在 AI 人才爭奪戰持續升級之際。2025 年,具備高需求技能的 AI 研究員正收到天價轉職offer。OpenAI 的最新發布可能對 Meta 構成強力競爭,具體影響將取決於開發者對 GPT-OSS 模型的接受程度。同時,Meta 正專注於超越人類認知的超級智能開發,並成立由前 Scale 行政總裁 Alexandr Wang 領導的內部實驗室。
預測未來發展方向
此次發布標誌著 AI 行業競爭格局的重大變化。隨著中美在 AI 技術領域競爭加劇,預期更多美國科技公司將跟隨 OpenAI 腳步,推出開源模型以對抗中國競爭對手。未來幾個月內,可能會看到 Google、Microsoft 等公司加快開源模型發布節奏,同時各公司在安全標準和性能基準方面的競爭也將更趨激烈。
來源: OpenAI
分享到 :
最新影片