Anthropic 近日呼籲各大 AI 實驗室,考慮以協調及可驗證方式暫緩先進 AI 開發,因 AI 自我提升速度或快於社會建立安全機制。公司亦重申若模型具備遞迴自我改進能力,業界需及早準備應對方案。
Anthropic 於 6 月 4 日發表文章,指出多家資源充足實驗室應達成共識,制訂啟動或解除暫緩規則,並設計可核實監督方式。公司認為若只有單一實驗室放慢腳步,其他對手或會趁勢加速,反而令整體安全下降。Anthropic 指出 AI 系統自主完成任務能力正快速提升,並可能朝遞迴自我改進方向發展,即系統可在極少人為介入下改良自身。公司今年 3 月成立 Anthropic Institute 時已提到,若然出現上述情況,社會需盡快決定由誰知悉及如何管理這類系統。
Anthropic 公開表示截至 2026 年 5 月,旗下程式碼庫有超過 80% 程式碼由 Claude 撰寫。公司指 2021 至 2024 年間,每位工程師每日產出程式碼行數大致不變,但 2025 年起因 Claude 帶動而上升。數據反映 AI 已開始直接參與研發流程。目前 OpenAI、xAI、Google、Meta 等主要競爭對手未即時回應 Anthropic 呼籲。Reuters 報道指出,Anthropic 將於未來數月召集政策制定者、研究人員、公民社會團體及競爭對手,討論如何管理相關風險。
資料來源:Reuters
