Anthropic 於 6 月 4 日發表名為《When AI Builds Itself》的研究報告,披露旗下 AI 助手 Claude 截至 2026 年 5 月,已撰寫超過 8 成合併至公司生產程式碼庫的程式碼,並警告 AI 自主設計及訓練自身後繼系統的臨界點,可能比大多數機構準備好更早到來,報告由 Anthropic Institute 院長 Marina Favaro 及聯合創始人 Jack Clark 共同撰寫,是該研究院今年 3 月成立以來首份重要出版物。
數字背後的生產力躍升
Claude Code 於 2025 年 2 月以研究預覽版本推出時,其程式碼比例仍屬個位數;至今已飛升至逾 8 成,在第二季度,典型 Anthropic 工程師每天合併的程式碼量是 2024 年的 8 倍。內部於 2026 年 3 月對 130 名研究人員的調查顯示,使用最新模型 Mythos Preview 後,中位估計產出約為不使用 AI 時的 4 倍,but Anthropic 自身補充指真實數字可能略低。
在最複雜、最開放式的工程問題上,Claude 的成功率於 2026 年 5 月升至 76%,較 6 個月前上升 50 個百分點,Anthropic 舉了一個具體例子:一次例行升級導致數萬個訓練任務崩潰,工程師僅以文字說明和叢集存取權限指引 Claude 處理事故,Claude 在約 2 小時內找出一個隱晦的除錯標誌、重現崩潰並確認修復方案,而同類工作通常需要 2 至 3 天。報告另舉一例:Claude 於 2026 年 4 月完成逾 800 項修復,令某類 API 錯誤下降 1,000 倍,負責監督的工程師估計若由人類執行,需時 4 年。

從寫程式碼到做研究
研究判斷力是更高的門檻,2026 年 4 月,Anthropic 讓 9 個 Claude 平行代理執行一個開放式 AI 安全研究項目,代理自行提出假設、執行實驗、透過共用討論區交流發現並反覆迭代。歷經約 800 個累計小時、耗費約 18,000 美元(約港幣 HK$140,400)算力,代理組合恢復了目標任務 97% 的效能差距;相比之下,2 名人類研究人員工作 1 星期,僅恢復 23%。
另一項實驗衡量 Claude 能否在真實研究過程的關鍵節點選出更好的「下一步」:Claude Opus 4.5 於 2025 年 11 月的判斷與人類一致比例為 51%;Mythos Preview 至 2026 年 4 月已上升至 64%,報告明確指出,AI 目前雖能在執行指定研究任務上匹敵甚至超越人類,但尚未展示能自主決定哪些問題值得研究的能力,此乃今日系統與全自主自我改進之間的關鍵差距。
任務時間窗口的加速擴張
AI 可獨立完成任務的時間長度,正從早前每 7 個月翻倍加速至目前每 4 個月 1 次,Claude Opus 3 於 2024 年 3 月能處理約 4 分鐘的任務;Claude Sonnet 3.7 於 2025 年初可完成 1.5 小時任務;Claude Opus 4.6 現時可處理 12 小時任務;METR 發現 Mythos Preview 能持續自主工作至少 16 小時,已達現有測試集的上限。若趨勢延續,需要數天專業人力的任務今年內將進入 AI 可處理範圍,數星期任務或在 2027 年跟隨。
GitHub 基礎設施瀕臨飽和
2025 年全年 GitHub 約錄得 10 億次程式碼提交;至 2026 年中,平台每星期處理約 2.75 億次,全年速度約為 140 億次,Claude Code 佔 GitHub 公開提交的 4.5%,每星期產生約 260 萬次提交。GitHub 營運總監表示公司正「全力以赴」應對容量壓力。Anthropic 亦坦言在公司內部遭遇教科書式的「Amdahl 定律」困境:程式碼生成加快,人工程式碼審查反而成為新瓶頸。
呼籲建立全球暫停機制
報告最具分量的部分,是提出建立可核實的全球 AI 發展減速或暫停機制,Anthropic 明確指出,任何一家公司單方面暫停只會改變領先者身份;真正需要的是多個國家的多個前沿 AI 實驗室,在同等條件下同步停止,並可由外部核實各方確實遵守。Jack Clark 向英國廣播公司《Newsnight》表示:「你需要有能力踩下油門,也需要有能力踩下剎車。」報告將此比作核武軍控,但承認兩者差異巨大:AI 訓練運算遠比導彈發射井易於隱藏,悄悄違規的誘因極為強烈。
報告提出 3 種未來情境:第 1,趨勢停頓,但現有能力已足以重塑經濟;第 2,AI 大幅自動化開發流程,人類仍主導研究方向,100 人公司或可完成 10 萬人組織的工作量;第 3,AI 實現完全自我遞歸改進,開始自主設計後繼系統,Anthropic 坦言對第 3 種情境沒有「清晰直覺」,但補充指出即使是遞歸式智能,也無法令一切加速:藥物數十年的長期效應無法縮短,選舉不能早於憲法規定的日期舉行,陌生人無法在一個週末變成老朋友。
這份報告在 Anthropic 秘密申請 IPO、目標於 2026 年秋季上市後 1 星期發表,公司同時以 Claude 作為生產力革命向企業客戶招手,兩者之間的張力是否是坦誠透明抑或策略性定位,將隨接下來的發展逐漸明朗。
來源:Anthropic
