人工智能

Claude 已撰寫逾 8 成自家程式碼　Anthropic：AI 自我進化比預期更快

作者

藍骨
發佈日期

2026-06-06
閱讀時間

8分鐘
字體大小

Anthropic 於 6 月 4 日發表名為《When AI Builds Itself》的研究報告，披露旗下 AI 助手 Claude 截至 2026 年 5 月，已撰寫超過 8 成合併至公司生產程式碼庫的程式碼，並警告 AI 自主設計及訓練自身後繼系統的臨界點，可能比大多數機構準備好更早到來，報告由 Anthropic Institute 院長 Marina Favaro 及聯合創始人 Jack Clark 共同撰寫，是該研究院今年 3 月成立以來首份重要出版物。

數字背後的生產力躍升

Claude Code 於 2025 年 2 月以研究預覽版本推出時，其程式碼比例仍屬個位數；至今已飛升至逾 8 成，在第二季度，典型 Anthropic 工程師每天合併的程式碼量是 2024 年的 8 倍。內部於 2026 年 3 月對 130 名研究人員的調查顯示，使用最新模型 Mythos Preview 後，中位估計產出約為不使用 AI 時的 4 倍，but Anthropic 自身補充指真實數字可能略低。

在最複雜、最開放式的工程問題上，Claude 的成功率於 2026 年 5 月升至 76%，較 6 個月前上升 50 個百分點，Anthropic 舉了一個具體例子：一次例行升級導致數萬個訓練任務崩潰，工程師僅以文字說明和叢集存取權限指引 Claude 處理事故，Claude 在約 2 小時內找出一個隱晦的除錯標誌、重現崩潰並確認修復方案，而同類工作通常需要 2 至 3 天。報告另舉一例：Claude 於 2026 年 4 月完成逾 800 項修復，令某類 API 錯誤下降 1,000 倍，負責監督的工程師估計若由人類執行，需時 4 年。

ALT標籤：智能客服與聊天機器人流程示意圖.

從寫程式碼到做研究

研究判斷力是更高的門檻，2026 年 4 月，Anthropic 讓 9 個 Claude 平行代理執行一個開放式 AI 安全研究項目，代理自行提出假設、執行實驗、透過共用討論區交流發現並反覆迭代。歷經約 800 個累計小時、耗費約 18,000 美元（約港幣 HK$140,400）算力，代理組合恢復了目標任務 97% 的效能差距；相比之下，2 名人類研究人員工作 1 星期，僅恢復 23%。

另一項實驗衡量 Claude 能否在真實研究過程的關鍵節點選出更好的「下一步」：Claude Opus 4.5 於 2025 年 11 月的判斷與人類一致比例為 51%；Mythos Preview 至 2026 年 4 月已上升至 64%，報告明確指出，AI 目前雖能在執行指定研究任務上匹敵甚至超越人類，但尚未展示能自主決定哪些問題值得研究的能力，此乃今日系統與全自主自我改進之間的關鍵差距。

任務時間窗口的加速擴張

AI 可獨立完成任務的時間長度，正從早前每 7 個月翻倍加速至目前每 4 個月 1 次，Claude Opus 3 於 2024 年 3 月能處理約 4 分鐘的任務；Claude Sonnet 3.7 於 2025 年初可完成 1.5 小時任務；Claude Opus 4.6 現時可處理 12 小時任務；METR 發現 Mythos Preview 能持續自主工作至少 16 小時，已達現有測試集的上限。若趨勢延續，需要數天專業人力的任務今年內將進入 AI 可處理範圍，數星期任務或在 2027 年跟隨。

GitHub 基礎設施瀕臨飽和

2025 年全年 GitHub 約錄得 10 億次程式碼提交；至 2026 年中，平台每星期處理約 2.75 億次，全年速度約為 140 億次，Claude Code 佔 GitHub 公開提交的 4.5%，每星期產生約 260 萬次提交。GitHub 營運總監表示公司正「全力以赴」應對容量壓力。Anthropic 亦坦言在公司內部遭遇教科書式的「Amdahl 定律」困境：程式碼生成加快，人工程式碼審查反而成為新瓶頸。

呼籲建立全球暫停機制

報告最具分量的部分，是提出建立可核實的全球 AI 發展減速或暫停機制，Anthropic 明確指出，任何一家公司單方面暫停只會改變領先者身份；真正需要的是多個國家的多個前沿 AI 實驗室，在同等條件下同步停止，並可由外部核實各方確實遵守。Jack Clark 向英國廣播公司《Newsnight》表示：「你需要有能力踩下油門，也需要有能力踩下剎車。」報告將此比作核武軍控，但承認兩者差異巨大：AI 訓練運算遠比導彈發射井易於隱藏，悄悄違規的誘因極為強烈。

報告提出 3 種未來情境：第 1，趨勢停頓，但現有能力已足以重塑經濟；第 2，AI 大幅自動化開發流程，人類仍主導研究方向，100 人公司或可完成 10 萬人組織的工作量；第 3，AI 實現完全自我遞歸改進，開始自主設計後繼系統，Anthropic 坦言對第 3 種情境沒有「清晰直覺」，但補充指出即使是遞歸式智能，也無法令一切加速：藥物數十年的長期效應無法縮短，選舉不能早於憲法規定的日期舉行，陌生人無法在一個週末變成老朋友。

這份報告在 Anthropic 秘密申請 IPO、目標於 2026 年秋季上市後 1 星期發表，公司同時以 Claude 作為生產力革命向企業客戶招手，兩者之間的張力是否是坦誠透明抑或策略性定位，將隨接下來的發展逐漸明朗。

來源：Anthropic