美國聯邦法官 William Alsup 作出具里程碑意義的裁決,認定人工智能公司無需獲得作者許可,即可使用合法取得的書籍訓練大型語言模型,並將此類使用歸類為合理使用。這項首度認可 AI 訓練為合理使用的判決,對 AI 業界而言是重大勝利,但同時為使用盜版內容的公司敲響警鐘。在作家及記者控告 Anthropic 的案件中,法官的裁決可能為全國類似訴訟開創重要先例。
在這宗備受關注的案件中,Alsup 法官在長達 32 頁的判決書中認為「使用相關書籍訓練 Claude 及其前身模型極其具變革性,屬合理使用範疇」。法官將此案涉及的技術形容為「我們許多人在有生之年將見到的最具變革性技術之一」,並將 AI 訓練比作人類透過閱讀書籍學習的過程。
由於控告 Anthropic 的作者未能證明該公司的輸出內容複製了他們的作品或表達風格,法官認為 Anthropic 的文本生成器 Claude 不會在市場上取代作者地位。法官以生動比喻闡述其判決理念:「如同任何渴望成為作家的讀者,Anthropic 的大型語言模型訓練作品並非為了競逐並複製或取代它們——而是轉個急彎,創造不同的東西。」
這宗集體訴訟由作家 Andrea Bartz、Charles Graeber 和 Kirk Wallace Johnson 提起,指控 Anthropic 非法複製其書籍訓練與 ChatGPT 競爭的聊天機器人 Claude。音樂家、書籍作者、視覺藝術家和新聞出版機構已對多家未經許可或付費使用其數據的 AI 公司提起訴訟。
AI 公司普遍以合理使用為其做法辯護,聲稱在大型數據集上訓練 AI 從根本上改變了原始內容,並且是創新所必需的。訓練生成式 AI 的大型語言模型需要大量數據支持。
儘管在合理使用方面獲得勝利,Alsup 法官拒絕給予 Anthropic 全面保護,裁定該公司下載數百萬本盜版書籍建立永久數字圖書館的做法不受合理使用保護。根據法庭文件,除了從提供盜版作品的網站下載書籍外,Anthropic 還購買了版權書籍,掃描頁面並以數字格式儲存。
法官在判決中指出,Anthropic 的目標是建立「世界上所有書籍」的圖書館,以便根據需要訓練 AI 模型。雖然在盜版內容上訓練 AI 模型不構成法律違規,但下載盜版副本建立通用圖書館構成版權侵權,無論最終是否用於訓練。
案件現將就與盜版圖書館副本相關的損害賠償進入審判階段,潛在懲罰包括經濟損害賠償。Anthropic 表示不同意就判決的這部分進入審判,正在評估其法律選擇。法官強調:「Anthropic 後來購買了其早前從互聯網盜取的書籍副本,這不會免除其盜竊責任,但可能影響法定損害賠償的程度。」
估值達 615 億美元並獲 Amazon 大力支持的 Anthropic 由前 OpenAI 高管於 2021 年創立。該公司以其 Claude 聊天機器人和 AI 模型聞名,將自己定位為專注於 AI 安全和負責任發展。
Anthropic 對裁決表示滿意,發言人回應稱:「我們很高興法庭認識到使用作品訓練大型語言模型具變革性。」發言人補充說,這項決定「與版權促進創造力和促進科學進步的目的一致」。
雖然這項判決僅代表一名法官的意見,但對 Anthropic 的裁決可能被其他在類似版權訴訟中為自己辯護的公司引用。這次判決可能影響整個 AI 行業面對版權挑戰的策略和發展方向。