大型語言模型訓練時總會使用極大量的數據,抓取網上內容進行訓練就成為了備受爭議的行為。Microsoft AI 總裁 Mustafa Suleyman 最近就表示,個人在網上發佈的內容本質上是「免費軟件」,任何人都可以拿來複製甚至再創作。
Microsoft AI 總裁 Mustafa Suleyman 認為,網上的內容大致分為個人發佈和受公司版權保護兩種,前者自 1990 年代以來,就被視為可以「合理使用」,任何人都可以複製和再創作。另外一部分則是那些明確聲明「不得抓取」的網站或出版商的內容。Suleyman 表示,這屬於灰色地帶,需要透過法庭來解決。Suleyman 預測,資訊經濟學即將發生根本性變革,知識生產的邊際成本將降至零。這意味著,大量由用戶貢獻的「免費」內容,反而需要用戶付費給大財團才能使用。
不過這個言論卻在現時的爭議上火上加油,非牟利組織調查報導中心 (Center for Investigative Reporting) 就在不久後起訴 OpenAI 和其最大投資者 Microsoft,指控他們未經許可使用該非營利新聞機構的內容且未提供補償。而此前已有多家報社和作家因類似原因對 OpenAI 和 Microsoft 提起訴訟。
來源:The Register
相關文章:
iPhone SE 4 傳明年首季發表 將支援 Apple Intelligence 人工智能