AI 圖片生成工具最大的爭議之一,就是用來訓練這些 AI 模型的圖片庫含有受版權保護的內容或者敏感甚至犯法內容,特別對企業而言會是一個法律風險。Getty Images 最近就推出一個「潔淨」圖像庫,確保內容適合商業用途。
Getty Images 作為全球最大的圖片平台,最近宣佈將在 Hugging Face 上發佈其圖像庫中的部分內容作為開放為範例數據集,這個開源數據集包含 15 個類別的 3,750 張圖片,涵蓋抽象和背景、建築環境、商業、概念、教育、醫療保健、圖標、工業、自然、插圖和旅行等範疇。而當中經過仔細審查,不存在名人照片、商標、成人不宜內容以及低解像度或缺乏元數據的劣質影像。
Getty Images 數據科學和 AI/ML 負責人 Andrea Gagliano 強調,這個資料庫來自 Getty 完全擁有的創意圖像庫,意味著這些圖片在商業上是安全使用,開發者可以無需擔心以後出現意外的法律麻煩。他表示:「想像一下,使用不僅多樣化、高品質,而且來源負責任的數據來構建或增強你的 AI/ML 能力。這就是我們所提供的。」
不過雖然樣本數據集可以開源使用,但有一些使用條件,確保授權內容被負責任地用於訓練或測試商業應用程序和進行學術研究。Getty Images 表示,希望這個圖像庫能夠吸引開發者社群,讓他們了解 Getty Images 可以提供的內容的深度和廣度,並提高人們對其作為「可信賴合作夥伴」的認識,為負責任的 AI 訓練提供授權的高品質數據。
來源:VentureBeat
相關文章:
WhatsApp 直接加入 Copilot 教學 輕鬆與 Microsoft AI 助理對話 【教學】Midjourney 網頁版免費試玩 無須再連 Discord + 生成圖片全部有紀錄 【教學+實試】Apple Intelligence 7 大實用功能 一鍵校對英文文法 + TLDR 長文總結 + 錄音即時轉文字