人工智慧版權戰開打!OpenAI反擊稱:模型訓練使用的是受版權保護的資訊

danny_2018發表於2024-01-11

據國外媒體報導,ChatGPT開發商OpenAI最近表示,在開發ChatGPT等人工智慧工具時,使用的是受版權保護的資訊。如果沒有版權保護,這些工具將“不可能”實現價值提升。該宣告還表示,OpenAI在提交給英國上議院通訊和數字專責委員會關於大型語言模型調查檔案中做了具體陳述。

紐約時報提出版權訴訟,要求OpenAI刪除所有GPT例項

ChatGPT和影像生成器DALL-E等人工智慧模型從培訓課程中獲得能力,部分訓練課程是在未經版權所有者許可的情況下,從公共網際網路上抓取的大量內容而提供服務。OpenAI認為,在其具體應用場景下,一些培訓內容是授權的。這種免費抓取的方式是機器學習領域長期以來的一種學術研究常規做法,但由於深度學習和人工智慧模型在最近開始走向商業化征程,免費抓取的做法受到了嚴格的審查。

OpenAI在上議院提交的檔案中寫道:“因為今天的版權幾乎涵蓋了所有人類表達——包括部落格文章、照片、論壇帖子、軟體程式碼片段和政府檔案——如果不使用受版權保護的材料,就不可能訓練出今天這樣前沿的人工智慧模型。”

此外,OpenAI還寫道,將訓練資料限制在“一個多世紀前創作的”公共領域的書籍和圖紙上,將無法提供“滿足當今公民需求”的人工智慧系統。

上個月,《紐約時報》對OpenAI和OpenAI的重要投資者微軟提起訴訟,稱其在各自的產品中非法使用了《紐約時報》的內容。OpenAI週一在其網站上回應了這起訴訟,稱這起訴訟缺乏法律依據,並重申了對新聞業的支援以及與新聞機構的合作關係。

OpenAI的說法是,建立人工智慧模型合理合法,法律規定在特定情況下,允許在未經所有者許可的情況下有限地使用受版權保護的內容。該公司聲稱,版權法並不禁止使用此類材料訓練人工智慧模型。

OpenAI在週一的部落格文章中寫道:“使用公開的網際網路材料來訓練人工智慧模型是合理的使用,這得到了長期以來被廣泛接受的先例的支援。”“我們認為這一原則對創造者來說是公平的,對創新者來說是必要的,對提升人工智慧的競爭力至關重要。”

OpenAI反駁了版權訴訟說法,稱每個ChatGPT響應都是衍生作品

這並不是OpenAI第一次聲稱其人工智慧訓練資料的合理使用。今年8月,我們在媒體報導中發現一個類似的情況,OpenAI在回應喜劇演員莎拉·西爾弗曼(Sarah Silverman)的版權訴訟時,為其使用公開可用材料辯護,稱其為合理使用。

OpenAI聲稱,該訴訟的作者“誤解了版權的範圍,沒有考慮到限制和例外(包括合理使用),這些限制和例外為人工智慧前沿的大型語言模型等創新留下了適當的空間。”

來自 “ ITPUB部落格 ” ,連結:https://blog.itpub.net/31547898/viewspace-3003426/,如需轉載,請註明出處,否則將追究法律責任。

相關文章