從ChatGPT開始對於AI使用的訓練資料是否侵權就一直爭論不休,經常能看到xx行業聯合抵制的新聞。儘管我個人認為是“侵權”的,但也知道大機率這並不違反任何現行法律(可能違法的是爬取訓練資料這個過程),等到相關法律出臺的時候網際網路上的優質資料大概都已經被收集完成了,所以除了感慨一句快速變革的時期總是有漏子可鑽之外也沒多想。
結果今天看到音樂人抵制Suno AI的帖子,順藤摸瓜看了看知乎上相關的問題和回答,震驚於居然有如此多的人認為不應該算侵權,甚至大力支援,我實在是有些不敢苟同,於是寫下了這些碎碎念。
討論這個問題之前,需要先界定一下“侵權”的概念。就我瞭解到的情況,“爬取公開資料訓練AI”這件事應該是不違背現行的著作權法或專利法之類的法律,所以自然不構成現行法律意義上的侵權。我所說的“侵權”是一種我構想中的應然而非實然。為了避免概念過於寬泛可能導致的諸多問題,我姑且只針對這個問題將“權”定義為“作品創作人可以拒絕公開發表的作品被拿來訓練AI”的權力。
認為爬取公開資料訓練AI不算侵權的人最多複述的一個觀點就是,人和AI的學習過程沒有任何差別。這類觀點大意如下:即便你的作品表明了不能商用,你也無法避免“一個人看了你的作品,學習到了一些東西,然後基於此創作一些不違反現行法律的作品並進行商用”,而顯然沒有創作者因此控告自己被侵權了。把這個表述中的人換成AI,依舊成立,如果人這麼做不算侵權,為什麼AI就算?
從我的觀點來看,人這麼做其實也侵權了,只不過被侵權者沒有追究,或者ta們認為這種侵權是自己可以接受的(當然客觀上也沒有能力追究或不接受);或者從創作者的角度出發,ta們授權了人們可以這麼做,不然完全可以跟賣課一樣,只有交錢了才能看且不得作他用。這屬於某種在特定時代程序下的約定俗成:現行法律已經能比較好的維護創作者的權利,因此一些“侵權”行為已經被默許或者授權了。而“訓練AI”這件事,在我看來屬於尚沒有被法律約束而又沒有被默許或者授權的“侵權”行為,屬於由於生產力發展新產生的灰色地帶。隨著時代發展,這個灰色地帶一定會越來越小,只是會偏向哪側並不好說。我個人當然是傾向被法律約束,但從實操層面也確實存在諸多困難,因為授權問題將其一刀砍死也多少有些因噎廢食(這也是一部分人認為不應該侵權的理由)。
關於AI訓練資料侵權的碎碎念
相關文章
- 關於近幾年獨立遊戲的碎碎念遊戲
- 資料結構碎碎念(一)資料結構
- MongoDB碎碎念MongoDB
- 碎碎念八六
- 碎碎念八八
- 雜談 —— 關於面試、實習、保研的碎碎念面試
- 前端開發碎碎念前端
- 關於《What Remains of Edith Finch》的一些碎碎念REMAI
- os 八股碎碎念
- 近日一些碎碎念
- 日誌列印的碎碎念總結
- 計算機知識碎碎念計算機
- LeetCode刷題開始,碎碎念LeetCode
- 一個十二年老程式猿的碎碎念
- 碎碎念軟體研發02:敏捷之Scrum敏捷Scrum
- 我的2022年-總結、感悟、碎碎念
- 計算機核心論文投稿的一點碎碎念計算機
- 位元組國際化TnS演算法實習的碎碎念演算法
- 海康威視值得去嗎?老年硬體工程師的碎碎念工程師
- 關於http的瑣碎筆記HTTP筆記
- 碎碎念研發01:敏捷簡史和幾種軟體開發模型敏捷模型
- React-Native 系列視訊失效補鏈及一些碎碎念React
- AI告你侵權?別慌,都是人訓練出來的AI
- 關於 CSS 的零碎知識點CSS
- 關於js、jq零碎知識點JS
- 零碎示例整理
- oracle知識碎記Oracle
- 零碎知識
- 摘抄——《病隙碎筆》
- 機器學習相關入門零碎知識機器學習
- [oracle零碎筆記]oracle零碎筆記(持續更新…)Oracle筆記
- 資料結構筆記整理和思考--零碎(1)資料結構筆記
- PHP那些瑣碎的知識點PHP
- js中零碎點的整理JS
- Vue 零碎記憶2Vue
- C語言瑣碎知識C語言
- 碎夢之後發呆了很久
- 前端零碎知識點前端