萬字!從技術角度評析AI著作權第一案 | 誰擁有算力,誰壟斷國內AI著作權的未來?

李伯阳發表於2023-12-13
2023年11月29日,一份北京網際網路法院的判決書引爆了法律圈。

國內終於就“AI畫圖”作品的著作權歸屬以及侵權認定下達了首份判決文書。

筆者第一時間仔細研讀了該份文書

但對法官的認定部分,持有一定反對意見

法官認為,只要經過“設計人物的呈現方式、選擇提示詞、安排提示詞的順序、設定相關的引數、選定哪個圖片符合預期等等“,生成作品就能構成”智力成果“的要件,使用者就可以擁有輸出作品的著作權

如果熟悉AI以及Stable Diffusion軟體原理的話

就可以根據該判決書推匯出這樣一個事實

未來,誰擁有足夠的算力

誰就可以壟斷國內AI生成美術作品著作權

與其他僅從判決書進行分析的同行不同

筆者將會嘗試從技術上進行分析

希望帶給各位讀者不同的角度與體驗

*本文僅為筆者個人觀點,不視為任何法律建議或法律意見。
**感謝“知產庫”公眾號分享的判決書

一、判決書簡要歸納

相信很多讀者朋友都看過或者聽說了判決書的內容,但為了方便後文閱讀,筆者在此對判決書的內容進行一個簡單的歸納。

案情:

原告李某使用了Stable Diffusion軟體(一款AI繪圖軟體)生成了涉案圖片後,發表在了小紅書平臺;被告劉某為百度百家號博主,在未獲得原告的許可且截去了原告在小紅書平臺署名水印的情況下,在其博文中使用了涉案AI圖片,使得相關使用者誤認為被告為該作品的作者。

原告發現後向北京網際網路法院提起訴訟,訴訟請求為:

1.請求判令被告在涉案百家號釋出公開宣告向原告賠禮道歉,消除其侵權行為給原告造成的影響;

2.請求判令被告賠償原告經濟損失 5000 元。

原告還在庭審中展示瞭如何利用Stable Diffusion軟體一步步復現繪製涉案AI圖片的過程。

法院認定:

一、涉案圖片是否構成作品,構成何種型別作品

關於“智力成果”:

從原告構思涉案圖片起,到最終選定涉案圖片止,這整個過程來看,原告進行了一定的智力投入,比如設計人物的呈現方式、選擇提示詞、安排提示詞的順序、設定相關的引數、選定哪個圖片符合預期等等。涉案圖片體現了原告的智力投入,故涉案圖片具備了“智力成果”要件。

關於“獨創性”:

原告對於人物及其呈現方式等畫面元素透過提示詞進行了設計,對於畫面佈局構圖等透過引數進行了設定,體現了原告的選擇和安排。另一方面,原告透過輸入提示詞、設定相關引數,獲得了第一張圖片後,其繼續增加提示詞、修改引數,不斷調整修正,最終獲得了涉案圖片,這一調整修正過程亦體現了原告的審美選擇和個性判斷。

因此,涉案圖片並非“機械性智力成果”。在無相反證據的情況下,可以認定涉案圖片由原告獨立完成,體現出了原告的個性化表達。綜上,涉案圖片具備“獨創性”要件。

關於是否屬於“機械智力成果”:

原告透過變更個別提示詞或者變更個別引數,生成了不同的圖片,可以看出,利用該模型進行創作,不同的人可以自行輸入新的提示詞、設定新的引數,生成不同的內容。因此,涉案圖片並非“機械性智力成果”

二、原告是否享有涉案圖片的著作權

1.模型:

因為我國著作權法認定“作者”限於自然人、法人、非法人組織,因此生成涉案圖片時所使用的模型不能成為“作者”。

2.人工智慧軟體(Stable Diffusion的作者):

因其沒有創作涉案圖片的意願、沒有預先設定後續創作內容、未參與後續創作過程,因此只是創作工具的生產者。

3.原告:

原告是直接根據需要對涉案人工智慧模型進行相關設定,並最終選定涉案圖片的人,涉案圖片是基於原告的智力投入直接產生,且體現出了原告的個性化表達,故原告是涉案圖片的作者,享有涉案圖片的著作權。

三、被訴行為是否構成侵權,被告是否應當承擔法律責任

被告傳播涉案圖片的行為構成侵犯原告作品“資訊網路傳播權”;

被告傳播涉案圖片時抹去原告署名的行為構成侵犯原告“署名權”。

判決結果:

1.被告須在其百家號上釋出道歉宣告,至少維持24小時;

2.被告賠償原告損失500元。

二、基於SD軟體原理分析該案著作權認定為何依據不足

1. Stable Diffusion軟體及其所用模型的執行原理

筆者曾經就Stable Diffusion軟體背後的演算法原理進行過討論,感興趣的讀者可以詳見:

演算法模型應成為人工智慧(AI)侵權審查的核心 —— 以擴散(Diffusion)模型和演算法為例

Diffusion演算法簡要來說是透過關聯訓練集中的素材和相應的標註資訊,使演算法模型能夠學習這種關聯性,從而理解具有相同標註資訊的訓練集影像的共性規律。在訓練過程中,透過模擬分佈畫素點(即“路徑”)的各種可能性,生成影像以滿足這種共性規律。而在生成階段,我們透過輸入的需求(即“提示詞”)匹配訓練時的標註資訊,尋找最符合這類標註資訊所代表的影像的生成路徑,最終生成符合提示詞內容的影像。

而Stable Diffusion軟體中的引數“種子”則代表了某一條具體的“路徑”。

2.  採用相同的“路徑”,生成結果必定唯一

在判決書中,我們可以瞭解到原告在庭上展示了透過再次輸入相關正反面提示詞、迭代次數、LoRA模型權重等等引數,在固定了“種子”的情況下,重新生成出了涉案影像。

這實際已意味著涉案影像本質是基於固定的引數“機械生成”的結果。

而“可復現”也是Stable Diffusion軟體區別於其他AI生成軟體(例如Midjourney、DALL·E等)的最大特色。

在知名AI模型分享網站Civitai中,有大量使用者分享的AI影像。這些影像都會包含了具體使用的模型(Resources )以及生成時所使用的引數(Generation Data),網站還提供了“一鍵複製”引數的功能。

萬字!從技術角度評析AI著作權第一案 | 誰擁有算力,誰壟斷國內AI著作權的未來?
(模型分享頁)

萬字!從技術角度評析AI著作權第一案 | 誰擁有算力,誰壟斷國內AI著作權的未來?
(圖片所使用的模型)

萬字!從技術角度評析AI著作權第一案 | 誰擁有算力,誰壟斷國內AI著作權的未來?
(圖片所使用的生成引數)

透過按下複製按鈕,可以得到的生成引數資訊如下:

animal (cat:1.5) skiing, snowboard, snow explosion, action shot, nude, sunlight, wide angle, (tail:1.3) <lora:EnvyActionShotXL01:0.5> 8k, F2.8, RAW Photo, ultra detailed, real life  <lora:xl_more_art-full_v1:0.8>


Negative prompt: bokeh


Steps: 20, VAE: sdxl_vae.safetensors, Size: 832x1216, Seed: 562327064, Model: juggernautXL_v7Rundiffusion, Version: v1.6.0-2-g4afaaf8a, Sampler: DPM++ 2M SDE Karras, VAE hash: b3165c12ca, CFG scale: 4.5, Model hash: 0724518c6b, "EnvyActionShotXL01: 46f3acce826a, xl_more_art-full_v1: fe3b4816be83"

其他使用者只要下載並使用相同的模型,在軟體介面中一鍵匯入上面複製的生成引數,就可以在自己的裝置上覆現這幅影像。

雖然因電腦硬體裝置、軟體所使用的外掛版本、模型版本等影響,最終結果可能不能完全100%復刻,但生成的結果也足以構成“實質性相似”,以下為一些網友測試的影像:

萬字!從技術角度評析AI著作權第一案 | 誰擁有算力,誰壟斷國內AI著作權的未來?
(圖源:https://www.tonyisstark.com/869.html)

萬字!從技術角度評析AI著作權第一案 | 誰擁有算力,誰壟斷國內AI著作權的未來?
(圖源:https://www.bilibili.com/read/cv23375108/)

筆者根據判決書記載的引數,在不知其軟體版本、外掛、硬體裝置、未知判決書中未提及引數下,在筆者的電腦中也可以復現到以下結果,除了身體外,臉部、背景、下半身衣服都有明顯的相似性,整體構圖也非常相似:

萬字!從技術角度評析AI著作權第一案 | 誰擁有算力,誰壟斷國內AI著作權的未來?

而當影響結果的因素足夠少時,則會像原告復現流程一樣,達到生成結果完全100%相似。

為進一步展示,筆者在此記錄一次測試結果:

1. 在Stable Diffusion軟體輸入各項基本生成引數後,讓隨機種子保持為-1(即隨機生成種子,這也是正常生成AI影像的流程,實際使用軟體生成影像的過程中,基本不會先固定種子再調整引數),點選影像生成。

萬字!從技術角度評析AI著作權第一案 | 誰擁有算力,誰壟斷國內AI著作權的未來?

2. 得到首次生成結果,以及其種子引數:

萬字!從技術角度評析AI著作權第一案 | 誰擁有算力,誰壟斷國內AI著作權的未來?

3.重新啟動軟體,再次輸入同樣的引數,並把種子引數修改為第二步影像一致的結果,再次點選生成:

萬字!從技術角度評析AI著作權第一案 | 誰擁有算力,誰壟斷國內AI著作權的未來?

萬字!從技術角度評析AI著作權第一案 | 誰擁有算力,誰壟斷國內AI著作權的未來?

4.得到了完全相同的影像:

萬字!從技術角度評析AI著作權第一案 | 誰擁有算力,誰壟斷國內AI著作權的未來?

可見,在採用了相同的模型和生成引數的情況下,使用一樣的“種子引數”,生成的影像可足以達到“實質性相似”乃至“相同”的結果。

3.  AI生成影像只是根據一定方式計算得出的“機械性智力成果”

無論是原告在案件中展示的復現流程,還是上文測試的結果,均指向了一個事實:

所謂的“AI繪畫”只是在訓練模型時產生的極大數量級的可能性中,根據演算法內的公式,結合輸入的引數進行計算,從而指向某一個具體結果並生成對應影像的過程。

原告在復現過程中進行的各種調整,本質上均與最終結果沒有任何關係。調整引數的過程只是指向了模型的不同生成結果,只要最終輸入引數與生成影像的引數一致,無論此前進行了多少數量級的調整,最終結果均不會改變,正如在普遍環境下1+1=2般固定且準確。

正如判決書中對“機械性智力成果”進行的闡述:

萬字!從技術角度評析AI著作權第一案 | 誰擁有算力,誰壟斷國內AI著作權的未來?

無論生成者是何人,只要在相同的裝置、選擇一樣的模型、按照一定的順序輸入引數,按下滑鼠後生成的AI影像結果必定相同,與按下滑鼠的人、時間、地點均無任何關係。

“AI生成影像”,起碼在目前階段,只是“機械性智力成果”。

4.  我們只是在“挑選猴子的自拍照”

該案中法官認為,原告調整、修改引數的流程,體現了原告審美選擇和個性判斷:

萬字!從技術角度評析AI著作權第一案 | 誰擁有算力,誰壟斷國內AI著作權的未來?

然而透過上面的討論,現在我們已經可以判斷出原告(乃至使用AI繪圖的我們)只是在一堆”機械性智力成果“中選擇出符合人類審美的一幅圖片。

法官在判決書中使用了“相機”的例子,在此筆者也想引用另一個“相機”的例子:

2011年,英國攝影師David Slater在印尼野外進行拍攝活動,在拍攝期間他使用三腳架固定相機,並故意離開遙控快門,讓黑猴能接近相機。一隻母黑猴按下了遙控快門,拍攝了大量照片,其中大多數照片模糊不清,不能使用,但Slater在其中挑選出了最有趣的兩張照片,隨後網站上釋出了它們:

萬字!從技術角度評析AI著作權第一案 | 誰擁有算力,誰壟斷國內AI著作權的未來?

維基百科把這兩張照片放置在其網站上,並宣告是“猴子拍的”,這讓Slater認為維基百科侵犯了其著作權。Slater將維基百科的母公司告上了法院,之後2014年12月,美國著作權局認定的確是“猴子拍的”,並宣告非人類所創作的作品不是美國著作權的主體;2016年,美國聯邦法官決定猴子無法自行持有這些影像的著作權;2018年,第九巡迴上訴法庭維持原判。

如果與本案進行類比,則原告的行為與Slater並無二致,其本質都只是在一堆不屬於人類創作的作品中進行挑選,原告調整引數的過程只是“在一個充滿了各種影像的黑箱子中變換不同手勢抽出其中某一張”,而這張圖本質並沒有加入任何自己“創作”的部分。

正如“AI繪圖”在民間的俗稱:“抽卡”,我們既不會把抽獎的過程(哪怕是由我們自己設定獎品可能的型別、顏色、大小、形狀、機率等等的“引數”)認為是“創作過程”,也不會認為抽出來的獎品就是自己擁有著作權的“作品”,同樣地,我們也不應該認定“抽獎者”擁有在“AI繪圖”時“抽取”出來的“作品”的著作權。

5.   甚至連提示詞都不具備“創作”的要素

熟悉Stable Diffusion軟體的讀者可能會知道,網上存在很多提示詞外掛,同時也有大量的網友在提示詞分享網站、論壇、部落格等分享各種實用的提示詞模版。

萬字!從技術角度評析AI著作權第一案 | 誰擁有算力,誰壟斷國內AI著作權的未來?
(例如一款可一鍵新增提示詞的外掛)

而使用LoRA模型時,往往也要求輸入觸發提示詞,否則最終生成結果無法新增上LoRA模型的效果:

萬字!從技術角度評析AI著作權第一案 | 誰擁有算力,誰壟斷國內AI著作權的未來?
(Trigger Words,即觸發提示詞,必須輸入到正向提示詞中)

之所以存在如此多的限制,原因在於,能輸入並影響生成結果的提示詞範圍,與模型訓練集的“標記”成正相關。

任何人都不能超出“標記”範圍輸入提示詞,不能“創作”超出模型內已有標記的內容,否則繪圖程式將會無法理解這個提示詞的含義,不能在輸出結果中生成與這個提示詞相關的元素內容。

原告在庭審中也提到,其“創作”過程中使用的提示詞,絕大部分都是直接複製他人的模版:

萬字!從技術角度評析AI著作權第一案 | 誰擁有算力,誰壟斷國內AI著作權的未來?

而其自行編輯的反向提示詞,也並未超出常見範圍,僅僅只是在已有的範圍內進行挑選,並非其“獨立創作”的結果。

6.   縱觀“創作”的全流程,原告不具備“創作”行為,不應獲得著作權

透過上面的分析,我們現在可以得出一個結論了:

原告無論是輸入引數、調整引數、選擇生成結果,都只是在模型所能提供的“可能性“裡進行。AI生成的影像本質只與裝置、模型、軟體相關,與使用者並沒有任何關聯性,任何人基於同樣的裝置、模型、軟體,均可超越時空獲得一模一樣的結果,因此涉案AI生成影像完全符合“機械性智力成果”的定義。

使用者在直接使用AI生成結果時,僅僅是進行了基於人類審美進行選擇的過程,與影像的創作並沒有任何關聯性,不具備“創作”的要素;其輸入引數的行為只是限定了“可能性”的範圍,與結果的產生沒有任何關聯性,不具備“透過投入智力元素”影響生成結果的要件。

由此可見,無論從涉案影像的本質分析,還是基於原告的生成過程,原告均不應享有涉案作品(更應稱為“涉案影像”)的著作權。

三、判決書中的其他細節問題

此外,判決書中還存在其他細節問題:

1. 原告的復現流程並沒有可證明其創作行為的證明力

判決書中提及,正因為原告復現影片中,原告展示出來的“調整引數”行為,表現出了原告的“審美選擇和個性判斷”過程,因此得出涉案圖片具有“獨創性“的結論。

萬字!從技術角度評析AI著作權第一案 | 誰擁有算力,誰壟斷國內AI著作權的未來?

與傳統電子美術資料來源檔案存在圖層、操作日誌等資訊不同,AI繪圖(以Stable Diffusion而言)僅有生成的影像,以及影像中攜帶的生成引數資訊,並不包含任何“過程”的記錄。

正如上文提及,在最終引數一致的情況下,無論“復現影片”中展示了何種複雜的除錯過程,只要最終引數一致,即可生成一致的圖片。

筆者再次透過前文中的例子進行說明:

在Stable Diffusion中,在不改變種子的情況下調整其中一個關鍵詞,將“night(夜晚)”修改成“day(白天)”,按下生成按鈕,得出一幅完全不同的影像:

萬字!從技術角度評析AI著作權第一案 | 誰擁有算力,誰壟斷國內AI著作權的未來?

2. 然後保持當前提示詞不變,將“種子”修改為“119129788”並按下生成按鈕,得到了另一張不同的影像:

萬字!從技術角度評析AI著作權第一案 | 誰擁有算力,誰壟斷國內AI著作權的未來?

3. 最後把提示詞和“種子”重新修改為原本的版本,再次按下生成按鈕,可見已經完全“復現”了原本的影像:

萬字!從技術角度評析AI著作權第一案 | 誰擁有算力,誰壟斷國內AI著作權的未來?

事實上,任何人都可以透過Stable Diffusion的“圖片資訊”功能讀取此前批次生成的任意一張圖片的生成資訊,透過傳送到“文生圖”功能,重新調整引數,獲得不一樣的生成結果。當然,也可以用於復現一樣的影像。

萬字!從技術角度評析AI著作權第一案 | 誰擁有算力,誰壟斷國內AI著作權的未來?

雖然沒有證據證明原告存在“倒推創作過程”的事實,但僅就“證明力”而言,原告的復現影片並不具備足以證明其“創作過程”的證明力。

2.  原告的“創作過程”與常理存在明顯差別

“AI繪圖”是一個“抽卡”的過程,任何人都不知道“抽卡”的結果如何,因此主流(乃至絕大部分)Stable Diffusion教程以及普通軟體使用者的生成操作,都是透過使用隨機種子批次生成大量不同的影像,然後從中選擇一張“符合人類審美”的影像(基於某個“種子”)。因為我們不能事先知道某一個“種子”會符合我們審美,批次、隨機生成各種不同的“種子”,再從中挑選才是最優解。

但原告的“復現過程”,卻是反其道而行之,先固定了“種子”,再調整LoRA模型模型,然後再次透過調整“種子”和提示詞生成了涉案圖片。

在生成時先固定“種子”,意味著每次只能生成一張圖片,這無論是從實用性還是效率來說,都不具備明顯的優勢。

尤其當新型家用電腦顯示卡可以數秒生成一張圖片的情況下,從大批次生成圖中選擇,比“隨機輸入一個種子”要有效得多。

但筆者也不排除真的有人採取類似的方式生成影像,或原告只是為了方便展示需要而採用了此種辦法。

筆者只是從“一般理性”而言進行陳述,並不代表筆者認為原告存在“倒推創作流程”的情況。

四、本案可能帶來的影響

假設本案成為了日後相關判決的“案例”,則可能對國內著作權環境帶來以下影響:

1.  可能改變著作權“天然擁有”的特質

根據《著作權法》第二條,無論作品是否發表,均享有著作權,即“天然擁有”。

第二條中國公民、法人或者非法人組織的作品,不論是否發表,依照本法享有著作權。

《中華人民共和國著作權法》

但從AI繪圖的原理可知,基於“種子”結果唯一性,任何人都可能擁有同一張或近似圖片的“著作權”,而影響獲得這張圖著作權的唯一因素,僅僅只是按下滑鼠並“幸運地”隨機出這個種子的早晚。

這導致了一個奇妙的現象:

一個作品的著作權人可能是任何人,直到某次滑鼠點選之後才坍縮到具體的結果。

一個作品的著作權人也可能超過一個人,只要大家都足夠“幸運”隨機出了同一個結果。

尤其當模型越小,能生成可能性越少,生成相似影像的可能性就越高。在彼此都生成相似影像的情況下,容易形成“誰才是這張圖的著作權人”以及“誰侵犯了誰的權利”的爭議。

基於在先優先權判斷嗎?

但電子資料的特徵就是“可隨意修改”,誰都能透過調整裝置時間來變更影像的生成時間,例如向前回溯兩個月:

萬字!從技術角度評析AI著作權第一案 | 誰擁有算力,誰壟斷國內AI著作權的未來?

憑目前的技術,絕大部分人難以確認一幅AI繪圖作品的真實生成時間,難以判定該影像的在先權利歸屬。

基於先發表或先存證判斷歸屬嗎?

那則嚴重破壞了作品著作權的“天然擁有”權利,變成了“誰先宣告誰擁有”,任何人都可能僅僅因為“晚了發表”,或僅僅儲存在電腦硬碟、草稿中,或僅僅只是想著“下一期再用”而丟失了作品的著作權。

這使得“著作權”不再符合“創作即擁有”,反而需要潛在的權利人透過大量可靠性證明,來爭搶著作權權利,否則將遭受無故失去著作權的風險。

2.  可能導致著作權從保護“創作”變成保護“結果”

傳統作品的“結果”是創作流程的體現,保護作品本質是保護完整的“創作行為”,這也是著作權的核心思想:保護表達。

而AI作品生成時基於一樣的創作流程,在保持其他引數一致的情況下,只需要簡單調整”種子“引數,往往可以得到完全不同的結果。

本案中,法官認為原告的“創作過程”具有“獨創性的智力投入”,從而應當受到保護。

但問題在於,我們應當保護的是何種“創作過程”?

是生成AI影像所經歷的調整過程?

是最終生成AI影像所用的引數(正常而言創作過程不包含思考“種子”)?

還是創作者點選滑鼠最終生成的AI影像檔案(包含“種子”的最終引數)?

如果從應該保護“思考過程”認為應該保護最終生成使用的引數,則意味著一個人可以獨佔該引數下的全部可能影像(全部“種子”)的著作權,這基於公平性而言,明顯不具有可行性;

如果是認為只應保護最終生成的結果,則意味著任何一個人都可以使用他人的思考成果 —— 本案認定的“獨創性的智力投入”——透過僅僅隨便輸入一個新“種子”,就可以輕鬆獲得具有一定差異性、在傳統法律認定中難以構成侵權認定的新影像結果。

這在傳統美術作品中可能只是“加一筆”的勞動程度,甚至不用增加任何意義上的“智力投入”,居然就可以獲得新作品的完整著作權。

但基於司法而言,“保護結果”反而是最容易進行判斷侵權行為的辦法。當一個作品抹去了生成資訊時,能判斷是否侵權的可能性就剩下“外觀相似度”,但在AI繪圖中,改變最終產品的相似度反而是最不需要“智力投入”的部分。

保護“引數”,則容易形成過渡保護;

保護“成品”,則本質上不是保護“思考的過程”,只是保護人力無法干預的“機械生成結果”。

3.  著作權認定辦法難以適用於不同的AI繪圖軟體,容易造成歧視

對於Stable Diffusion需要一定的技術基礎才能搭建的情況,更多人可能會選擇Midjourney、DALL·E、文心一言等國內外的AI繪圖平臺。

這些平臺特點是不需要使用者關注具體的生成引數和模型,只需要輸入提示詞即可輸出影像結果。

其輸出結果是完全隨機的,就算相同的提示詞也無法復現同一張圖片;也不存在基於某張影像調整細節的可能性,每次都是基於提示詞重新生成。

在使用這些平臺時,使用者的“獨創性的智力投入”,會因為無法調整各類引數,明顯低於使用Stable Diffusion軟體的使用者。

如果使用與本案相同的判定標準,則那這些使用者也能獲得生成結果的著作權嗎?哪怕使用者們只是輸入了一段提示詞?

如果認為應該保護著作權,那應該是保護提示詞,還是那個完全隨機、無法復現的生成結果?

如果認為單獨的一段提示詞無法構成“智力投入”,那同樣都是使用AI繪圖,具有更高技術能力或者使用更復雜軟體的人,是否就擁有比別人更多的權利?

傳統創作軟體中,無論是使用系統自帶的繪圖軟體,還是下載的高階版繪圖軟體,所畫出來的原創影像,創作者都能具有同樣的著作權。

但到了AI繪畫軟體這裡,如果認為輸入提示詞與調整引數的行為才能構成創作,則是人為地製造了壁壘與歧視,顯失公平性。

4.  可能導致算力壟斷著作權

如果不改變目前著作權的原則,單就本案認定情況而言,我們可以推匯出一個恐怖的結論:

在未來,誰擁有更多的硬體算力,誰就可以更快生成更多圖片,獲得更多的著作權。

如果認定創作者擁有生成AI影像的著作權,基於無法對“創作過程”和“創作時間”證偽,擁有更多算力的創作者就可以透過不斷隨機生成某個模型基於各類引數的影像,儘可能窮盡生成結果的可能性,達到對該模型所能生成影像著作權的壟斷。

又因為“種子”結果唯一性,在拋棄了大部分不符合人類審美的結果後,實際可用的“種子”可能有限。普通人可能會因為僅僅硬體算力較差,較晚生成該模型的可用影像,而喪失該影像的著作權,甚至可能導致因使用了實質性相似的影像而構成侵權的後果 —— 如果熟悉目前Stable Diffusion軟體的讀者,應該清楚瞭解小模型,尤其小型LoRA模型,最終成品的相似程度和相似頻率有多高。

筆者認為,這是提供了一種資產壟斷智慧財產權的未來可能性。

法官在判決書中認為,AI繪圖軟體是一種新技術工具,透過正確適用著作權制度,可以鼓勵並讓更多的普通人投入到創作的過程中。

雖然出發點很好,但這顯然只考慮了“人”的參與部分,沒有考慮到“機器”參與的部分。

傳統作品的產出效率只跟人的創作能力與效率相關,任何人產出作品、獲得著作權的機會都是平等的;

但AI繪圖作品的產出效率與機器效能有著極為重大的關聯性,甚至達到了幾十倍到上百倍的差距。

舉個筆者親身體會,目前家用旗艦顯示卡Nvidia RTX 4090使用Stable Diffusion時可以達到1秒生成一張圖片,而筆者自己的顯示卡則往往需要接近50秒。

如果認為AI繪圖軟體使用者對生成的圖片都具有著作權,那這50倍的差距就是50倍的著作權獲取效率差距。當都在使用同一個模型生成圖片時,擁有4090顯示卡的人則可能更早“抽出”可用的圖片,而筆者則擁有更高的侵權機率。

這種不公平的現實,不應成為我國著作權的未來。

五、個人觀點:AI繪圖中訓練集、模型與生成作品的著作權歸屬

針對AI所帶來新的智慧財產權爭議,筆者在此也想分享一下個人對AI繪圖中的三要素的著作權歸屬觀點,希望能拋磚引玉,歡迎各位一起討論:

1.  訓練集

訓練集可以簡單理解成訓練模型時所收集的各類作品圖,筆者認為其中包含了兩類:完全原創訓練集以及包含第三方作品訓練集。

完全原創訓練集是指,訓練集中的所有作品都是模型製作者本身所擁有合法智慧財產權的,這份訓練集的著作權,筆者認為完全歸模型製作者所有,也不會侵犯任何第三方的權利,這應該也不需要展開討論了。

包含第三方作品訓練集,顧名思義,則是訓練集中包含了部分或者全部都是第三方作品的訓練集。筆者認為這類訓練集,第三方作品的著作權歸第三方所有,訓練集本身(這時是彙編作品)的著作權歸收集者所有,且收集和使用其訓練大模型的行為並不會侵犯第三方的權利,除非使用了第三方明確宣告不允許用於訓練AI模型的作品。

筆者在之前的文章也表達過類似的觀點(可詳看本文前半部分貼過的連結文章),AI模式的訓練過程,起碼Diffusion演算法,只是學習各種共性,而人類作品的共性都離不開人類共同的文化、思想、審美,就算一個作品有創新的部分,在絕對的大模型中,這種創新都會顯得微不足道(此前的文章中已經分析過LoRA模型的侵權問題,在此不再複述)。最終生成的大模型,必然不會侵犯訓練集中第三方作品作者的著作權。

但筆者也尊重每位著作權人對其作品的保護權利,宣告“不允許用於AI訓練”是著作權人的權利,訓練集收集者也有義務尊重這種權利。

2.  模型

AI模型特指已經經過使用訓練集配合特定演算法訓練,可直接用於推理生成AI繪圖成品的模型。

筆者認為,這類模型的著作權人是模型的製作人,但除非使用了完全原創訓練集,否則模型著作權人不享受該模型生成作品的著作權。

使用了完全原創訓練集時,意味著模型的生成結果都是模型著作權人擁有著作權作品的特性,這種特性雖然同樣基於了社會的共性,但包含了更多著作權人的“思考結果”,是以往“智力成果”的歸納與總結,理應由著作權人自行享有相關作品的著作權。

當使用了包括第三方訓練集時,這時模型的生成結果更多是社會的共性,這種共性並非模型著作權人的“思考結果”,而是屬於訓練集中乃至全人類共同努力的結晶,任何一個人都不應該且沒有權利獨自享有某種社會共性所代表的著作權。

3.  生成作品的著作權

除非是使用了基於自己作品訓練出的模型所生成的作品,否則任何人都不享有直接AI生成作品的著作權。

直接AI生成作品是指,沒有經過使用者二次創作,單純由AI模型所生成的各類圖片。

筆者支援AI只是工具的觀點,但使用AI的人,僅僅只是使用者,並非生成結果的創作者。AI所生成的一切“作品”,起碼在目前,都是基於數學與統計學的計算結果。無論使用者在生成結果前花費了多少“智力”與“努力”,都僅僅只是“不斷嘗試在公式上套入不同的引數以求獲得更好的結果”,無論生成的過程還是最終的結果,實際並沒有多少人為干預因素。

AI直接生成的“作品”不具備著作權的要素,因而也不應受著作權法保護。

但一旦基於AI作品進行了二次創作,包括重新繪製影像中的部分內容、修復結構錯誤、新增更多的元素內容等,當人為新增的部分超越了AI作品本身所佔的比例時,則使用者享有新作品的著作權。

此時AI作品只是成為了新作品素材的一部分(如同正常繪畫時使用的參考圖),人的“智力投入”已經超過了“機械生成”的部分,因此達到了獲得“著作權”的要件。

六、總結

本案中,被告屬於直接使用了原告的圖,這點筆者就目前證據而言暫時沒有任何異議。

但筆者認為,基於本文提及的技術原理,原告同樣不具備涉案圖片的著作權,被告並不構成侵權。

不管本案是否屬於部分網友認為的“人為第一案”,針對AI帶來的新型智慧財產權問題,我們應該都能認識到一點:智慧財產權相關的法律保護方式和認知,需要更快與技術原理接軌了。

針對新技術的智慧財產權問題,我們不能仍遵循過去的經驗,更應從技術原理出發,透過深入分析技術的本質,結合智慧財產權的核心保護原則,去判定該技術是否構成智慧財產權以及相關行為是否侵權。

否則只會容易著了“經驗主義”與“主觀主義“的道。

作者簡介

萬字!從技術角度評析AI著作權第一案 | 誰擁有算力,誰壟斷國內AI著作權的未來?
李伯陽 律師

李伯陽,北京市隆安(廣州)律師事務所律師、隆安灣區人工智慧法律研究中心高階顧問。具有近十年網際網路法律實務經驗,曾先後為創業板上市網際網路企業、全國網際網路綜合實力 50 強企業、網際網路快時尚零售獨角獸等網際網路企業提供法律服務,擅長辦理網際網路類企業訴訟與合規業務,擅於透過計算機技術手段深度挖掘證據。


來源:遊戲人的法律手冊
原文:https://mp.weixin.qq.com/s/l8lHqiweVTemoqx2_EYg7g

相關文章