科技愛好者週刊(第 278 期):棘手的 AI 版權

阮一峰發表於2023-11-17

這裡記錄每週值得分享的科技內容,週五釋出。

本雜誌開源,歡迎投稿。另有《誰在招人》服務,釋出程式設計師招聘資訊。合作請郵件聯絡[email protected])。

封面圖

雞鳴驛位於河北省張家口,是中國現存最大的古代驛站遺址,當年供郵差休息和更換馬匹。(via

棘手的 AI 版權

AI 是一個新事物,帶來了很多前所未有的問題。

最棘手、最有爭議、也最有意思的,大概就是版權問題。

具體來說,就是下面這個問題:AI 訓練(學習)時,能不能使用版權材料,從而具備模仿版權所有者的能力?

舉例來說,前一段時間,網上出現了"AI 孫燕姿",有人用孫燕姿的歌曲作為訓練材料,讓 AI 模仿孫燕姿的聲音,演唱其他歌手的歌曲。

我問大家,這有沒有侵犯孫燕姿的版權?

一種觀點是,侵犯版權了,因為未經授權就模仿了孫燕姿的聲音。如果聽任 AI 模仿孫燕姿,真人還沒唱,AI 就先唱了,以後誰還會花錢去聽真人演唱?

另一種觀點是,沒有侵犯版權,因為 AI 是學習孫燕姿的聲音,而不是複製。AI 唱的是孫燕姿本人沒有唱過的歌曲,屬於 AI 的創作,所以不存在侵犯版權。

你贊成哪一種觀點?

這個問題有趣的地方在於,如果把 AI 換成人,就沒有爭議了。

假設有一個小姑娘,刻苦模仿孫燕姿,終於有一天,可以用一模一樣的聲音演唱了,這個小姑娘有沒有侵犯孫燕姿的版權?

我相信,所有的人都會認同,這不是侵權行為。一個人模仿另一個人的特點,並不侵犯後者的版權。

我模仿梵高的風格畫畫,模仿魯迅的風格寫作,模仿那些最優秀的程式設計師的風格程式設計,達到了可以亂真的地步。只要我創作的是自己的作品,就都是合理合法的行為。那麼為什麼 AI 做同樣的事情,就會被認為侵權呢?

但是,又不能完全把 AI 等同於真人。模仿梵高的畫家千千萬,絲毫不影響梵高真跡的價值,換成 AI 就不一定了。

如果允許"AI 孫燕姿"與"真孫燕姿"同時存在,搞不好會嚴重衝擊後者的收入。人們還會不會掏錢購買孫燕姿的歌曲,真是不一定。

這就是困難的地方。如果認定 AI 模仿不是侵權,我們不知道會有怎樣的後果,現有的版權資產會不會大幅貶值。

而且,AI 衝擊最大的,還不是已經成名的人,而是底層的小人物。試想一下,如果沒有版權保護,電影公司僱傭一天群眾演員,使用 AI 充分學習他們,然後就可以無限使用他們的"AI 分身",最多改一下他們的臉,然後就再也不必僱傭他們了。

總之,AI 的版權是一個非常麻煩的問題。版權保護的是"複製權",但是 AI 涉及的是"學習權"。如果禁掉 AI 的學習權,相當於說,有些事情只能人做,不能機器做,這說不通,現實中也很難操作。如果不禁,可能影響版權所有人的生計。

另外,除了個人風格的複製,內容的總結也是類似的情況。你看完一部小說(或電影),把情節複述給朋友,這是完全合法的。但是,AI 能不能做這件事呢,"10分鐘幫你讀完一部小說"?我們也可以從同樣的角度,來思考這個問題。

[本週軟體] TGFX:強大易用的 2D 圖形庫

本週,向大家介紹一款比較重要的工具軟體。

它是國內很多頭部業務的核心元件,前不久剛剛開源,知道的人還不多。它就是來自騰訊的 2D 圖形庫 TGFX

很多朋友可能不清楚,圖形庫是幹嘛的,為什麼很重要?

我們每天使用計算機(包括手機),接觸的都是圖形介面,那些漂亮的元件,它們都依賴於圖形庫。計算機本質上只是一個計算引擎,只會計算。你想要圖形介面,必須呼叫專門的圖形庫,才能獲得圖形能力。

圖形庫(包括元件庫)一般由作業系統提供,但是如果軟體跨系統,或者要求特殊效果,就必須用外部圖形庫。目前最流行的通用 2D 圖形庫是谷歌的 Skia,它是開源的,Chrome 瀏覽器、Android 系統、谷歌地圖都用它。

TGFX 的開發目的,就是要替代 Skia。 它起源於騰訊的動效解決方案 PAG。當時,騰訊內部很多專案,都有很強的動畫效果需求,而且要求跨平臺,所以就有了 PAG 這個專門製作動效的工具。

PAG 的核心就是圖形庫,最早用的是 Skia,但後來發現兩個問題:首先,Skia 有歷史包袱,打包體積大,效能也比較保守;其次,中國開發者看重的一些問題,開發團隊往往不能(或不願)跟進。

最終,PAG 團隊下定決心,換掉 Skia,開發自己的圖形庫 TGFX。 這件事的難度不小,要用 C++ 開發,相容各種作業系統的圖形介面(目前主要是 OpenGL),做出各種各樣的圖形,還要保證效能和渲染效果。他們2021年開始做,直到今年才小有所成。TGFX 有幾個鮮明特點。

(1)充分利用現代 GPU 的計算能力,保證效能。

(2)提供全面的圖形能力:各種圖片、向量和文字的 2D 繪製全部支援。

(3)做到 Skia 的輕量化平替,打包體積僅 400KB,實現了 2MB 的 Skia 的絕大部分功能。

(4)使用成本低。API 與 Skia 基本相同,並且進行了簡化和整合。

PAG 4.0 把圖形引擎從 Skia 改成 TGFX 後,包體積降低65%,向量渲染效能提升 60%。

截止2023年7月,藉助 PAG 專案,TGFX 已經執行在1000+的國內頭部業務,其中不僅有騰訊的微信、手機 QQ、王者榮耀,也有小紅書、知乎、BiliBili 等外部專案。穩定性經過了10億+使用者裝置的驗證,效能表現也不凡,比如為騰訊文件帶來了50%的記憶體降低。

TGFX 以前是 PAG 專案的一部分,最近才獨立出來,變成一個單獨的開源專案,放在 GitHub 上面。如果你的專案需要圖形引擎,不妨試試它。

這個專案才剛剛開源,騰訊會對它長期大力投入。對圖形開發有興趣的朋友,可以研究一下它的程式碼和文件,相信可以學到很多東西。有什麼想法和意見,都可以向開發團隊反饋,他們會及時響應。

科技動態

1、AI Pin

上週,世界第一個可穿戴 AI 裝置在美國上市,叫做 AI Pin。

它可以別在上衣上面,就像一個徽章,它的名字 Pin 就是"別針"的意思。

它的底層是安卓系統,透過手機 SIM 卡聯網。它帶有語音和攝像頭,你可以跟它對談。

舉例來說,你看到一個火龍果,就問它:"這個東西含糖量多少?"它會回答:"整個水果含有7.31克糖。"

以後我們看到有人自言自語,不要奇怪,他可能在跟 AI 對話。

除了語音操控,它還支援觸控和手掌投影。

它的售價為699美元(約人民幣5100元),每個月還有24美元(約人民幣175元)的服務費。這麼貴的價格,功能又沒有超過手機,銷售前景不樂觀,幾乎肯定會失敗。

2、探路者1號飛艇

11月8日,當今世界最大的飛行器,探路者1號(Pathfinder 1)飛艇首次試飛,它是谷歌創始人謝爾蓋·布林資助的專案。

它的長度為124.5米,比三架波音737 Max 加起來還要長。

它使用電機操控,內部有13個氦氣氣囊,骨架由碳纖維和鈦金屬製成,外層還有特殊的阻燃塗層,總體上相當安全。

所有人員都呆在底部的乘客艙(上圖中,飛艇底部的小房間)。這個乘客艙相當小,一次最多載14人,最大負載在2噸到5噸之間。

飛艇的優勢是低空慢速飛行,還可以懸浮,並且非常安靜。但是,它的載客量這麼小,也不能防大風,很難有什麼實際用途。

3、眼球移植

上週,一家紐約醫院宣佈,已經在今年5月27日,完成了世界第一例"眼球移植手術",將一個人的眼球移植給另一個人,真是驚世駭俗。

患者是一名46歲的男子,他的左眼因嚴重電燒傷而失明。

移植五個月後,他的眼睛還是沒有恢復視力,但是大腦能夠感知眼睛的神經訊號,並且血管保持暢通。醫生認為本次手術是成功的,正在等待神經進一步生長,看看能否恢復視力。

雖然這個手術已經在動物身上進行過多次,但是人的眼睛更為精細和複雜,手術之前要用計算機進行 3D 模擬,精確對準骨骼和移植位置(上圖)。

整個手術持續了21個小時,投入的醫生、護士、後勤人員共140餘人(上圖)。

如果"眼球移植"能夠成功,就為那些因外傷而失明的人提供了巨大的福音。

4、Steam Deck 的照明

Valve 公司即將發售掌上游戲機 Steam Deck 的新版本"Steam Deck OLED"。新版本的主要賣點,就是有一個更亮的 OLED 螢幕。

為了突出這一點,他們想到一個點子,在廣告裡面使用 Steam Deck OLED 為自己照明。

上圖就是廣告截圖,一個 Steam Deck OLED 在中央,照明完全來自周圍的 Steam Deck OLED。

為了實現這個效果,他們製造了一個巨大的金屬圓球,把許多掌機掛在上面。

並且,使用軟體將所有螢幕同步,然後攝影師待在球體內拍攝,才達到想要的效果。

文章

1、如何釋出一個 TypeScript 軟體包?(英文)

TypeScript 語言寫的軟體包,怎麼釋出到 npm 上面?

2、C++ Fiber 基礎知識(英文)

React 引入了 Fiber,這個詞到底是什麼意思?它其實來自 C++,本文就介紹 C++ Fiber 的基本知識,前半部分都是通俗的講解。

3、被複制最多的 StackOverflow 程式碼片段(英文)

問答網站 StackOverflow 裡面,被最多人複製的程式碼片段是什麼?本文告訴你,這段程式碼裡面其實還有一個小錯誤。

4、可拖動物件的網頁實現(英文)

作者詳細講解,如何在網頁上實現一個可以拖動的物件,並且滑鼠和觸控都可以拖動。

5、自適應文字框的 CSS 實現(英文)

使用者輸入文字,如何讓網頁輸入框隨著文字的增加,自動增加高度?不用 JS,只用 CSS。

6、如何生成虛擬的世界地圖(英文)

作者想寫一個環遊世界的遊戲,就用演算法生成了一張虛擬的世界地圖。雖然看不懂技術,但是每一步都有圖片,很好玩。

7、英國青少年動畫比賽的最佳動畫(英文)

今年英國青少年動畫比賽的頭獎得主,是一個16歲的少年。他的作品《機器人做串串》的製作水準,讓人驚歎。

工具

1、ShortbreadAI

這個網站讓你方便地生成漫畫。

2、ripsecrets

這個工具用於檢查程式碼倉庫,有沒有洩漏金鑰。它可以配置在 CI/CD 流程裡面自動執行。

3、EmojiGen

根據文字提示生成 Emoji 圖案。

4、screenshot-to-code

一個開源的 Web 應用,使用者上傳一張網頁截圖,它會透過 OpenAI,給出該網頁的 HTML/Tailwind/JS 程式碼實現。

5、PageSpyWeb

一個開源的遠端除錯工具,提供類似瀏覽器控制檯的介面,進行遠端除錯。(@wqcstrong 投稿)

6、IPS

一個命令列工具, 查詢和處理 IP 地理位置資料庫。(@sjzar 投稿)

7、GWS

一個開源的高效能 WebSocket 實現,包括伺服器和客戶端,用 Go 語言編寫。(@lxzan 投稿)

8、ChatGot

在一個視窗內,同時跟多個模型互動,可以讓 GPT 輸出文字,然後用 @midjourney 生成圖片。(@qinleilxl 投稿)

9、網頁 AI 評審

這個 Web 工具對使用者提供的網址,進行 AI 評審,給出頁面的設計問題和改進建議。

它是免費的,但是使用者多的時候,會停止服務。如果 AI 表現好,以後設計稿評審和程式碼評審都可以交給它了。

10、AITDK

使用者輸入文章的主題,該網頁工具會自動生成 SEO 友好的標題、描述、關鍵詞和常見問題解答。(@typewe 投稿)

資源

1、GPT 線上目錄

基於 GPT 的工具越來越多了,下面的網站將這些工具整理在一起,做成一個線上目錄,方便查詢。

2、Bubble

該倉庫收集各種可以放在 GitHub Profile 和 Readme 上面的小元件。(@LHRUN 投稿)

3、Bing 影像建立器

微軟官方的 AI 文生圖服務。

4、YesChat.ai

該網站提供最新 AI 模型(GPT4V、Dalle3、Claude 2)的免費體驗,不過每天有次數限制。(@zengdamo 投稿)

5、機器學習入門教程

微軟官方推出的機器學習的入門教程(英文)。

圖片

1、太空工具包

11月1日,國際空間站的宇航員出站,進行日常的維修工作,不慎一失手,將一個裝螺絲刀的工具包遺失在太空中。

於是,這個工具包就成了地球的一個衛星(實際是太空垃圾),距離地面300多公里。下圖就是從國際空間站往下看這個工具包。

最妙的是,現在你在地球上,使用普通的家用天文望遠鏡,對著國際空間站的方向,是可以看到這個工具包的。

2、GPT-4V 自動生成圖表

上週,OpenAI 對外開放了 GPT-4 Vision (簡稱 GPT-4V)功能。你可以上傳圖片,然後向 GPT 提出各種玩兒問題。

有人就上傳了文字表格的掃描照片(下圖左),讓它自動生成視覺化圖表(下圖右)。

這證明了,GPT-4V 內建了 Python 指令碼,可以完成資料視覺化。早期是處理 .csv 檔案,現在則可以從圖片中提取資料。

3、MacOS 彈窗

蘋果的 MacOS 系統正變得越來越龐雜和臃腫,有大量的彈窗,用來請求許可權和安全提示。

下圖是一位站長購買 Mac 電腦後,從舊 Mac 電腦遷移系統時的截圖。

當時,遷移助手已遷移了所有應用程式,所有設定為自動啟動的應用程式同時啟動,就出現了這樣的畫面。

文摘

1、講故事能力

當代世界是一個資本過剩的世界,只要有足夠的人相信你,你就能拿到投資和高估值。

作為創始人,你的講故事能力,直接影響你的專案能否成功

只要你能很好地解釋自己,提煉出專案的亮點,並讓公眾以正確的方式瞭解你,你就有很大機會得到投資。

馬斯克和特斯拉就是最好的例子。特斯拉的估值非常高,只要投資者相信它的故事,它就有足夠的時間去實現它的估值。如果做不到讓投資者相信,它的估值就會崩潰。

這意味著,馬斯克的各種誇張言論和新聞,並不是譁眾取寵那麼簡單。他實際上是以一種低成本的方法在宣傳,營造一種氛圍,讓人們知道並相信他的故事,支援公司的高估值。

一家公司的故事講述得越好,它獲得資金就容易,市盈率就越高。

言論

1、

軟體的第一個版本,最多三個人就夠了:一個程式設計師、一個設計師、還有一個機動,既幹一點程式設計,也幹一點設計。

如果你發現三個人不夠,那就換人,或者縮小軟體初始版本的構想。

-- 《Getting Real》

2、

我對 ChatGPT 的理解就是,它類似於"整個人類知識的最大似然估計"。

我發現,周圍的人對它有兩種截然不同的看法:(1)嗯,這只是一個愚蠢的統計模型;(2)該死,人類完蛋了!

-- 《如何認識 ChatGPT》

3、

Debian 官方下載站,20多年來堅持不使用加密協議 HTTPS,只使用簽名檔案確保檔案可靠。這是為了讓那些不支援 HTTPS 的老電腦也能下載到更新包。

-- 《舊電腦的可用性》

4、

15世紀,德國人古騰堡發明了歐洲第一臺印刷機,可以快速印刷書籍。

當時,一些人反對這個發明,理由是印刷書籍越容易,傳播錯誤資訊就越容易。最終,印刷機還是發展起來了,因為大多數人認識到,防止錯誤的最佳方法是事實,而不是限制印刷機。

-- 《錯誤資訊的解藥》

往年回顧

網際網路公司需要多少員工?(2022 #231)

移動支付應該怎麼設計?(2021 #181)

你的頭腦是二值邏輯,還是三值邏輯?(2020 #131)

子輩能大幅超越父輩嗎?(2019 #81)

(完)

相關文章