Nature專業戶DeepMind又登封面,開源水印技術SynthID-Text,Gemini已經用上了

机器之心發表於2024-10-24

現如今,大型語言模型(LLM)生成的內容已經充斥了整個網際網路,並且這些模型還能模仿各種類似真人的語氣和行文風格,讓人難以分辨眼前的文字究竟來自人類還是 AI。

這樣的問題或許可透過所謂的水印(watermarking)技術來解決。

谷歌開發的 SynthID 文字水印技術登上了最新一期 Nature 雜誌封面,之前機器之心已經報導過該公司開發的影像水印技術,參閱《給 AI 生成影像「加水印」,谷歌釋出識別工具 SynthID》。

圖片

給影像和文字新增水印具有各不一樣的難點。

在給影像新增水印時,由於人眼的辨別相近色彩和能力遠不及機器 —— 畢竟在機器「看」來,這些不同顏色本質上只是不同的數值。以下動圖展示了多張加了水印和未加水印的對比影像。是不是完全看不來水印在哪裡?

圖片

但對於以序列形式展示的文字,人類和機器一樣可以分明地看見其中全部資訊。那麼該如何給文字新增水印呢?

為了使人工智慧生成的文字更易於識別,Google DeepMind 建立了 SynthID-Text,現已透過 Google Responsible Generative AI Toolkit 開源。

圖片

論文地址:https://www.nature.com/articles/s41586-024-08025-4

開源地址:https://github.com/TransluceAI

SynthID-Text 是一種可立即投入生產的文字水印方案,可保持文字質量並實現高檢測精度,同時將延遲開銷降至最低。並且,SynthID-Text 不影響 LLM 訓練,僅修改取樣程式;水印檢測計算效率高,無需使用底層 LLM。

圖片

SynthID-Text 建立在以前生成水印元件的基礎上,並引入了一種新型取樣演算法,即 Tournament 取樣。SynthID-Text 可以配置為非失真(保留文字質量)或失真(以犧牲文字質量為代價提高水印可檢測性)。在這兩種設定中,SynthID-Text 都提供了更高的檢測率。

簡單舉個例子,對於短語「我最喜歡的熱帶水果是__」,LLM 可能會使用 token「芒果」、「荔枝」、「木瓜」或「榴蓮」來完成句子,並且每個 token 都會給出一個機率分數。當有一系列不同的 token 可供選擇時,SynthID 可以調整每個預測 token 的機率分數,以免影響輸出的質量、準確性和創造力。

圖片

谷歌透過對來自 Gemini 實時互動的近 2000 萬條響應進行了大規模使用者反饋評估,結果表明:非失真 SynthID-Text 可以保持文字質量。因此,SynthID-Text 已被用於為 Gemini 和 Gemini Advanced 新增水印。這證明生成文字水印可以成功實施並擴充套件到現實世界的生產系統,為數百萬使用者提供服務。

此外,谷歌還提供了一種將生成水印與投機取樣(speculative sampling)相結合的演算法,允許將 SynthID-Text 整合到大規模生產系統中,而額外的計算開銷可以忽略不計。

圖片

不過,SynthID-Text 目前僅可以處理短至三句話的文字,以及經過裁剪、解釋或修改的文字,但卻很難處理短文字、被重寫或翻譯的內容,甚至是對事實問題的回答。

谷歌表示:「SynthID 並不是識別人工智慧生成內容的靈丹妙藥,但 SynthID 將是開發更可靠人工智慧識別工具的重要組成部分。」

參考連結:

https://www.theverge.com/2024/10/23/24277873/google-artificial-intelligence-synthid-watermarking-open-source

相關文章