寡姐怒了,GPT-4o系統配音強行模仿,OpenAI回應刪除

机器之心發表於2024-05-21
GPT-4o 其中一個聲音是不是在模仿斯嘉麗・約翰遜,大家不妨聽一下。
寡姐怒了,GPT-4o系統配音強行模仿,OpenAI回應刪除GPT-4o 的釋出,讓很多人聯想到科幻愛情電影《Her》中的類似情景,影片講述了主人公西奧多 —— 一位信件撰寫人與人工智慧系統 OS1 薩曼莎的愛情故事。劇中給薩曼莎配音的著名影星斯嘉麗・約翰遜擁有迷人的聲線,更是給薩曼莎增加了人類情感。寡姐怒了,GPT-4o系統配音強行模仿,OpenAI回應刪除
電影《Her》中的片段。

圖片 斯嘉麗・約翰遜在其他電影中的劇照。

此前,OpenAI CEO Altman 還在社交平臺上神秘地留下一句「her」,似乎也在暗示 ChatGPT 實現了這部電影中的場景。

圖片

瞭解過 GPT-4o 的人都知道,其功能之一就是進行實時語音互動。然而,其中一位配音員的聲音被質疑與斯嘉麗的聲音類似。

圖片

OpenAI 週一宣佈,在使用者發現 ChatGPT 使用的其中一個聲音聽起來與斯嘉麗・約翰遜相似後,OpenAI 將刪除該聲音。上週 OpenAI 在演示其新的 GPT-4o 模型時使用了這個名為 Sky 的語音,目前該語音已被暫停。

圖片 OpenAI釋出的宣告部落格。來源:https://openai.com/index/how-the-voices-for-chatgpt-were-chosen/

OpenAI 在部落格文章中寫道:「我們認為,人工智慧聲音不應該刻意模仿名人獨特的音質 ——Sky 的聲音不是模仿斯嘉麗・約翰遜,而是屬於另一位專業女演員,是她自己自然的說話聲音,為了保護這些配音員的隱私,我們不能透露配音演員的名字。」

圖片上週,一段演示影片在社交媒體上流傳,使用者發現這個聲音與約翰遜的聲音相似。一些人嘲笑這個聲音過於輕浮,而另一些人則將其比作男性的幻想。該影片在網上瘋傳。

關於為什麼採用這類聲音,OpenAI 表示,他們希望聊天機器人的聲音聽起來「親切友善」並能贏得信任,還希望聊天機器人的聲音「溫暖、迷人、激發自信、富有魅力」。

OpenAI 表示,他們已經與斯嘉麗的代表取得了聯絡。

「我們一直在與 ScarJo 的團隊進行對話,兩者之間似乎存在一些困惑。我們希望認真對待反饋並傾聽他們的擔憂。」OpenAI 模型行為主管 Joanne Jang 說道。

展望未來,OpenAI 表示計劃「在 ChatGPT 中引入更多聲音,以更好地匹配使用者的不同興趣和偏好」。

奧特曼邀約被拒
斯嘉麗發宣告揭露事情始末

另外,據 The Verge 報導,OpenAI 曾邀請斯嘉麗為 ChatGPT 配音,當時她拒絕了。在一份宣告中,斯嘉麗表示,她現在不得不去聘請法律顧問尋求幫助,並已向 OpenAI 傳送了兩封信件。

斯嘉麗表示,去年 9 月,她收到了奧特曼的邀約,為當前的 ChatGPT 4.0 系統配音。奧特曼就在公司首次演示 ChatGPT 語音的前兩天還聯絡了她的經紀人,要求她重新考慮。

GPT-4o 釋出後,斯嘉麗對其中的配音感到震驚、憤怒和難以置信,因為 Sky 聲音聽起來和她的聲音出奇地相似。

圖片

至少目前看來,斯嘉麗似乎只是想要一個解釋。她表示,她正在尋求以透明形式解決問題,並要求 OpenAI 詳細說明他們建立 Sky 聲音的具體過程。

對於此事,斯嘉麗還發布了一篇宣告,宣告如下:

去年 9 月,我收到了 Sam Altman 的邀請,他想請我為當前的 ChatGPT4.0 系統配音。他告訴我,他覺得由我來為這個系統配音,可以在科技公司和創意人員之間架起一座橋樑,幫助消費者適應人類和 Al 之間的巨大轉變。他說,他覺得我的聲音會讓人們感到欣慰。


經過深思熟慮,出於個人原因,我拒絕了這一邀請。九個月後,我的朋友、家人和公眾都注意到,名為「Sky」的新系統聽起來多麼像我。

當我聽到釋出的試聽版本時,我感到震驚、憤怒、難以置信,Altman 先生竟然會用一個聽起來與我如此相似的聲音,以至於我最親密的朋友和新聞機構都無法分辨兩者的區別。Altman 先生甚至暗示這種相似是有意為之,他在推特上只說了一個單詞「her」,指的是電影中我配音的聊天系統 Samantha,她與一個人類建立了親密關係。

在 ChatGPT 4.0 demo 釋出前兩天,Altman 先生聯絡了我的代理,請我再考慮一下。我們還沒來得及聯絡,系統就已經出來了。

由於他們的行為,我被迫聘請了法律顧問。顧問給 Altman 先生和 OpenAl 寫了兩封信,闡明瞭他們的所作所為,並要求他們詳細說明建立「sky」語音的確切過程。OpenAl 勉強同意了刪除「sky」語音。


在我們都在努力解決 deepfake,保護我們自己的肖像、作品、身份的時候,我相信這些問題需要絕對的澄清。我期待著事情以透明、立法的形式得到解決,以幫助確保個人權利得到保護。

為什麼斯嘉麗如此憤怒?

看到斯嘉麗的宣告,很多人可能無法理解她為何如此憤怒。這還要從多年前流行起來的 Deepfake 技術說起。

Deepfake 直譯是深度偽造,它可以透過人工智慧技術把所有影片中的人臉換成你想要的人,進而滿足很多人「大膽的想法」。自從 2017 年該技術流行之後,斯嘉麗就成了很多換臉影片的主角。這些不雅影片觀看量可能高達數百萬次,私下傳播更是不計其數。

後來,隨著技術的發展,偽造的範圍從人臉特徵延伸到表情、身體動作,以及聲音。這種惡劣的影響一直處於失控的狀態。

作為一名公眾人物,斯嘉麗可以為自己發聲。但如果不雅影片的主角變成了普通人,其傷害可能更加深遠。

圖片

就像 2019 年,斯嘉麗在一篇宣告中寫的:

很明顯這對我的影響沒有那麼大,因為人們知道色情影片裡的人並不是我。我認為對此的相關訴求從法律上講是無用的,主要原因在於網際網路是一個巨大的黑暗蟲洞,不停地吞噬它自己。在黑暗的網路上有很多比這件事更令人恐慌的事情。我認為是否捍衛自己的肖像權、要求賠償取決於個人。

我的意思是,對我來說這種努力是無用、沒有結果的,但是對於那些因此可能丟掉工作的人來說就不同了。

此外,每個國家在保護公民肖像權方面有自己的法律法規,因此即使你能夠清除美國網站上的相關內容,可能也無法清除德國網站上的內容。即使你的影像版權屬於你,同樣的版權法在國外未必可行。我對此非常難過。

事實是,對大多數人而言,嘗試保護自己免受網際網路及其邪惡屬性的侵擾是註定要失敗的事情。脆弱的人(如女性、兒童和老人)必須採取額外的措施才能保護自己的身份和個人內容。不管谷歌的策略多麼嚴苛,這都不會改變。(九月份,谷歌將「非自願合成色情影像」加入黑名單。)

網際網路是販賣色情的一大場所,脆弱的人會被攻擊。低階駭客就可以偷竊密碼和身份。每個人都有可能成為目標,這只不過是時間問題。

人們認為密碼可以保護他們,只有公眾人物才有被黑的風險。殊不知,對駭客來說,攻擊誰並沒有太大差別,這隻取決於 ta 想不想攻擊你。

很明顯,如果一個人有更多資源,那麼他們可能會使用更多資源為其數字身份保駕護航。但是沒有什麼能夠阻止別人將我或其他人的影像貼到別的身體上,並且合成的內容非常逼真。網際網路沒有規則,它是幾乎沒有法律的深淵,能夠抵禦美國警方。


當然,生產 AI 模型的科技公司也在努力消除這些影響,比如在模型中設定嚴格的限制。有時,這些限制甚至顯得過於嚴格。

圖片

很多公司也推出了相應的檢測工具。比如 OpenAI 前不久釋出的虛假影像檢測器。它可以用來識別 DALL-E 3 建立的影像,準確率高達 98.8%。

但隨著 AI 生成的內容越來越逼真,檢測的難度也會變得越來越高。

隨著影響範圍的不斷擴大,世界各國也在加快立法的步伐。但這注定是一場持久戰。

參考連結:
https://techcrunch.com/2024/05/20/openai-to-remove-chatgpts-scarlett-johansson-like-voice/
https://www.theverge.com/2024/5/20/24161253/scarlett-johansson-openai-altman-legal-action

相關文章