以大模型、AIGC為代表的人工智慧浪潮已經在悄然改變著我們生活及工作方式,但絕大部分人依然不知道該如何使用。 因此,我們推出了「AI在用」專欄,透過直觀、有趣且簡潔的人工智慧使用案例,來具體介紹AI使用方法,並激發大家思考。 我們也歡迎讀者投稿親自實踐的創新型用例。
天啊嚕,AI 真的成精了。
最近,AI 生圖真假難辨這事兒,鬧得那叫一個沸沸揚揚。(檢視詳情,請移步:AI在用 | 三步速成AI美女,又被AI一秒打回原形)
除了火爆全網的 AI 谷歌小姐姐,社交平臺上又冒出了形形色色的 FLUX 生成的人物照片,個頂個的逼真。(檢視FLUX詳情,請移步:實測最新文生圖神器FLUX:手刃Midjourney?早了點)
趁著這波熱度,微軟總裁 Brad Smith 在 X 平臺上釋出了一個 AI 測試小遊戲 ——Real or Not ?
玩法很簡單。每一輪遊戲有 15 張圖片,玩家來判斷哪張是 AI 生成的,哪張是真實的。
我們試玩了一下,15 張圖片猜對了 6 張,正確率還不到一半,真搞不懂是我眼瞎還是 AI 太逆天。
-1-
呦呵!這真真假假的世界
近日,微軟總裁 Brad Smith 在 X 平臺上 po 出了一張照片,並附文稱:「你能判斷這張圖片是真實還是偽造的嗎?參加這個測試來檢驗你的 AI 識別技巧,並分享你的得分,共同助力打擊 Deepfake 技術的濫用。」
同時,他還給出了這款小遊戲的連結:
https://www.realornotquiz.com/
這裡面的圖片真實得有多離譜?
看看這位女士,微笑時眼角自然皺起的魚尾紋、嘴角的法令紋,淺棕色的眼睛,頭髮絲,甚至是隱約可見的色斑,都真實得不得了,但結果 ——
她竟然是 AI。
再看這四朵小黃花,畫質過於清晰,左下角的花瓣似乎有些扭曲變形,瞅著特別像 AI 抽風的「傑作」,但是 ——
這是真實的!
真服了這個老 6!開局就栽跟頭。
再給幾張圖片讓大家猜猜:
沒錯,以上這四張照片都是真實的。
經過我們火眼金睛一頓瞅,最終正確識別 40% 的圖片。
多番試驗,再加上網友們的啟發,我們發現了 AI 生成圖片的 bug。
第一看細節,尤其是手指是否畸形、影子是否扭曲等。
比如這幅多人彈吉他的圖片,仔細觀察會發現左側沙發上彈吉他的人憑空多出一隻手。
再比如這幅夕陽下海邊剪影。乍一看沒啥毛病,但看那人的影子,腦袋像個機器人,由此判斷是 AI 生成。
第二看畫質、膚質。
如果畫質過於清晰,皮膚細膩到看不見毛孔,額頭和兩頰還呈現出光澤感,這十有八九是 AI 生成的。
第三看是否符合物理世界邏輯。
例如消防員滅火時噴灑的乾粉滅火器,怎麼可能像下過雪一樣,堆得到處都是?
一輛生鏽破舊的坦克,大機率不會丟棄在遊樂園附近。
-2-
你到底是不是人?
無獨有偶。
去年還火了一款號稱「社交圖靈測試」的 AI 小遊戲 ——Human or not?
官網連結:https://app.humanornot.ai/
此遊戲綜合了 Jurassic-2、GPT-4、Claude 和 Cohere 四個大語言模型。
遊戲規則:系統線上給你分配一個搭檔(partner),你們只被允許限時聊 2 分鐘。然後,系統讓你回答螢幕對面的這個 partner 究竟是人類(Human)還是 AI 機器人(AI Bot)。
大家猜猜對方是人類還是個機器人?
這英語表達、這傲嬌的語氣,多像個真實的人類,但…… 它是個機器人。
再來一個:
聊完一個回合,在遊戲時間未耗盡的情況下,對方突然離開,毫無疑問,這就是人類。
而這種有問必答,禮貌得體的,則是 AI。
經過多番較量,我們摸索出一個經驗,回答簡短的不一定是 AI,但回答得長篇大論的,大機率是 AI,因為 20 秒根本來不及打太多字。(每次回答都有時間限制,20 秒)
此前,《每日郵報》的記者也進行了相關測試,在 10 次對話中,有 6 次猜對。報導稱,雖然 AI 偶爾會出現糟糕的語法,但它確實成功地複製了人類的語言,讓「Human or not?」的遊戲變得極其困難。
早在 70 多年前,電腦科學和密碼學先驅艾倫・麥席森・圖靈提出「圖靈測試」這一概念。
他認為,測試者與被測試者(一個人和一臺機器)在隔開的情況下,透過一些裝置(如鍵盤)向被測試者隨意提問。多次測試後,如果機器讓每個參與者做出平均超過 30% 的誤判,那麼這臺機器就透過了測試,並被認為具有人類智慧。
AI 發展到今天這個地步,社交媒體上早已充斥著大量真假難辨的圖片、影片,甚至聊天時都不知道對面是真人還是 AI。
我們在體驗到新奇和有趣的同時,也會有些恍惚和「小小的恐懼」,《黑鏡》降臨的世界究竟如何。。。
https://app.humanornot.ai/
以後我們會帶來更多好玩的AI用例,也歡迎大家進群交流。