吊打阿里EMO?讓馬斯克唱Rap、奧特曼說脫口秀的AI神器出圈,人人免費可用

机器之能發表於2024-06-20
機器之能報導
編輯:楊文
以大模型、AIGC為代表的人工智慧浪潮已經在悄然改變著我們生活及工作方式,但絕大部分人依然不知道該如何使用。

因此,我們推出了「AI在用」專欄,透過直觀、有趣且簡潔的人工智慧使用案例,來具體介紹AI使用方法,並激發大家思考。

我們也歡迎讀者投稿親自實踐的創新型用例。

最近,AI 圈颳起一股「讓照片開口唱歌」的風潮。

例如,讓黴黴唱碧昂絲《Halo》的 Hallo、史丹佛創業團隊的 Proteus、以及之前阿里出品的 EMO。

就在昨天,又有一家名為 Hedra 的公司前來踢館,推出了基礎模型 —— Character-1 。

關鍵是,人人免費可用。

圖片

網友們已經玩瘋了。

讓女版馬斯克唱安妮・海瑟薇寫給狗仔隊的 Rap:

吊打阿里EMO?讓馬斯克唱Rap、奧特曼說脫口秀的AI神器出圈,人人免費可用

讓垃圾桶、土豆人開口說話:

吊打阿里EMO?讓馬斯克唱Rap、奧特曼說脫口秀的AI神器出圈,人人免費可用


也有網友開始製作動畫片:

吊打阿里EMO?讓馬斯克唱Rap、奧特曼說脫口秀的AI神器出圈,人人免費可用

AI 電影製作人 @Uncanny_Harry 則用它製作了卡通角色 Dave,送上一份遲到的父親節禮物,並稱「這是我所見過的 AI 生成影片中最接近真實表演的作品」。

吊打阿里EMO?讓馬斯克唱Rap、奧特曼說脫口秀的AI神器出圈,人人免費可用


據他本人介紹,他先用 Midjourney 生成一張圖片,然後使用 ElevenLabs 的聲音轉換技術,以及 Hedra,最終創造了 Dave 這一角色。

圖片

由於效果相當驚豔,不少網友直呼:愛慘它了,口型同步令人驚歎。

圖片

圖片


-1-

傻瓜級玩法

據官方介紹,與其他競品相比,Hedra 主要有三大優勢:

  • 免費體驗,不過公測期間每條影片最長不超過30秒;

  • 生成速度快,每分鐘可生成 90 秒內容,前提是他們 H100 供應充足;

  • 角色表情豐富,能夠流暢地進行對話、歌唱、說唱。

其玩法也很簡單。使用者只需上傳一張圖片,再生成一段音訊,就能讓它開口說話或唱歌。

Hedra 連結:https://www.hedra.com/

開啟上述連結,使用谷歌郵箱等註冊登入。

進入操作介面後,我們生成或上傳一段音訊。

值得一提的是,目前該應用主要支援中文和英文,而且中文效果會更好。

我們上傳一段搞笑段子音訊。

圖片

接著就是上傳或者生成一張圖片。官方還貼心地給出提示詞指南。

為了生成效果最佳,提示詞中儘量包括風格、角色特徵、相機視角、背景場景以及光線效果等內容。

圖片

例如,90s sitcom character,shoulders-up,in living room,soft lighting(90 年代情景喜劇角色,肩膀以上,客廳中,柔和光線)

圖片

Anime woman,2d,close-up on face,forest at night,cinematic lighting(動漫女性,2D 風格,面部特寫,夜晚森林背景,電影級照明)

圖片

Woman, cyberpunk, matte blackarmor, dirty face, close-up, citynight, no people(女性,賽博朋克風格,啞光黑色盔甲,髒汙的臉龐,特寫鏡頭,城市夜景,無人)

圖片

我們圖省事,只輸入:a beautiful girl,雖然提示詞簡單,但生成效果還不錯。

圖片

最後點選「Generate video」,稍等片刻即可生成一段影片。效果如下:

吊打阿里EMO?讓馬斯克唱Rap、奧特曼說脫口秀的AI神器出圈,人人免費可用

我們還讓奧特曼說了一段脫口秀:

吊打阿里EMO?讓馬斯克唱Rap、奧特曼說脫口秀的AI神器出圈,人人免費可用

妖嬈的「馬斯克」唱英文歌:

吊打阿里EMO?讓馬斯克唱Rap、奧特曼說脫口秀的AI神器出圈,人人免費可用

-2-

挑戰阿里 EMO

實際上,讓照片開口說話、唱歌早不是什麼新鮮事,去年爆火的類似產品就有 D-ID、Heygen ,還有兩個月前上線的阿里 EMO。

開啟通義千問 APP,在頂端的「頻道」欄目中,找到「全民舞臺 - 玩法升級」。

圖片

如果想讓照片跳舞,就選擇「全民舞王」,若是想讓其唱歌,則選擇「全民唱演」。

「全面唱演」可以讓照片生成老師語錄、爆款熱歌、網路熱梗以及表情包等。

圖片

我們從眾多模板中選擇一款,然後上傳圖片即可。

圖片

我們看一下效果:

吊打阿里EMO?讓馬斯克唱Rap、奧特曼說脫口秀的AI神器出圈,人人免費可用

明明模仿的是皇后娘娘痛哭流涕的片段,但這生成的人物笑靨如花是怎麼回事。

兩相比較,Hedra 的表現似乎更勝一籌。

首先,Hedra 給足了使用者自由。使用者既可用它生成音訊和圖片,也能夠上傳現有的音訊和圖片,而阿里的 EMO 目前無法自定義音訊,而且有時還無法上傳圖片,只能使用系統給定的模板。

其次,Hedra 生成速度極快,不到一分鐘即可生成一段 30 秒的影片,而阿里的 EMO 生成一段 9 秒影片需要耗費 12 分鐘。

最後,從畫面上來看,Hedra 的口型基本能對上,還能根據語調生成對應的表情,就是臉部有時會變形。

以後我們會透過新專欄帶來更多 AIGC 案例演示,也歡迎大家進群交流。

相關文章