阿里巴巴推出EMO：會說話的肖像

banq發表於2024-02-28

原文網址 : https://www.jdon.com/72707.html

阿里

阿里巴巴集團智慧計算研究院推出：EMO：Emote Portrait Alive - 在弱條件下使用音影片擴散模型生成富有表現力的肖像影片

我們提出了 EMO，一種富有表現力的音訊驅動的肖像影片生成框架。輸入單個參考影像和聲音音訊，例如說話和唱歌，我們的方法可以生成具有表情豐富的面部表情和各種頭部姿勢的聲音頭像影片，同時，我們可以根據輸入影片的長度生成任意持續時間的影片。

透過專注於音訊線索和麵部運動之間的動態和細微差別的關係，解決了增強說話頭部影片生成中的真實感和表現力的挑戰。我們確定了傳統技術的侷限性，這些技術往往無法捕捉到人類表情的全部頻譜和個人面部風格的獨特性。

為了解決這些問題，我們提出了EMO，一個新的框架，利用直接的音訊到影片的合成方法，繞過中間的3D模型或面部標誌的需要。我們的方法確保了整個影片中的無縫幀轉換和一致的身份保留，從而產生了高度表現力和逼真的動畫。

實驗結果表明，EMO不僅能夠產生令人信服的說話影片，而且還能產生各種風格的唱歌影片，在表現力和真實感方面明顯優於現有的最先進的方法。

效果點選標題

會說話的ABAP report
2018-03-25
《空瓶子》評測：如果瓶子和杯子會說話
2020-11-18
俺不會說話，俺莫有文化，俺只會正則表達。
2021-01-04
1009 說反話
2024-04-12
白話說框架
2020-11-22
框架
首個支援普通話和方言混說的TTS大模型：河南話、上海話、粵語說得溜
2024-08-13
TTS大模型
阿里巴巴財報電話會議實錄：2020年疫情會對收入產生負面影響
2020-02-28
阿里
Cassandra的Session會話
2021-09-09
Session會話
“會說話的鍵盤”:一個惡意推廣木馬的詳細分析
2020-08-19
我的HTML會說話——從實用出發，談談HTML的語義化
2018-03-05
HTML
使用免費的 AI 自己設計一個會說話的動畫IP形象
2024-06-26
AI動畫
阿里巴巴fastjson @JSONField 註解說明
2018-12-22
阿里ASTJSON
OpenAI推出ChatGPT對話式AI模型
2022-12-04
OpenAIChatGPT模型
好的程式碼可以自己說話！
2019-03-01
說來話長的 Javascript 原型鏈
2019-01-20
JavaScript原型
吊打阿里EMO？讓馬斯克唱Rap、奧特曼說脫口秀的AI神器出圈，人人免費可用
2024-06-20
阿里馬斯克奧特曼AI
ZooKeeper 會話的祕密
2021-04-01
會話
邦芒職場：職場必學會判斷說場面話的場合
2023-12-26
ElevenLabs X-to-Voice：社交賬號自動生成能說話的個人頁面；OpenAI 正式推出 ChatGPT 搜尋
2024-11-01
OpenAIChatGPT
學會用資料說話-分散式鎖究竟可以多少併發？
2018-07-09
分散式
會話管理
2021-01-04
會話
實話實說：只會.NET，會讓我們一直處於鄙視鏈、食物鏈的下游
2021-03-11
《我的朋友佩德羅》：是什麼催生出了那根會說話的香蕉？
2019-07-04
藏在煤箱中的文明：一個會說話的箱子能告訴我們什麼？
2021-08-04
[PAT B] 1009 說反話
2019-12-25
聽,是版本在說話
2021-12-04
為什麼sleeping的會話會造成阻塞
2023-02-15
會話
[程式碼會說話] 原創技術視訊第二週小結
2019-01-30
YouGov：全球31%的人認為會說普通話是一項重要資產
2019-06-29
Go
萬能碼用實力說話（安全掃碼專業委員會）
2021-11-27
oracle的會話如何自殺？
2019-04-18
Oracle會話
2018-06-15 蔡康永的說話之道 003
2018-06-15
MQTT-會話
2023-04-28
MQQT會話
高階啞光肖像Lightroom預設
2020-12-03
OOM
為什麼sleeping的會話會造成阻塞(2)
2023-02-17
會話
TensorFlow學習之會話Sesstion()和互動會話InterativeSesstion()
2020-04-06
會話
用資料說話，《集合啦！動物森友會》到底有多火？
2020-04-30
未來超乎想象，科學家預測2045年房子會說話
2018-03-07

阿里巴巴推出EMO：會說話的肖像

相關文章