新火種AI | 趙本山郭德綱一口倫敦腔,泰勒狂飆中文...AI技術再次火爆出圈!

xinhuozhong發表於2023-11-11

最近一段時間,你一定會在各大短影片網站刷到明星說外語的影片。事實上,AI換聲乃至AI換臉已經不是稀奇事了,大家也都到了見怪不怪的程度。但這次的“AI換聲”,與以往有著很大的不同,因為從聲音到口型,再到語速基本到了以假亂真的程度。這麼說吧,就算是影片裡的本人看見,也得愣上個3秒。

這一切,還真是應了那句話:AI時代,一切皆有可能。

新火種AI | 趙本山郭德綱一口倫敦腔,泰勒狂飆中文...AI技術再次火爆出圈!

泰勒飆中文,趙本山郭德綱說英文…來自AI的神秘力量。

關於這一次的“AI換聲”,有幾個影片是格外出圈的。

其中一個是美國天后泰勒·斯威夫特“說”中文。影片裡泰勒的中文簡直不要太流利,說話時的音色也與她說母語的時候是一模一樣的,不僅嘴型可以完全對得上,甚至連手勢和身體動作都是 完全同步的。

新火種AI | 趙本山郭德綱一口倫敦腔,泰勒狂飆中文...AI技術再次火爆出圈!

無獨有偶,“郭德綱流利說英文”的影片發酵速度極快,在抖音,微博等平臺上被瘋傳。在這些影片中,郭老師不僅用英文接受採訪,還能用英文說相聲。與此同時,說上純正倫敦音的趙本山也在全網爆紅。

新火種AI | 趙本山郭德綱一口倫敦腔,泰勒狂飆中文...AI技術再次火爆出圈!

對於郭德綱和趙本山的爆火,多條爆款影片的製作者UP主賽博法師在接受相關媒體採訪的時候,給出了自己的見解。他表示這些影片的爆火在他的預期之中,這主要是基於對自己網感和AI發展的自信,“在作品還在製作中的時候,我都在不禁感嘆,實在是太像了。我們這些AI相關的創作者更瞭解現在的AI發展到哪一步了,閾值比普通人更高,連我都感嘆的東西,普通人看到也一定會讚歎。”

除了得益於已經爐火純青的AI技術,其中的反差感也很關鍵。趙本山和郭德綱都是老派語言類表演藝術家,他們在公眾前的形象都是比較有鄉土氣息的。 也正因此,接地氣的人民藝術家突然飆起了英文,廣大網友們都被這巨大的反差感給震驚到了,爆火也就成了順其自然,水到渠成的事情。

起底“郭德綱說英語”背後的公司:已經成功實現盈利。

那麼問題來了,能製作如此出神入化影片的,究竟是何方神聖呢?

根據賽博法師的介紹,郭德綱的AI換聲實現主要基於一款AI影片工具HeyGen。在這裡,使用者只需上傳影片,選擇語言,就能生成自動翻譯,音色調整,嘴型匹配的影片。

而HeyGen背後則是一家在深圳創立的AIGC企業。

HeyGen的開發團隊為詩云科技,瞭解過劉慈欣科幻小說的朋友或許對這個名字不太陌生,這裡的 “詩云”正是取自劉慈欣科幻小說《詩云》。“詩云”寓意人的創造性無法被科技取代,但創作的過程和效率卻可以被機器極大最佳化,與現實中詩云科技要做AI生成內容,讓使用者以更低成本完成內容創作的理念不謀而合。

據天眼查APP,詩云科技的法定代表人為徐卓,目前公司已完成兩輪數百萬美元融資。其中2021年3月,詩云科技宣佈獲得紅杉中國種子基金和真格基金的天使輪投資;同年8月30日,詩云科技宣佈獲得數百萬美元Pre-A輪融資,由IDG資本領投、紅杉中國種子基金和真格基金跟投。

新火種AI | 趙本山郭德綱一口倫敦腔,泰勒狂飆中文...AI技術再次火爆出圈!

徐卓英文名Joshua,翻看他的履歷,會發現他的成長路徑是典型的“精英成長史”:他本科畢業於同濟大學自動化專業,後前往卡內基梅隆大學攻讀計算機碩士學位。作為明星應用Snapchat前100號員工 ,徐卓從0到1搭建了Snapchat廣告平臺,推薦演算法系統以及機器學習平臺Barista,並負責AI camera的技術及產品研發,經驗十分豐富。而他的創業合夥人梁望同樣實力不俗,曾在位元組跳動擔任北美設計主管。兩人都是名副其實的“大廠精英”。

HeyGen正式推出於2022年7月,據36氪的報導,HeyGen已經在7個月內實現了100萬美元的ARR(年度經常性收入)。根據賽博法師的介紹, HeyGen是需要付費的,主要分為年付和月付,月付最低為29美元,包含15分鐘生成時間。以此類推,根據生成時間的不同,還有幾個不同的檔次。對於普通使用者而言,這個收費並不算低。但不得不承認,相較於其他的AI技術,HeyGen是極具核心競爭力的。

AI技術以假亂真,是否成為了一把高懸的達摩克利斯之劍?

AI技術如此逼真,的確為大家的生活,工作,乃至娛樂方式都帶來了巨大的改變。就像清華大學新聞與傳播學院教授司若舉例說的那樣,“AI換臉及換聲技術讓已故的演員,歷史人物可以透過換臉技術重現在螢幕上,在不同國家的語言轉譯上也可以透過AI的換聲技術進行實時轉譯。”包括這一波全網爆火的“明星說外語”,也讓廣大網友收穫了一波快樂。

但不可否認,AI技術是一把雙刃劍。近些年來,不法分子為了牟利,利用AI技術換聲換臉,冒充熟人詐騙,製作釋出假新聞混淆視聽,賺取流量甚至拐騙兒童等行為時有發生。除此之外,AI換臉和AI換聲的行為是存在著法律風險的。 像如今流行的,利用用AI技術為他人更換聲音做“翻譯”併發布的影片,極有可能涉嫌著作權,肖像權,聲音權方面的侵權問題。

AI技術本身不是問題,它的進步和發展也會成為我們的助力,但如何使用它,使用到何種程度,是不容忽視的關鍵問題。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70035178/viewspace-2994836/,如需轉載,請註明出處,否則將追究法律責任。

相關文章