黑科技刷屏烏鎮後,快手背後的AI天團終於現身了

naojiti發表於2018-11-15

當一家以短視訊業務為主的企業進行產業延伸,它們會選擇哪些方向?相信大多數人腦海中會立刻閃出這些答案:連線電商流量變現、建立MCN機構自制節目等。其實所有以內容為起點的產業,發展路徑也大致如此。也正因如此,很多內容平臺對於流量過度依賴,要大力維護平臺頭部博主或不斷靠外部廣告引流,最終使運營成本居高不下。

但同樣以短視訊為起點的快手,卻給出了不同的答案。

科技公司:從短視訊出發能到達哪些地方?

在今年的烏鎮網際網路大會上,有一個展臺被圍得水洩不通,好奇的觀眾、媒體排起了長隊都想體驗下展臺上的黑科技。這個展臺是快手的展臺,但展臺如此火爆並非是因為非常受歡迎的“手工耿”這樣的快手網紅,而是三項參與感較強的黑科技。

其中有 “世界上另一個你”,通過人臉識別找到快手平臺上跟你長的最像的使用者,就連現場體驗的印度記者也找到一位和自己非常相似的印度快手使用者;還有“快手平安系統”,可以將官方釋出的國家預警資訊第一時間推送給災害發生地使用者,並且聚集理解發生地使用者所拍攝的視訊向國家提供一線資訊;最後還有快手的“萌面”魔法表情,把人的臉部表情實時復原在可愛的卡通形象上,把曾經只有蘋果X獨有的animoji玩法普及到了iOS、安卓的所有機型。


黑科技刷屏烏鎮後,快手背後的AI天團終於現身了


這三項黑科技,體現了快手這家科技公司在做的探索,通過短視訊、通過AI等科技,帶給使用者更新奇的體驗。

首先是對於人臉識別技術的無限應用可能。

在“世界上另一個你”專案中,快手所展示的其實是其量級極大、覆蓋面極廣的人臉資料庫,以及適用於多種特徵的識別技術。要知道不同性別、不同人種的人臉特徵是有很大差異的,當資料樣本分佈不均時,就會出現自拍無法被識別五官的情況。

尤其是如今人臉識別已經成為一種高度商業化的AI技術,快手所展示出的不光是技術實力,還有面向全球的商業前景。

第二則是利用巨大使用者量和AI技術對於智慧城市的補充。

快手平安系統可以說是和快手當下主營業務關聯最小的技術了,可也是最具有實用性的之一。災難預警一直是智慧城市建設的目標之一,但在智慧城市建設的過程中,快手可以憑藉著自己巨大的使用者量和對三四線城市及鄉鎮地區的覆蓋來予以補充。

當鄉鎮、農村還來不及佈設那麼多應用於智慧城市的感測器時,平安系統對於使用者拍攝內容的理解就讓居民本身變成了更靈活的感測器,及時地搜尋資訊。其實不止災難預警,在使用者分佈基礎和內容理解能力下,很多我們渴望通過智慧城市實現的效果,也能通過快手實現。

第三是利用技術對於軟硬體進行協調。

快手的多媒體內容理解部門所推出的“萌面”魔法表情,讓千元機也能實現iPhone X人臉結構光的效果,其實這種演算法實現or硬體實現的分歧也曾在手機廠商中出現。之前谷歌的Pixel就一直堅持採用單目攝像頭來實現雙攝效果,解決途徑就是演算法。對於一些低造價的硬體產品來說,能夠提升體驗的演算法非常重要。

快手在這方面的優異表現,也為自己贏得了更多和硬體廠商對話的可能。

內容淘金的AI天團:比黑科技更神祕的快手多媒體內容理解部門

也就是說,和其他很多內容產品不同,快手在技術本身、應用場景挖掘和硬體協調三個方向上都有很強大的延展能力。這種強大延展能力的來源,就是快手本身豐富的內容源。

內容雖然是金礦,但能讓金礦發揮出價值的還是淘金者。在快手大量視訊內容中淘金的,是快手的多媒體內容理解部門(英文全稱:Multimedia Understanding 簡稱:MMU)。上文提到在烏鎮刷屏的黑科技,就出自快手的多媒體內容理解部。團隊由近百名演算法工程師、應用工程師構成,聚焦多媒體內容的理解與應用。在內容理解方面,MMU主要通過對人臉、影像、音樂、視訊四個維度實現對多媒體內容的感知,並融合感知內容和知識圖譜,實現對視訊高層語義及情感的理解,從而讓機器高效看懂海量內容。目前,多媒體內容理解部的核心技術服務於內容安全、原創保護、視訊創作、視訊推薦、視訊搜尋及商業化等方面。

從快手的多媒體內容理解部出發,我們可以嘗試探討下:以內容為起點,用技術撬動更多價值,都需要哪些工具?

1、 不斷增長的資料來源

快手在資料上的優勢不僅僅是量大,更重要的是型別豐富並且持續保持增長,讓內容理解可以不斷根據使用者不同時期和狀態的需要進行自我驅動的革新。

樹立起快手強大內容理解的跨模態內容分類,就是建立在豐富的內容種類上,對於視訊+音訊、畫面+使用者行為等等元素進行綜合理解才能達成。如果沒有豐富的資料來源,也是很難實現的。


黑科技刷屏烏鎮後,快手背後的AI天團終於現身了


2、 充足的算力資源

想對內容尤其是視訊內容進行深度的挖掘,算力自然是不可或缺的。快手多媒體內容理解部擁有5000塊GPU構成的超算中心,為種種新嘗試提供源源不斷的動力。不管是內容的理解還是生成,都可以利用好雲端算力,減輕對使用者終端算力的要求。

3、 深厚的人才底蘊

真正能把資料和算力利用起來的,還是人才。作為快手技術創新的中流砥柱,快手多媒體內容理解部是快手博士最多的部門,演算法團隊中有四成都是AI領域的博士,可以說是快手的“AI天團”。

在技術研究為導向的AI領域,人才可以說是企業的原動力,因此快手才能在跨模態融合技術方向佔據業界領先優勢。

4、 技術與業務的緊密貼合

現在企業裡設立個AI研究院或實驗室已經成了風尚,但如果目的是讓技術對企業業務本身產生驅動,研究部門能否和業務線緊密貼合非常重要。像快手多媒體內容理解部的核心技術就服務於快速內容安全、原創保護、視訊創作、視訊推薦、視訊搜尋及商業化等方面。有業務線上的及時反饋,技術研究才能在快速迭代中不斷接近正確方向。

當快手冠以AI之名:不僅淘金,還要點石成金

這四項優勢可以說是多媒體內容理解部內容淘金的四樣神器,讓多媒體內容理解部驅動整個快手開啟了更多的延展空間。

而從這次烏鎮上展示的專案看來,快手的野心遠遠不僅是掌握礦脈,而是渴望點石成金的能力。

視訊生成技術中體現出的跨模態識別演算法,平安系統中體現出的強大算力和資料資源,加上快手多媒體內容理解部本身的人才儲備,這一切都說明了快手正在無限貼近他們對於自身的定位:一家AI企業。


黑科技刷屏烏鎮後,快手背後的AI天團終於現身了


短視訊只是輸出AI技術的方式之一,當擁有點石成金的能力後,快手的未來可以有很多選擇。

例如快手可以利用強大的演算法推出高價效比的硬體產品,就像Snapchat推出AR眼鏡一樣。不管是自研還是合作的方式,以快手使用者的技術和活躍度,相信可以很快擴充開市場。

要麼快手可以和Facebook這類社交媒體平臺一樣,開放技術API將自身打造成時下流行的AR開發平臺。一方面鼓勵開發者為短視訊業務貢獻更多特效,另一方面可以接入營銷類業務。

快手甚至可以面向產業成為可以輸出技術的供應商,在安防、考勤等等領域提供人臉識別和視訊內容理解技術。

總之在快手多媒體內容理解部的支援下,快手的AI技術可以在很多地方創造價值。AI企業未來五光十色的豐富可能性,也一樣投射到了快手身上。

當然,這些都是局外人的猜測。或許快手會一直像CEO宿華說的那樣,像陽光一樣普照大地,利用技術去改變每一個普通人的生活。而在AI驅動的時代大幕上,每一家企業都置身洪流之中。擁有技術便意味著擁有選擇權,任浪潮波動也一切由己。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31561483/viewspace-2220270/,如需轉載,請註明出處,否則將追究法律責任。

相關文章