馬維英介紹稱,位元組跳動通過 6 年發展,當前產品和服務已經覆蓋 150 多個國家、75 個語種,在 40 多個國家和地區位居應用商店總榜前列。技術出海,是位元組跳動全球化發展的核心戰略,人工智慧技術是位元組跳動全球化取得當前進展的關鍵。
基於人工智慧技術,位元組跳動重新定義了人和資訊的連線方式,在行業內率先部署了大規模的人工智慧模型。依託海量資料,由馬維英領先的位元組跳動人工智慧實驗室專注於人工智慧領域的前沿技術研究,並將研究成果應用於公司全球產品中,利用人工智慧幫助內容創作、分發、互動,提升使用者的資訊消費體驗。同時,實驗室也針對人工智慧相關領域內長期性和開放性問題進行研究,幫助公司實現對未來發展的構想,促進人類資訊與知識交流的效率與深度。
此次論壇還宣佈位元組跳動人工智慧實驗室專案《基於分散式機器學習平臺的通用人工智慧應用解決方案》入選 2018 國家工信部人工智慧與實體經濟深度融合創新專案。據瞭解,該創新專案將是建設「訓練資源服務平臺」的主力軍。此次位元組跳動的成功入選不僅體現了國家對位元組跳動在人工智慧領域技術優勢的認可,也是對位元組跳動在人工智慧領域這個方向上不斷探索創新的肯定。
以下為馬維英演講全文:
大家好!我是位元組跳動人工智慧實驗室負責人馬維英。今天非常高興與大家相聚在上海,共同探討人工智慧的發展及應用現狀,以及未來我們如何用 AI 賦能新時代。
首先我們來回顧一下,在整個人類歷史洪流中,內容的創作,資訊的傳播和交流,一直是整個人類社會的基礎設施。在大約公元 100 年前的時候,蔡倫發明了造紙術,人們開始用紙張來創作、傳播。紙張和書籍成了人與資訊連線的最主要媒介。從一開始,中國就扮演這樣一個重要的角色,這些關鍵技術都是中國發明的。之後經過很長一段時間,直到三四十年前,資訊的連線方式才有了新的變革。
網際網路時代網站、網頁讓紙張消失,成為了我們的數字圖書館,我們開始使用搜尋引擎,一鍵便可以直達自己的所需。
到了移動網際網路時代,紙張消失得愈加明顯,因為它讓資訊無所不在,人類可以隨時隨地用智慧手機接觸他所需要的資訊。而且手機也變成一個人的網站,人可以用手機寫文章、拍攝視訊然後釋出出來,並通過手機與其他人交流互動。原來在 PC 網際網路時代有很多的機構媒體,到今天出現了無數自媒體,再到每個人都在創作,每個人都可以分享他的知識,他的生活的體驗,他的故事。從 OGC、PGC 再到 UGC,在這個萬物互聯的時代,人與資訊的連線可以做到無所不在。位元組跳動這家公司就誕生於這樣的時代。它顛覆了搜尋引擎,建立了全新的人與資訊的連線方式。
到最近,人工智慧時代到來,也許未來我們還將共同迎接「超級智慧時代」的機遇和挑戰。今天有很多人問,那人工智慧會不會取代人的創作呢?我個人相信人的想象,人的創作力,人的愛跟關懷是機器不可能取代的。所以我相信未來我們會進入一個人與機器互相幫助、互相學習的時代。人讓機器更聰明,但機器同時也可以幫助人釋放更多的想象力、創造力,各行各業都能夠用 AI 來重新定義我們的產業。
位元組跳動這家公司有幾個比較重要的產品,第一個就是大家比較熟悉的今日頭條。它也是在中間連線兩端——一邊是資訊的源頭,包含文字、圖片、視訊、直播、問答、AR、VR,它是全資訊、全媒體、全內容的平臺。另外一端是人,不單是個人,我們有興趣小組,有社群。
PC 時代的搜尋,沒辦法做到個性化、社交化、移動化、無所不在化。今天我們利用新的技術,重新顛覆。位元組跳動一邊讓 AI 學習大量的形式多樣化的理解內容,另一邊我們為每個人建模——根據每一個人的興趣愛好和他的使用行為。我們將搜尋引擎裡所有排序、分析等技術,都用於進一步的個性化精準推薦,從而變成資訊流。資訊流是一種新的、更智慧的方式,讓人能夠隨時隨地獲取他所要的資訊。這時候手機就相當於一個助理,能夠像助理一樣理解他,為他提供他所需要的資訊。
過去一兩年,短視訊成為一種在世界範圍內最受歡迎的資訊生產與消費形式。位元組跳動旗下短視訊產品的代表抖音也風靡全球。
今年一季度,抖音下載量超越 Facebook、Youtube、Instagram 等,成為全球下載量最高的 iPhone 應用;抖音的全球化佈局始於 2017 年 8 月,截至目前,抖音海外版 TikTok 已覆蓋全球 150 多個國家,抖音及海外版 TikTok 全球月活已經突破 5 億。
隨著 TikTok 在海外接連獲得佳績,抖音已經成為中國產品在海外獲得成功的一個典型,被視作中國移動產品出海的新模式。作為一款中國產品,抖音在全世界範圍成了受喜愛的內容傳播平臺,我想對於我們中國文化走出國門影響全世界,抖音應該可以發揮積極的助力作用。
但建立這樣一個公開、開放的平臺,任務是非常艱鉅的。因為每一位使用者都能夠自己上傳內容,於是我們需要做非常多的事情。我們必須為這些內容做稽核、分類、檢視是否侵犯版權、做推薦,還要做相似性的搜尋,語義的搜尋。而這些都離不開人工智慧的幫助。
臺下如果有熟悉抖音的來賓,應該會對抖音的各種特效、濾鏡、創意玩法印象深刻。可以說這些正是這款產品制勝的關鍵原因之一。而它們都是 AI 技術在短視訊中的應用。
我們通過人臉和其他人體關鍵點檢測與追蹤,可以實現玩變臉等創意效果,尬舞機、控雨、控花瓣等等都是抖音非常受歡迎的玩法。我們的視訊切割技術還能實現染髮、背景替換等各種效果。
除了應用於短視訊產品,位元組跳動的人工智慧技術還通過我們的多款產品賦能資訊創作與交流的各個環節。
我們通過自然語言理解和自然語言生成,自研了一個寫稿機器人。xiaomingbot 寫作機器人獲得了吳文俊人工智慧科學技術獎。小明能夠自動寫作,特別是一些垂直領域,像體育、房產、汽車、天氣等相關的新聞,小明可以每天產生新聞播報。
相比於人類作者,小明的效率和產量高。一個體育比賽結束之後兩秒鐘,我們的自動轉播,自動寫作的報導就上線了。過去一段時間小明已經有了幾萬粉絲,他寫的東西獲得了幾十億次閱讀。小明寫作還支援很多的語言,除了中文之外,有英文,和其他的語言。那下一個就讓大家看一下小明的工作基本原理。他其實分析了多種資料來源頭包含的文字、圖片、視訊。
大家現在看的是 2018 年世界盃中比利時對日本的那場比賽。可以看到,小明能實時對這個視訊做理解,通過視覺識別球員和他背後的編碼,自動生成描述文字。例如「某某球員在某個時間進球」。
自動寫作體育新聞可以實現體育轉播千人千面。每個人你可以看你喜歡的球員,而不是說每個人獲取的報導都一樣。你可以專注你想專注的球隊或球員,而且我可以把這個球員立體的資訊,他的勝負率,他本賽季表現如何,容納到你看到的報導裡面。
我們全球的使用者每天創造出海量內容,這意味著什麼呢,意味著同時我們的稽核任務和壓力是巨大的。為此我們建立了 600 多個稽核模型,擁有近億條資料的龐大資料庫。人工智慧輔助稽核需不僅要對文字、圖片做識別,還要識別語音、視訊。有時候視訊看的沒有問題,但語音有問題,語音我們也需要轉成文字,進一步再識別。這些影像、文字、視訊識別模型經過訓練,可以大大提高稽核的自動化程度。
人工智慧加上我們的稽核人員就形成閉環,AI 是我們為稽核人員訓練出來的工具。同時,稽核團隊在工作中提供了很多標註,監督式機器學習可以使用這個大資料來訓練自動視訊理解系統。而訓練後的系統再給稽核人員用,那他們就能更高效地稽核,並且能提供更多的反饋和新的標註資料。所以人和機器是共同學習的,機器幫人,人又幫機器,形成正向迴圈,不斷地迭代大資料。
目前我們的人工智慧大概為公司節省了十萬級別的人力。如果沒有人工智慧輔助稽核,那我們的稽核團隊人數就將是現在的很多倍。我們也有計劃把這些資料能夠標準化和公開,也可以搞競賽,讓學術界更多的研究人員能夠利用這些資料來做研究。
這就是我們一直在努力做的事——建設新一代人工智慧驅動的資訊平臺,連線人和資訊,從內容創作、過濾、稽核、分發、搜尋、消費以及互動的每個環節,促進創作和交流。
從圖上我們可以看到,從資訊的創作端的創作者,到資訊消費端的讀者,每一箇中間人與資訊連線的都是一個資訊流。位元組跳動建設這個這個人工智慧的基礎設施+服務平臺,可以支撐整個公司資料的處理、分析、挖掘、理解、組織。同時又能讓人工智慧進一步學習這裡面每一個環節的語義表達方式。
未來整個社會要從數字化進一步走到智慧化表達。今天人工智慧可以用來學習從數字表達到語義表達的轉換,因為數字化之後還不夠,計算機無法直接理解,人工智慧學習語義表達全世界,在那個空間裡計算機的能力就可以發揮。用向量計算加加減減就知道影像裡面是什麼,加加減減就知道它的內容能產生什麼樣的情感,是悲傷、是快樂,是害怕,對內容有產生情感的認知。
我們也希望這樣一個新一代的人工智慧驅動的資訊平臺建設完成之後我們能夠進一步去賦能,能夠對外去輸出這些能力,能夠幫助其他的企業,能夠利用 AI 去賦能更多行業和應用場景,可以是醫療、教育、財經、媒體,或者說一些新的內容,例如垂直的應用。
為了實現我們的這些構想,用人工智慧賦能新時代,我們位元組跳動人工智慧實驗室一直在不斷鑽研探索。我們目前主要的研究領域包括機器學習、自然語言理解、計算機視覺、人機互動與機器人等方向,我們實驗室有一群國內外一流高校畢業的科學家以及擁有多年一線機器學習應用開發經驗的工程師團隊,一起專注人工智慧領域的前沿技術研究,一同攻關克難。
和歷次工業革命一樣,我們如今邁入人工智慧時代,是人類社會了不起的進步。而技術的進步最終是服務於人類的。我們鑽研技術不僅是鑽研技術本身,更重要的是研究如何用它來解決人類社會的難題。
幾年前,我們就開始將人工智慧結合產品功能積極服務於公益。比如藉由我們的精準推送,根據他的走失時間、地點,把走失者的資訊推送給這些可能有資訊線索的人。目前整個頭條尋人,已經找到了超過 7000 人,應該是中國尋人機構找回走失者最多的,平均每天至少找到 10 位,最多的時候一天找回 29 位。我們還幫助很多臺灣老兵找到了大陸的親人,幫助 51 個家庭跨越海峽兩岸團聚。
我們還利用技術去實現精準扶貧,讓四川省古藺縣、甘肅省夏河縣、貴州省雷山縣的山貨走上頭條,盤活優質文化物質資源,服務國家鄉村振興戰略。
在教育方面,我們也認為 AI 有機會幫助教育。因為我們可以用人工智慧技術來連線有教育資源的人跟需要教育資源的人。我們可以用 AI 技術把最好的師資、最好的教材傳遞到偏遠地區。像我們的「益童樂園」貴州起航,「鄉村 AI 教師」也全面建成,我們希望讓貧困地區的孩子也接受到良好的教育。
基於我們前面提到的種種嘗試與努力,位元組跳動的願景也正在逐步實現——建設全球創作與交流平臺。公司成立至今六年以來,我們的產品和服務已經覆蓋 150 多個國家、75 個語種,在 40 多個國家和地區位居應用商店總榜前列。而這背後,正是科技和創新在推動我們全球化的發展。技術出海,是位元組跳動全球化發展的核心戰略,人工智慧技術是位元組跳動全球化取得當前進展的關鍵。作為人工智慧時代的中國創業者,未來位元組跳動將繼續孜孜以求,幫助全世界的使用者更好地創作、交流、互動,也為中國人工智慧的發展貢獻一份力量!
謝謝大家!