重新認識快手:人工智慧的從 0 到 1

機器之心發表於2019-07-09

重新認識快手:人工智慧的從 0 到 1在CVPR上看到的快手,和我印象中的不太一樣。

CVPR,全稱 IEEE 國際計算機視覺模式識別會議,在計算機視覺領域是和 ICCV、ECCV 並稱的三大頂尖會議。今年的 CVPR 於當地時間 6 月 16 日在美國加州長灘開幕,吸引了超過 9000 多位參會者、284 家贊助商、和 104 家展商。

這是快手第一次參加 CVPR。在一個大約 40 平米的展區,快手展示了一款基於人臉特徵識別的 demo,能在海量的影片庫中找到與參會者長相相似的使用者。這充滿趣味性的 demo 很快引起了參會者的注意,人群熙熙攘攘地聚集在展臺周圍,想要一睹他們的「雙胞胎」到底長什麼樣。

最令我印象深刻的是一位穿著黑色短袖、短髮絡腮鬍的大叔,由於匹配結果太像,引得圍觀群眾哈哈大笑。

重新認識快手:人工智慧的從 0 到 1

這種新奇的體驗,讓我對快手的人工智慧產生了興趣。我曾有過刷起快手就「昏天黑地」的日子,也知道「記錄世界記錄你」、「老鐵雙擊 666」的這些快手流行語,這款短影片應用給我的生活帶來了頗多樂趣。只不過,快手的人工智慧似乎從未認真地被擺在檯面上討論過,至少比起活躍在閃光燈下的其他中國科技公司們—BAT、TMD、或者是商湯、曠視、依圖們。

只要仔細想想,比起大多數中國科技公司,快手更應該依賴人工智慧。創立 8 年至今,快手的日活人數已經超過 2 億,公司業務涉及生產、稽核、分發、消費,處理海量資料的需求,以及快手自身業務的特性,沒有機器學習的支撐是很難走到今天的。

快手是如何一步一步積累人工智慧?帶著這樣的問題,我採訪了快手多個業務部門的老兵們,希望還原人工智慧在快手從 0 到 1 的全過程。

第一支深度學習團隊

2015 年 12 月,彭博社發表了一篇文章,標題是「為什麼 2015 年是人工智慧突破的一年」。

這一年,人工智慧遍地開花。谷歌開源了機器學習平臺 TensorFlow,一躍成為全球最大的機器學習平臺;之前不被人看好的亞馬遜智慧音響 Echo,已經佔據了整個音響市場銷量的 25%;10 月,一個叫做 AlphaGo 的智慧體首次擊敗了專業的圍棋選手。誰也不會想到,這個智慧體將在不久的未來掀起巨大的科技浪潮。

1 月至 12 月,全球超過 300 筆投資涉及人工智慧領域,幾乎每天都有人工智慧初創公司獲得融資的新聞;人工智慧在中國同樣受到了資本的追逐。根據德勤的報告,2015 年,中國人工智慧的投資總額達到了 450.7 億元,同比增長 306%。

就在這樣的大背景下,2015 年年底,快手向深度學習邁出了第一步。創始人兼 CEO 宿華找到了李巖,希望他能組建一個深度學習部門(DL 組),用演算法打擊盜版和違規內容。當時的快手已經擁有超過 1 億的安卓和 iOS 使用者,使用者分佈在北上廣等一二線城市和諸多三四線城市。

重新認識快手:人工智慧的從 0 到 1

宿華

保證內容安全和原創幾乎是每一個影片類應用的剛需。過多的違規內容會擠壓內容生產者的流量,繼而拖垮整個平臺。換句話說,這是關乎快手生存與否的底線。

被宿華委以重任的李巖,畢業於中國科學院計算技術研究所,是快手的老員工,工號 75 上下,早期在影片安全方面頗有建樹。2015 年 11 月,李巖組建了一支十人不到的團隊,目標是秒量級別內下線違法違規的內容,包括色情、暴力等;以及識別出非原創的、盜版的影片內容。

為了招人,李巖試過各種辦法,甚至在知乎尋找人才。當時有研發人員不瞭解快手,有工程師只是因為快手離家近就來面試一下,但面試完之後被快手做的事情所吸引,就毅然選擇加入了快手。

在技術積累的過程中,快手對影片內容理解產生了更多的需求:影片裡的人在說什麼?場景在哪裡?想要表達什麼內容?深度學習部門也不再侷限於解決影片的安全或版權問題,而是希望幫助快手「老鐵」們更快地找到他們喜歡的內容。

深度學習部門當時只有影像和音訊這兩個單模態內容理解團隊,但影片理解出身的李巖堅信多模態內容理解對快手這樣一家短影片公司極其重要。在 2018 年的一次公開演講中,他舉了個例子,「一個男子表演口技的影片中,如果關閉聲音,僅憑畫面資訊,我們並不知道他是在做什麼,可能會覺得是在唱歌或唱戲。這說明如果僅僅是透過視覺的話,你可能無法獲得真實的資訊。」

「影片是視覺、聽覺、文字多種模態綜合的資訊形式,而使用者的行為也是另外一種模態的資料,所以影片本身就是一個多模態的問題,再加上使用者行為就更是一種更加複雜的多模態問題。所以多模態的研究對於快手來說,是非常重要的課題。」

2016 年,深度學習部門開始涉獵語音、文字、音樂等多種媒體形式。李巖決定,將團隊的名字從深度學習組改為多媒體理解組(Multimedia understanding,簡稱MMU)。

這一年隨後被稱作短影片元年,資本紛紛湧入這一風口,市場 65% 資金投入到了短影片內容創作方,垂直細分領域的短影片內容更是達到了 76%。

而在隨後的 2017 年年初,完成 3.5 億美元融資的快手,率先從短影片領域的「廝殺」中脫穎而出,總使用者和日活躍使用者分別達到 4 億和 4000 萬。到了年底,這兩組資料分別增長至 7 億和 1 億,日均上傳影片量則超 1000 萬條。快手團隊規模也從 200 多人擴充到 800 多人。

也是從這時候起,MMU 組快速擴張,每個單模態組都引入了業內的頂尖人才來做演算法最佳化和工程落地。起初,不同模態的業務組單獨發展,到了 2018 年,各組的演算法開始進行融合。

多模態理解的挑戰

作為快手的第一支深度學習團隊,MMU 組面臨著巨大的挑戰。

過去幾年,單模態內容理解能力在學術界還不夠成熟,加上學術界對影片理解沒有強烈的研究需求,導致始終沒有形成一套針對影片理解的求解方案。在工業界,即使是全球最大的影片平臺 YouTube,也因為其影片帶有豐富的文字資訊—標題、簡介、標籤,可以一定程度上繞開影片理解。

但快手不同。作為一款移動網際網路時代興起的短影片應用,快手給使用者提供輕便新穎的拍影片體驗,使用者喜歡拍完就傳,不愛文字編輯,描述影片的文字資訊嚴重缺失。快手又需要理解內容來做推薦演算法,影片理解成了一個繞不開的坎。李巖說,快手是較早對影片內容分析產生強烈剛需的公司。

複雜的應用場景和多元的使用者分佈給 MMU 帶來了另一個維度的挑戰。負責影片理解方向的朝旭是 MMU 組的老員工,他給機器之心舉了一個例子:快手上有很多景色的影片內容,有些景色很美、有空靈感的畫面猶如「仙境」,那麼快手的標籤裡就需要描述「仙境」這類景色;但是在學術界的資料集裡面,你是不會看到這種「詭異」的標籤。

「這不再是一個具體的分類演算法問題,而是說你怎麼去定義一個合理的標籤體系。」

語音組最直觀的問題是方言口音。MMU 語音組的月朗介紹說,快手使用者的地域分佈結構和中國移動網際網路的人群分佈結構基本一致:一線城市人口占比只有 7% 左右,另外 93% 的人都生活在非一線城市,特別是許多小鎮青年、或者是三四線以下的人們說話,都帶有很強的口音,這就需要快手收集特定方言區域的語音和文字資料。

音樂組面臨的一個難題是給使用者唱歌打分。傳統的歌唱打分是將使用者所唱的歌曲和原唱音訊做對比,匹配度越高分數越高。但在快手,許多使用者是來自偏遠地區的少數民族,他們所唱的民歌山歌在快手的檢索庫里根本找不到。

「我們現在要求解的不是 1+1 等於 2 的這個問題,而是你在算 1+1 的時候,你發現連紙和筆都沒有,」朝旭說。

經過兩年的摸索,MMU 組基於多模態技術,逐漸形成了兩大業務體系:資訊分發和人機互動。前者利用多模態實現精準地影片內容理解,後者利用多模態來輔助人們更好地記錄生活。

為了更好地理解這兩個方向,我們各舉一例:冷啟動專案屬於內容分發,指的是在使用者在剛開啟快手 app 時,除了內容和影片中的人物,演算法無法獲得任何行為資料,因為使用者開啟快手的一個頁面是「發現」而非「關注」,所以快手在冷啟動階段就要提供個性化的內容推薦。MMU 組在 2018 年參與了最佳化冷啟動的專案。

人機互動上,影片配樂是一個典型的多模態理解場景。MMU 音樂組的水寒告訴機器之心,快手需要首先理解影片,包括人臉識別、年齡性別、動作時間地點場景的識別,然後對音樂的風格情感、節奏、主題、以及適合度做場景理解,這個過程涉及到多部門之間的協作,包括影片理解方面、人臉識別自然語言處理、影片檢索、音樂檢索、以及最後的推薦演算法。

演算法最佳化帶來的紅利是顯著的。2018 年第 2 季度,快手 app 的月活躍使用者數達到 2.4 億人,日活人數過億。這一年的 4 月,騰訊為快手追加 4 億美金融資,使得快手的估值接近 200 億美金。

但多模態研究給 MMU 團隊帶來的挑戰並未就此減輕。李巖說,多模態研究目前依然存在三大難點:單模態的語義鴻溝會在多模態融合後,因為樣本空間變大而進一步增加語義鴻溝;對不同模態之間的資料進行綜合建模,會出現一個資料異構鴻溝;多模態的資料集難以構建,存在資料缺失的問題。

MMU 接下來的目標是從低階的感知過渡到高層的語義理解,這也是李巖認為的「目前工業界最難的問題。」MMU 目前正在研發影片分級系統,為了更好地保護未成年人使用快手,這就需要演算法對影片內容有更深刻地理解:一個影片表達了什麼樣的概念?透露的是什麼樣的情緒?

「我認為影片內容理解是通向未來的人工智慧大規模地在現實生活中爆發的關鍵技術,而快手在這個方面既有戰場、也有資料。我們 MMU 應該是未來人工智慧行業裡面的關鍵力量,」李巖說。

快手的「Google X」

在 MMU 發展的同時期,快手也在大力發展其他部門,例如負責音影片傳輸和質量保證的音影片技術團隊、負責推薦的社科團隊。和 MMU 一樣,這些部門由業務驅動,以產品開發和技術落地為主。

在快手對影片理解技術在推薦、內容安全等方面的應用日趨成熟時,宿華希望組建一個專注在前沿演算法的實驗室,將比如好萊塢的特效內容加入到使用者的內容生產中,透過人工智慧讓使用者獲得新奇的體驗。

於是,在 2016 年,宿華找到了自己在清華大學的老同學、美國史丹佛計算機系博士鄭文。在史丹佛大學期間,鄭文的研究方向主要集中在計算機圖形學和電影特效方面,其導師曾兩次獲得奧斯卡科技獎。畢業之後,鄭文繼續在美國從事機器學習計算機視覺相關的研究。

重新認識快手:人工智慧的從 0 到 1

鄭文

2016 年 9 月,在宿華的力勸之下,鄭文回國加入快手,成立了 Y-Lab 實驗室。鄭文當時對國內媒體說,「我覺得他想要做的事情挺有趣,跟我的經驗也非常吻合,我自己也感興趣,所以就回來了。」宿華沒有設立特定的考核標準,只要做出來東西好玩就行。

Y-Lab 的早期員工、目前擴增實境(AR)技術的負責人夢松向機器之心回憶了當年和宿華的一次對話。他說宿華想建立一個類似谷歌實驗室(Google X)的科技部門,從事 AI 和 AR 領域的前沿技術研究和探索,為將來進行佈局。

Google X 是谷歌最神秘的一個部門,聚集了全世界頂級專家,曾經開發過谷歌最早的神經網路系統、谷歌眼鏡和自動駕駛汽車(後來單獨孵化出了 Waymo)等專案。據國內媒體報導,Y-Lab 中的 Y 代表著 Young,Y 是 X 的下一個字母,所以也代表著超越 X。

「我們現在在做的針對 5 G 的技術研究、影像 3D 捕捉這方面,其初衷是想在 AI 和 AR 上做到世界領先,」夢松說。

隨後的兩年時間,Y-Lab 開發出了各種有趣、新奇的 demo,覆蓋 AR 特效、人臉關鍵點、手勢識別、語義分割、人體關鍵點檢測等多個領域。

重新認識快手:人工智慧的從 0 到 1

去年,Y-Lab 的「AR 上的人臉移植特效」就備受網友好評,使用者可以選取相簿中的照片,把相簿中的人臉轉移到到 AR 三維模型上,生成出一個長著人臉的 3D 虛擬角色。

同樣去年上線的魔法表情「快手時光機」,能預測使用者 60 年之後的模樣,並且隨著年份演示整個變化過程,引發了眾多網友的情感共鳴。這款魔錶背後,其實涵蓋了快手的動態人臉捕捉、基於時序的臉部變形與美妝、頭髮分割與染色、動態控制變老等技術。

重新認識快手:人工智慧的從 0 到 1

快手時光機

為了讓 AI 演算法能夠在不同的手機裝置上執行,Y-Lab 自主研發了一款深度學習推理引擎 YCNN。負責人臉關鍵點研發的繡虎告訴機器之心,YCNN 能夠在手機端執行底層的神經網路操作(比如卷積運算);建立一套量化流程,配合手機端程式碼加快推理速度同時不損失精度。團隊做演算法時也會根據 YCNN 的特點,有意識地設計相匹配的網路結構。

然而,Y-Lab 遇到了許多企業實驗室的通病:優秀的前沿演算法在轉化為產品價值時後繼乏力。由於 Y-Lab 本身的定位是前沿探索,對業務產出不高是預料中的事情。但作為企業實驗室,Y-Lab 不可能像學術機構那樣做「陽春白雪」的研究,需要對業務帶來貢獻。

2018 年,Y-Lab 為魔法表情部門設計了許多新的底層演算法,比如 3D 照片、天空影像、人臉關鍵點等等。但是,由於 Y-Lab 和下游的特效團隊分屬兩個部門,之間的溝通問題導致整個魔法表情的上線流程不如預期,使用者資料也不理想。

究其原因,負責語義分割的晨星透露,演算法做好到真正的落在產品上還涉及多個部門。「我們(Y-Lab)只是集中到演算法這一個層面,演算法做完之後怎麼去落地,不是一個部門可以完成的。這樣就出現一個問題,演算法做出來之後,去和確保落地後的效果是好的,如果不在一個部門,中間就溝通成本會比較高,演算法最終出來的效果不可控。」

去年年底,部門進行了一次調整來解決這個問題,將魔法表情部門的特效團隊合併到 Y-Lab,同時招募了幾位計算機視覺相關的演算法大牛,加入了產品經理,增加了產品設計和工程化的能力。

為了增加團隊內部的溝通,Y-Lab 除了每週一開會之外,今年還新設了一個單元,叫做「勝利會議」:員工聚集在一起分享這周的進展和成果,大家可以帶著零食有說有笑地開會。

據幾位老員工透露,部門調整之後,團隊的溝通變的更順暢。合併之後的第一個專案是做染髮特效,晨星所在的團隊用深度學習做了頭髮區域的語義分割演算法,特效團隊基於演算法做了染髮的特效,上線之後使用者資料的表現較好,也因此獲得了公司內部的「閃電獎」。

重新認識快手:人工智慧的從 0 到 1

染髮特效

作為這次結構調整的一個標誌,快手正式將 Y-Lab 改名為 Y-Tech。從 Lab 到Tech,背後是整個實驗室定位的改變。

組織結構的調整對團隊多少帶來了影響。晨星說,過去團隊的主要精力主要在研發上,現在也要關注產品落地的業務,負責的東西更多了。不過,他不認為整個部門的基因有改變。「我們還是在跟蹤最前沿的技術,做一些意願性很強且潛力很大的事情。」

為了繼續加強整個實驗室的前沿探索能力,在此次結構調整中,快手給 Y-Tech 加入了一支生力軍——來自西雅圖和矽谷的海外實驗室。

演算法背後的普惠價值

劉霽和王華彥在去年下半年加入快手,在提到為什麼加入快手時,兩人都不約而同地提到了價值觀。

2018 年年初,劉霽在北京國貿大酒店的宴會廳上遇到了宿華,兩人在那一年同時入選《麻省理工科技評論》中國科技青年英雄榜。劉霽當時是騰訊 AI Lab 的專家研究員、美國羅徹斯特大學的助理教授,因「讓機器學習演算法更準確更高效,探索人工智慧潛力的邊界」獲得了發明家的稱號;宿華則憑藉在快手取得的巨大成功獲得「創業家」稱號。

兩人此前未見過面,但和宿華交流之後,劉霽產生了加入快手的興趣。「我們(指他和宿華)在做事情時,比較講究邏輯。國內的許多公司還是習慣複製黏貼,但我覺得他做事情是從解決問題本身,從原理上出發,這一點和我的方法論是一致的。」

去年 11 月,劉霽加入快手,擔任西雅圖 AI 實驗室和 FeDA 商業化實驗室的負責人。

王華彥是史丹佛大學博士,師從 Coursera 創始人 & 史丹佛大學教授 Daphne Koller。畢業後,他加入了矽谷人工智慧獨角獸 Vicarious 的創始團隊,一呆就是四年。

重新認識快手:人工智慧的從 0 到 1

王華彥在 2019CVPR 快手展臺上

為了招募王華彥,鄭文特地飛到矽谷和他進行交流。王華彥說,他能感受到提升 AI 演算法效率對快手有著非常緊迫的需求。「快手希望在手機上可以用最先進的演算法這種需求和我的研究興趣—比如怎麼樣把 AI 的演算法做到和人一樣高效—是一樣的。」去年 7 月,王加入了快手,擔任矽谷實驗室的負責人。

雖同在海外,兩個實驗室的研究方向和定位不太一樣:矽谷實驗室的關注點在資料效率和計算效率,針對 Y-Tech 的產品業務。據王華彥透露,矽谷實驗室近期將會上線一個專案,能夠做到在安卓上的模型版本達到和 iOS 一樣的效果,「舉一個例子,即使是在快手老鐵的千元機也能呈現和蘋果手機一樣的美顏效果。」

⻄雅圖 AI 實驗室目前關注端上模型壓縮的前沿演算法。今年,劉霽教授帶領的快⼿研究團隊和羅徹斯特大學合作,發表了兩篇基於能耗建模的模型壓縮的論文,分別在 ICLR 2019 和 CVPR 2019 上發表。兩種⽅法都是基於硬體模型的個性化模型壓縮--讓人工智慧也能普惠到大量的低端機使用者,第一篇 ICLR 2019 論文主要透過權重級的細粒度剪枝獲得稀疏性,第⼆篇 CVPR 2019 論⽂主要透過 Channel 級的粗粒度剪枝獲得稀疏性。

和學術界探索未知的可能性不同,劉霽的研究思路圍繞快手平等普惠的價值觀,即讓每個人都有平等記錄的權利。「我們和現在的許多學術論文最大的區別是,他們其實是離線做的,不考慮實際硬體的侷限。我們現在做的事情都必須要在⼿機端,資料講究實時性。而且,許多快手使用者的⼿機都是千元機,我們很多 AI 的功能都需要在這些低端的配置上運行,這對我們技術提出了更高的要求」劉霽說。

另⼀個劉霽教授負責的部門—FeDA 智慧決策實驗室。這是與商業化團隊建立的西雅圖和北京聯合實驗室,主要專注在使⽤前沿搜尋技術,高效精準的連線使用者價值和商業價值。這也是在 2018 年 10 月,快⼿正式對外宣佈開啟「商業化元年」的⼤背景下建⽴的部⻔。多說一句,Fe 指的是快⼿的特殊名詞—「老鐵經濟」(Friend Economy),它同樣是化學元素符號中鐵原子的縮寫。

據劉霽介紹,現在整個西雅圖實驗室目前⼗人左右,但「一個人支撐一個專案」。最近,FeDA 為了廣告推薦部⻔重新設計了基礎計算設施,從主流的 CPU 的處理方式改成了 GPU 的解決⽅案,單機效率提升了 600 多倍; 將強化學習應⽤到⼴告競價,收益提升了 5 個百分點。

重新認識快手:人工智慧的從 0 到 1

劉霽在 2019CVPR 快手展臺上

「極致」的意義

在 2019 年的快手年會上,宿華和另一位創始人程一笑說了 20 次「追求極致」。宿華在年會上強調,「希望每一位同學能夠有追求極致的精神」、「不追求極致,我們就贏不了」。

如果聯想到近日快手曝光的一封內部信,就不難看出,向來穩重和佛系的宿華為何會在年會上如此情緒激動。

6 月 18 日,快手兩位創始人的內部信被曝光,罕見地以言辭激烈的方式告誡公司員工,快手將「變革組織、最佳化結構,在 2020 年春節之前實現 3 億 DAU 的指標。」

在這封內部信釋出之前,快手依然保持快速增長。2018 年全年,快手日活增長了 6000 萬,DAU 達到 1.6 億。前不久,快手副總裁王強宣佈快手日活使用者已超過 2 億。創立八年以來,快手的員工數量已經超過了 8000 人。但快手的競爭者同樣在發力。截至 2019 年 1 月初,抖音的日活數量已經超過了快手,突破 2.5 億,月活數也已經超過 5 億。

創始人在內部信中說,「看起來不錯的數字背後,我們看到了深深的隱患:我們已經不是跑得最快的那支隊伍,在長大的過程中,我們的肌肉開始變得無力,反應變慢,我們與使用者的連線感知在變弱。」

「是的,我們對現狀很不滿意,鬆散的組織、佛系的態度,『慢公司』正在成為我們的標籤。這讓我們寢食難安。去年年底以來,從我們兩人開始,快手管理層進行了深刻的自省和反思。」

據快手內部員工告訴機器之心,快手的各個部門已經開始進入戰鬥狀態,不少員工自發地週六來到公司加班,甚至有些部門都出現了「996」的狀態,這在過去的快手是比較少見的。

技術部門並沒有因為 3 億 DAU 這個「大型 KPI」而做出明顯的調整,他們能做的就是像宿華說的那樣去「追求極致」。

Y-Tech 的夢松舉了例子,「我們這邊同時在研究許多前沿的新技術,立項要求是做出來要領先競品至少三個月到半年的時間,這些技術都沒有成熟的方案可供參考,甚至業界鮮有人在嘗試,但大家都很有意願和動力朝著這些方向努力。」例如,在混合現實領域,快手在探索適合快手使用者的產品形式,致力於把先進的技術在使用者的手機平臺上實現,用演算法帶給使用者新奇的體驗。這是很有挑戰性的專案,但即便如此,快手依然要走這條路。

快手聖地亞哥實驗室的負責人王祥林告訴機器之心,他所在的音影片團隊目前的一些工作,可能大部分內部員工都不知道:快手正在參與制定新一代的影片壓縮標準。與世界各大公司、高校科研院所一起,快手爭取將自主研發的技術放入國際標準中,掌握下一代影片壓縮標準的話語權。

追求極致,聽上去似乎是一個抽象的概念,但對快手有重要的戰略意義。

在快手,使用者行為隨時隨地都在影響內容推薦,比如點選某個影片、加心、評論、觀看影片長度等等,在使用者下拉頁面的同時,內容也在實時地變化。快手的生產者佔比非常高,也就需要快手去處理比競品多幾倍的 UGC 數量。快手是一家重演算法的技術驅動公司。即使是百分之一的演算法提升,都能轉化為巨大的商業價值。追求極致的一小步,對快手來說是一大步。

結語:人工智慧提升幸福感

受訪的這些快手老兵,多數都是快手平臺的忠實「老鐵」。

有了小孩子之後,晨星已經拍了兩三百個自己孩子的影片。他說他屬於簡約派,不太用魔法表情之類,但是他老婆喜歡用,比如用魔法表情把小孩變醜之後然後拍個影片,覺得特別好玩。

「因為我們是懂演算法邏輯的,覺得這個事情可能沒有那麼神奇;然後她們會覺得這個特別神奇,就特別喜歡拍。看到家裡麵人玩這種魔錶,他們表現得很驚奇,我其實還是覺得蠻有成就感的。」

朝旭說,他是極度重度的快手老鐵,「我一般情況下刷快手在一個小時左右,這還不包括看後臺資料的時間。」和普通老鐵不同,朝旭刷快手會看哪些內容是他沒有識別到的。「比如,這個標籤我是不是沒有加,哪些地方我識別的還不是很準。」

由於常年在矽谷,王華彥看快手平添了一絲懷鄉之情。「我看過一個影片,是一個農村的場景。老太太走在路上,然後一個鄰居就上來要拉老太太去她家裡吃飯。在中國農村,你知道人情味特別重,然後老太太就不願意去,然後那個人就非要拉去,她們倆就像打架一樣,在路上就那樣拉扯起來了。」

「如果是在中國農村,有這種經歷的人會覺得這是個很常見的場景,但是它不會出現在任何一個正式的記載當中。如果沒有快手這樣的平臺,這種中國民俗文化的東西,可能再過 50 年之後就沒有了。」

在去年的圖靈大會上,宿華曾經說過這麼一段話:「AI 應該用來解決什麼樣的問題,不是數學上的問題,而是說為社會、為人類應該解決什麼問題,想了很長時間有了一個答案。在這些年實踐的領域中,我想明白了不管我們做什麼樣的技術,最後都應該用於提升人類的幸福感,或者是做到幸福感的改善。」

這種幸福感,指的就是這些吧。

(備註:文中朝旭、水寒、月朗、繡虎、晨星、夢松均為化名)

相關文章