Hulu(北京)推薦演算法負責人周涵寧:怎樣應對基於深度學習的視訊推薦系統(圖靈訪談)

劉敏ituring發表於2017-11-22

enter image description here

周涵寧,本科畢業於清華大學自動化系,於美國伊利諾伊大學香檳分校獲得計算機視覺領域博士學位。

曾擔任富士施樂矽谷研究中心研究員、亞馬遜總部高階技術經理、盛大創新院資深研究員兼產品經理、智谷研發VP和寶寶樹的CTO等。

現任Hulu北京研發中心研究推薦演算法研究負責人(Hulu是全美第二大付費線上視訊平臺)。具有15年的產品研發、創新和團隊管理經驗,專注於實現應用資料和演算法從0到1的產品落地,在資料分析和機器學習方面有豐富的經驗。


訪談話題:

為什麼從自動化專業轉向了人工智慧方向(計算機視覺)?您在研究方向的選擇上,會考慮哪些因素?

我們學校的自動化專業下面有一個方向叫作模式識別,它是人工智慧的一個應用領域。我舉一個模式識別在工業界的應用,比如應用影像感測器做自動化質量檢測,就是一個人工智慧落地的場景。美國矽谷有一家叫KLA-Tencor的上市公司,他們的主要產品就是基於無損探測器(包括光學感測器)進行矽片自動質檢。另外,指紋識別和光學字元識別(OCR)也是模式識別的範疇。它們都和計算機視覺有很強的聯絡。

選擇計算機視覺作為研究方向,除了在自動化系的基礎訓練,還有一個重要因素是實習經歷。我在大三的時候,到微軟中國研究院(現在叫微軟亞洲研究院)實習。當時研究院的主攻方向是計算機視覺和多媒體技術,每幾周都會有相關的國際專家來交流講座,其中包括我後來追隨的博士導師,計算機視覺領域的開山鼻祖,UIUC大學的黃煦濤教授。我當時做的專案之一是基於多張圖片的三維場景重建。耳濡目染,我對計算機視覺領域產生了濃厚的興趣。

自動化跟智慧化的區別是什麼?

傳統的自動化主要是以相對固定的模式,處理相對簡單的場景。智慧化則具有人的感知、決策和邏輯能力,可以更加靈活多變的處理各種複雜場景。舉例來說,如果在Outlook裡設定了一個日曆事件,下午4點要開會,那麼電腦到了下午3:45的時候就會彈出一個事件提醒,這叫作自動化。如果電腦根據你當時的位置、路上的交通狀況和附近的空閒計程車狀態,自動計算出從你所在的位置叫計程車再行駛到會場需要花費37分鐘,然後在3:22 PM的時候幫你填好預約計程車的訂單。你只需點一下確認按鈕,就可以收拾好筆記本出門了。這就叫智慧化。

隨著各種智慧演算法可靠性的提高,它們逐漸融入到人們的日常生活,這些傳統意義上的"智慧化",也慢慢變成了"自動化"。例如,垃圾郵件過濾和拼音聯想輸入,都用到了基於機器學習的智慧演算法,但是人們對這類產品的預期也相應的提高了,不再認為這些功能是很"智慧"的了。

要在工作中運用機器學習方面的技術,普通程式設計師需要如何準備?

主要是補充線性代數、凸優化和概率統計方面的知識。相比傳統演算法,機器學習演算法的最大不同之處是它的執行步驟和引數,不是由程式設計師人工設定的固定組合,而是基於訓練樣本學習到的概率模型。要理解各種機器學習方法的優缺點,能夠將當前應用的場景,抽象成經典的機器學習問題。

例如,Hulu視訊App的首頁推薦,之前是按照產品經理手工定義的幾類不同內容來源來排列展示的優先順序,然後再對相同優先順序的內容,按照首播時間、最近熱度等因素排序。這就是典型的面向傳統程式設計模式的設計。新版App的首頁排序正在向基於機器學習的資料驅動演算法轉變。我們根據點選率預估進行排序,其中的點選率預測模型訓練,會參考產品經理給出的首播時間、最近熱度等特徵,但是會基於線上學習的框架,自動根據使用者的場景不同而動態調整各個特徵的權重。

從職業履歷來看,您既做過技術研發也做過團隊管理,更喜歡哪個方向?

從個人層面上,我覺得技術研發更有成就感,因為專注和沉浸在解決問題的過程中,是一件很享受的事。做技術研發也對自己的時間和精力有更好的掌控感。相比之下,團隊管理者需要有犧牲小我、成就團隊的胸懷。我讀過一本很好的書——Leaders Eat Last,講的就是這個意思。同時,還需要具備較高的情商和同理心,才能處理好承上啟下的溝通,這方面我推薦大家讀阿德勒寫的《溝通的藝術》。

對於程式設計師來講,哪個能力(技術vs管理)更重要?獲得這樣的能力,需要如何準備?

技術是立身之本,沒有這個基礎就不能成為一名合格的程式設計師。如果想要不斷地提高自己的能力,解決更大的難題,即使不戴管理的頭銜,也還是要掌握一些管理方面的知識。如何推進專案,如何說服他人,如何與其他團隊溝通,等等。獲得這些技能,我們需要運用“一萬小時定律”循序漸進地進行有意訓練:首先掌握一定的理論知識,這裡我推薦看《高效能人士的七個習慣》;然後在實際工作中去運用,體會哪些方法是適合自己性格的。如果在這個"術"的層面訓練到了一定的程度,就可以嘗試上升到“道”的層面,就是找到自己最擅長和最認同的事業,並運用之前學到的“術”,在助人的過程中實現自己的人生價值。

Hulu這個名字跟漢字的關係很大,背後的故事是什麼?

Hulu成立於2007年,當時的創始團隊中就有華人,他們建議用漢字“葫蘆”的漢語拼音來命名這家公司。因為Hulu希望以優質的視訊內容吸引使用者,讓使用者產生好奇心——“葫蘆裡賣的什麼藥”,並用個性化推薦引導使用者發現更多內容。

Hulu未來會進入中國市場嗎?跟國內的視訊網站相比,Hulu有哪些優勢特點?

Hulu目前只在美國運營,領導層會根據市場和使用者的需求,評估Hulu國際化的戰略。與國內視訊網站相比,Hulu擁有更多的美劇資源,今年還推出了電視直播業務,使用者可以在全平臺隨時看到50多個電視臺正在播放的內容,包括體育實況、新聞等時效性很強的節目。

推薦系統對於視訊網站的重要性是怎樣的?

推薦系統,從更廣的意義來講,屬於個性化系統,它是線上分發渠道相比線下渠道(例如,院線和傳統電視臺等渠道)的最顯著技術優勢,是視訊網站的核心競爭力。它可以用來引導使用者發現新內容,提高使用者活躍度和粘性。

客製化可以有幾個層級,個性化是其中最細緻的一層。在個性化之上,可以按照粗略的使用者分組來實現客製化。對於25~30歲這個年齡段的所有女性使用者,我們可以使用同一排序模型。在客製化的基礎上,可以疊加針對每個使用者的個性化特徵。如果把推薦系統看成是函式 y = A(x),其中x是關於每個使用者的特徵,y是輸出的推薦結果,那麼分組客製化,就是把A(.)函式針對不同組的x分別訓練,然後利用整合學習(ensemble learning)整合。

如何衡量一個推薦系統是否優秀?

從業務上講,使用者的觀看時長和訂閱數可以間接反映推薦系統的有效性。但是,這兩個指標會受到內容庫和市場推廣週期的影響。例如,新的爆款劇《冰與火之歌》第七季上線後,會在短時間內帶來大量新的訂閱使用者,並且大幅度地提升使用者的觀看時長,但是一兩週以後,這些指標就會逐漸回落。而在整個期間,推薦演算法本身的質量並沒有變化。

我們不僅需要根據業務指標來衡量推薦系統,還要參考一些直接的度量標準,比如點選率、多樣性、內容覆蓋率等。要想獲得這些直接的度量指標,開發人員需要和業務部門溝通和討論,根據他們的反饋做出調整。有的產品強調方便性,我們就要儘量縮短使用者從瀏覽到觀看花費的時間,而有的產品是為了給使用者提供更多的選擇,希望使用者瀏覽儘量多的內容,我們就需要對它們各自定義不同的指標。

以某個場景為例,說明一下基於深度學習的視訊推薦系統相比傳統推薦系統的優勢?

以特徵選擇為例,深度學習中的非線性對映(利用啟用函式的非線性),自動化了特徵選擇的步驟,使得我們可以更容易地整合多種資訊源。傳統上基於使用者行為的協同濾波和基於內容後設資料的系統,則是分開訓練兩個模型,然後將結果融合在一起的。但是,這樣很難將融合過程中觀察到的誤差傳遞到分開訓練的兩個模型的過程中。深度學習提供了一個端到端的框架,使得我們可以用同一個網路結構來將使用者行為和內容後設資料一起對映到使用者-物品相關性評分的學習中。

在11月9~12日的TOP100summit2017上,您分享的哪些內容是值得關注的?

我著重介紹了Hulu利用多臂老虎機來平衡熱門和長尾內容的展現,以及用迴圈神經網路模型做序列推薦的成果。前者可以更有效的利用有限的展示位來做長尾內容的冷啟動,後者是對自動連播場景的一種比較有效的建模方法。

基於深度學習的視訊推薦系統,下一步的發展是怎樣的?

  • 中短期的規劃主要是基於內容的推薦,解決冷啟動問題。

視訊網站的核心價值是對內容的理解。基於使用者行為的相關內容分析,已經到了比較成熟的階段,接下來的主要挑戰是對新內容和中長尾內容的冷啟動。目前,現有的方法依賴於人工標籤,存在一定的侷限性,隨著計算機視覺技術的發展,未來將會有越來越多的系統是基於內容理解來自動打標籤。

  • 長期的規劃是,基於自然語言對話進行內容的推薦。

智慧助手的應用是一個很有潛力的發展方向。例如,我晚上回到家,對電視說“我今天心情低落”,電視就會推薦一些治癒系的影視作品。如果我接著說“我想看點搞笑的”,它就會在之前推薦的基礎上,篩選出喜劇。這個場景雖然看似簡單,卻涉及複雜的情感類語義標籤和多輪對話之間的上下文關聯。


更多精彩,加入圖靈訪談微信!

相關文章