珍愛網演算法總監黃鑫:用演算法幫人們找到幸福(圖靈訪談)
黃鑫,珍愛網演算法和資料探勘部技術總監。黃鑫大學的時候一直做.NET方向的Web開發,他做過ERP、做過網際網路,而後機緣巧合地做了爬蟲,來到演算法領域。他在豆瓣演算法組做了三年的演算法,從初級演算法工程師一直到後來的演算法組Tech Leader。黃鑫現在加入了珍愛網,他希望能在這裡實現自己的願望,並讓更多的人獲得幸福。
你是什麼時候開始程式設計的?
如果嚴格地說開始程式設計應該是大三上學期。大一的時候我是法律系的學生,然後大二轉到了計算機。但是我發現這裡和想象中的計算機系完全不一樣,我以前一直認為學計算機是學Windows操作,所以大二的時候幾乎一行程式碼都沒寫過。到了大三,我發現我宿舍的哥們都已經可以寫簡單的JSP頁面了,我還連Hello world都寫不順。當時我就請教一個當時在哈工大讀軟體的朋友,他說他現在在學.NET,我覺得特別高階(因為當時我只知道C, C++和Java,第一次聽說.NET),然後他寄給了我幾張學習的光碟,於是我就開始真正地寫程式碼了。
大學學習的最大收穫是什麼?有什麼建議嗎?
我覺得可以分成兩個層面來說,大學給我最重要的能力是自學的能力。因為大學的主要專業方向是Java,但是我學的是C#,所以幾乎所有程式設計相關的知識,包括Web開發這些都是我自己學的,這些是留給我最大的財富。
其次就是一些專業的基礎課,現在每當有一些學弟學妹讓我給一些建議的時候,我都會給他們講,在校所有的課都是非常有用的,你覺得沒有用只是因為你還沒有站在一定的高度去來看這些。比如說編譯原理,資料結構,作業系統,甚至組合語言。這也是我近幾年才認識到的,當然,我覺得這也算是中國教育的一些瑕疵吧。
是一個什麼樣的機會讓你進入到演算法領域?為什麼決定把資料探勘和演算法堅持做下去?
剛剛畢業的前兩年一直是做Web開發,後來換了一份工作是在一個外包公司做Python,但是剛剛做了半個多月就覺得特別不適應這種氣氛,我還是對網際網路更感興趣。然後前同事和我說他們需要用Python來做爬蟲,就把我叫回了以前的公司。做了幾個月的爬蟲後,我覺得蠻無聊的,恰巧公司需要做一個商品的關聯推薦,我就自告奮勇地做了。我去看了一些資料探勘的基本知識,覺得特別有趣,這也是我第一次覺得大學學的數學原來是真的有用,於是就把自己的方向定位到了演算法和資料探勘。
至於為什麼堅持,這個簡要地說有兩個方面,第一就是自己真正的興趣,另外,我喜歡做網際網路的初衷就是希望能幫助到更多的人,我覺得這比技術重要得多。我覺得推薦系統能夠幫助更多的人找到合適的東西,發現他原本不知道的事,這很有成就感。
作為一個資料探勘和演算法方面的資深工程師,你的學習祕訣是什麼?
這個和演算法無關,任何領域學習的祕訣都是兩個。第一是努力,第二是思考。其實就是學而不思則罔,思而不學則殆。聚焦到演算法上,就是要多看paper,多讀書,不僅僅是資料探勘的書,而是整個技術,甚至心理學領域的書。然後多思考,思考每個模型背後的意義。
你是如何在3年中從豆瓣的初級演算法工程師變成演算法組的Tech Leader的?你認為自己的過人之處在哪裡?
我覺得首先要感謝我在豆瓣的mentor阿穩吧。我剛剛進豆瓣的時候,連協同過濾都講不清楚,他教會了我如何去做一個專案,然後每個專案需要如何去推進。然後其他的同事教會了我如何去讀一篇paper,如何去學習一個model,然後去深入一個領域。如果沒有那些同事,也就沒有今天的我,我很感謝他們。
如果說我有過人之處的話,可能是這幾點吧。第一,我覺得自己可能是比較努力的人,我一般每天只睡4個小時左右,然後剩下的時間除了吃飯幾乎都是泡在技術上(當然我承認,這是因為我單身啦,哈哈,圖靈可以打徵婚廣告麼?)。另外,我覺得自己比較喜歡天馬行空地思考一些問題。最後,可能我最大的優點是比較全面,無論是工程,演算法,產品,運營,甚至行政和人事都有一些涉及,所以我可以和其他部門的同事比較順暢地溝通,我覺得這是做Leader的必備素質。
你在豆瓣最大的收穫是什麼?
除了在上面講的技術上的提高外,豆瓣給我最大的收穫就是讓我知道了什麼叫做精英團隊,也許這會影響我一輩子的職業生涯。包括現在在珍愛,我也依舊希望把我的團隊打造成一個精英團隊。
為什麼要去珍愛網?吸引你的是什麼?
總體來說珍愛網有幾點吸引我的地方:
第一,從技術的角度上,我覺得婚戀網站是個特別適合做演算法的地方,因為與傳統的人和物的單向匹配不同,婚戀網站注重的是人與人之間的雙向匹配。在豆瓣,我可以給無數個人都推薦熱門的書籍,這本書可以是《紅樓夢》,但是在珍愛網,我不可能給所有人都推薦林志玲,即使他們都喜歡她,因為需要考慮雙向匹配的問題。
第二,從產品的角度上,我覺得在最近的幾年內,有兩個產品形態一定是熱點,一個是移動網際網路,這個自然不必多說,一個就是O2O。關於移動網際網路,珍愛有自己的珍愛實驗室,會產出很多有趣的移動專案,珍愛網本身也在關注移動網際網路上的推進。另外,珍愛網是婚戀市場上最注重O2O的公司,所以這也是最吸引我的兩點。
第三,從團隊的角度上,和資料部門的VP以及創始人李鬆博士聊過之後,我被賦予了很多權力,公司也提供給我很大的支援讓我來建立一支我心目中優秀的演算法團隊,這也是我自己的一個理想。因為我一直覺得我的能力不僅僅侷限在技術上,可能在管理上我會有更大的發揮空間。
第四,從夢想的角度上,當初選擇做網際網路而不是傳統軟體行業,最大的原因就是我希望自己能利用自己的技術幫助到更多人。在豆瓣我很開心的是幫助使用者發現了更多生活中的樂趣,比如圖書,電影,同城活動。那麼在珍愛網,讓我更有成就感的就是也許我能利用自己的演算法幫助人們找到屬於他們自己的幸福,如果使用者因為我的成功匹配而幸福一生,也許這會是我最大的滿足了。
最後,和李鬆博士在酒店聊了幾個小時之後,我感覺自己第一次遇到了一個真的懂資料的老闆,而且鬆哥也提出了很多對於資料部門的暢想,這些都讓我相信,這是一家值得我為之奮鬥的公司。
從豆瓣到珍愛網,工作環境和公司文化有很大的差別,這對你是個挑戰麼?
說到差別是一定會有的,因為珍愛網畢竟建立了很多年,而且最初的珍愛網一直都是一個以線下為主的公司。所以嚴格地說,珍愛網還算不上一個網際網路公司。但是我也說到,其實公司的管理層也意識到了這樣的問題,希望公司能夠完成到網際網路公司的轉變。
在到公司之前,我也知道公司會有這樣的問題,也想過這對於我的挑戰。但是我恰恰覺得,一個人真正的能力不是在一切都很優秀的團隊做出成果,而是在一個原本並不足夠優秀的公司,把不好的事情給變好,這才是我真正的能力的體現。這種挑戰本身也是我選擇珍愛網的理由之一。
有人說婚戀網站普遍的使用者資料探勘能力不夠,這是你去珍愛網想要努力提高的東西麼?
婚戀網站在過去的若干年,無論是珍愛還是世紀佳緣這樣的公司,一直都處於粗放式發展的擴張階段,所以確實沒有把資料和演算法很好地給利用起來。如今成熟的婚戀公司都已經遇到了發展的瓶頸期,所以需要資料和演算法為其提供更好的支援。也就是說進入到了一個精細化比拼的時代,所以這也是我工作的最大職責所在。
你認為豆瓣和珍愛網在推薦系統上最大的區別是什麼?
如之前提到了,在豆瓣的推薦更多的是人與物之間的單項匹配,而在珍愛網更多的是人與人之間的雙向匹配,這本身是一個非常具有挑戰的事情。此外,我們更需要通過各種渠道來挖掘資料。我舉個例子,如果我們在街上拉到一個行人問,你希望的另一半是什麼樣子?他給你的描述多半與他的伴侶是不一樣的,也就是說,我們很難根據一個人顯式填出的條件去來為一個人做婚姻的匹配,我們更需要通過各種渠道來挖掘出使用者真正的喜好。 最後,在豆瓣最常用的推薦演算法是協同過濾,但是在婚戀匹配中,至少這還不是一個常用的方案,當然,目前我們團隊也在做協同過濾的在婚戀匹配中的研究和嘗試。
在技術上,珍愛網和match.com有什麼樣的合作?
在技術上,match.com是非常以資料為導向的公司,所以他們作為支援方會提供給我們很多他們的經驗,比如A-B Test框架,資料魔方等產品的思路,以及一些技術和產品方案的支援。除了日常的線上郵件溝通外,每年match.com都會有技術專家來珍愛網做一些技術培訓,或者是我們一些同事去美國工作一段時間學習他們的先進經驗。
珍愛網創始人李鬆博士說過,正在努力把珍愛網上升成一個更加以資料為導向的公司,你認為珍愛網和其他婚戀網站相比在技術上的最大區別是什麼?
首先,珍愛網有著其他婚戀網站所不具備的線下優勢,這要求推薦演算法除了面向使用者做傳統的線上推薦系統之外,還需要面向紅娘,這也是O2O模式下推薦演算法的應用,這是在技術上其他婚戀網站觸及的比較少的點。
第二,珍愛網更像是一個集團公司,除了珍愛網這個品牌外,還有著很多移動類的實驗產品,這些產品都很新奇有趣,所以我們除了婚戀匹配外,還會有很多關於社交網路的文字挖掘,情感分析等工作需要做。
第三,就我個人的理解,珍愛網也許是幾家婚戀網站中最重視資料和演算法的一家,在珍愛網,資料部作為公司的一級事業部,有著二十多人的團隊,而且團隊現在還在繼續招聘。如李鬆博士所講,我們希望珍愛網能成為一家以資料為產品導向的公司。
更多精彩,加入圖靈訪談微信!
相關文章
- 《演算法圖解》作者Adit Bhargava訪談問題徵集(圖靈訪談)演算法圖解圖靈
- 【視訊訪談】專訪1藥網 技術副總裁黃哲鏗:揭祕技術跨界管理之道(圖靈訪談)圖靈
- 圖靈訪談圖靈
- 《演算法新解》作者劉新宇訪談問題有獎徵集(圖靈訪談)演算法圖靈
- 《演算法圖解》作者Adit Bhargava:插圖筆記法解除演算法的魔咒(圖靈訪談)演算法圖解筆記圖靈
- 向Facebook產品設計總監Maria Giudice提問!(圖靈訪談)圖靈
- Facebook產品設計總監Maria Giudice:以人為本是一種心理狀態(圖靈訪談)圖靈
- 美團(配送演算法策略架構師)郝井華訪談話題有獎徵集(圖靈訪談)演算法架構圖靈
- 《演算法問題實戰策略》作者具宗萬訪談問題有獎徵集(圖靈訪談)演算法圖靈
- 演算法資訊理論之父蔡汀:未來,我們可以為DNA重新程式設計(圖靈訪談)演算法程式設計圖靈
- 訪談嘉賓推薦(圖靈訪談)圖靈
- [英]Facebook產品設計總監Maria Giudice:以人為本是一種心理狀態(圖靈訪談)圖靈
- 《JavaScript Web應用開發》作者Nicolas:恰巧,愛好變職業(圖靈訪談)JavaScriptWeb圖靈
- 《App創富傳奇》作者Chris Stevens: 我們生活在獨立開發者的黃金時代(圖靈訪談)APP圖靈
- 紀念阿蘭·圖靈誕辰,評選“精彩·好訪談”(圖靈訪談)圖靈
- 圖靈訪談:人們不想以舊的方式生活 卻不知道自己想要什麼圖靈
- [英]Nicholas C. Zakas:愛工作、愛技術才能成長(圖靈訪談)圖靈
- [Video]《演算法新解》作者劉新宇:我只是想開啟那些黑盒子,告訴人們裡面有什麼(圖靈訪談)IDE演算法圖靈
- 薑餅人:旅行才是我真正的人生(圖靈訪談)圖靈
- 《演算法的樂趣》作者王曉華:“玩”過就是收穫(圖靈訪談)演算法圖靈
- CSS創始人之一Bert Bos訪談問題有獎徵集(圖靈訪談)CSS圖靈
- Bleeding Edge創始人Troy Mott訪談問題有獎徵集(圖靈訪談)圖靈
- 《演算法問題實戰策略》作者具宗萬:陪你一起設計演算法(圖靈訪談)演算法圖靈
- 《演算法(第4版·英文)》作者羅伯特·塞奇威克訪談問題有獎徵集(圖靈訪談)演算法圖靈
- 知乎pure render專欄創辦人@流形訪談問題有獎徵集(圖靈訪談)圖靈
- 《垃圾回收的演算法與實現》作者中村成洋&相川光訪談問題有獎徵集(圖靈訪談)演算法圖靈
- 演算法要幫你找到真愛有點難演算法
- 《JavaScript Web應用開發》作者Nicolas Bevacqua訪談問題徵集(圖靈訪談)JavaScriptWeb圖靈
- 阿朱:從50到5000,從技術到人(圖靈訪談)圖靈
- 王哲:愛偷懶+愛遊戲=開源Cocos2d-x的生命基因(圖靈訪談)遊戲圖靈
- 周愛民:真正的架構師是沒有title的(圖靈訪談)架構圖靈
- 《用資料講故事》作者Cole Knaflic訪談話題有獎徵集(圖靈訪談)圖靈
- 阮一峰訪談問題有獎徵集(圖靈訪談)圖靈
- Nicholas C. Zakas:我熱愛網際網路技術的種種異端(圖靈訪談)圖靈
- [英]Donald E. Knuth(高德納):總有一些事超越我們的理解(圖靈訪談)圖靈
- 人機大戰結束了,AI卻再次火了!(圖靈訪談)AI圖靈
- 《網際網路思維的企業》作者Dave Gray:和需求互聯的公司們(圖靈訪談)圖靈
- 《我心愛的雷龍》作者Brian Switek:Bones, a time capsule of a life(圖靈訪談)圖靈