第一篇:你不一定了解的"推薦系統"

穆晨發表於2017-06-12

前言

       [推薦系統 - 基礎教程]可能是穆晨的所有博文裡,最有趣最好玩的一個系列了^ ^。

       作為該系列的[入門篇],本文將輕鬆愉快地向讀者介紹推薦系統這項大資料領域中的熱門技術。

為什麼要有推薦系統?

       從字面意義來看,推薦系統,就是向各位讀者們推薦物品的系統。於是大家自然會想到推銷......

       顯然,這並不好玩,因為誰也不想被人打擾,而這個"推銷系統"也不是本系列教程要講解的推薦系統。

       該問題的根本原因在於:傳統推薦方式太low了;而一個可能讓讀者們感到詫異的事實是:你們已經開始頻繁使用推薦系統了,而且還用得很爽。

       不相信?那麼我們來一一列舉吧!

       1. 你用過聽歌軟體吧?類似網易雲音樂、QQ音樂、蝦米音樂:

       2. 你上過網上書店買書吧?類似噹噹、京東書城、卓越書城:

       3. 來個新穎點的...你玩過王者榮耀吧?下面截圖你懂的:

       4. 再來個新穎點的...你還是單身嗎?聽說世紀佳緣、珍愛網這些婚戀網站的物件推薦系統也做得很不錯:

  

       5. 其他應用:推薦社交網路好友、推薦新聞文章、推薦美食......太多太多,這裡就不一一例舉了。

真的不需要推薦系統?

       即使筆者舉了上述例子,相信仍有讀者不服,表示他們不需要推薦系統。

       這群讀者應該主要分為三類:

       1. A類讀者:我就需要那些熱門物品;   --- 排行榜是個好東西,但啥都和別人一樣,豈非太無趣了?

       2. B類讀者:我喜歡自己去搜尋我需要的物品;   --- 難道沒試過突然想看本書,但糾結買哪本好?

       3. C類讀者:我覺得推薦系統侵犯了我的隱私;   --- 那您放棄的可能不只是推薦系統,而是整個網際網路了。

       不論這三類讀者有沒被說服,不可否認的是,對於大部分人來說,已經開始擁抱這個新生事物。

       另小道訊息稱,亞馬遜20%以上的營業額就是通過推薦系統實現的。這不單單是說明推薦系統對物品購買行為有影響,更說明對物品銷售行為有影響:你也許不但能用推薦系統買東西,還能用推薦系統賣東西

推薦系統的本質

       推薦系統其本質,是為了幫助人們解決資訊過載(Information Overload)問題的一項工具。

       所謂資訊過載,是指你所真正需要、真正感興趣的東西,被淹沒在其同類物品的海洋裡。因此,為了找到它,你需要耗費巨大的時間和精力。為了解決資訊過載問題,截至至今,人們經歷了分類目錄、搜尋引擎、推薦系統三個階段。

       下文將以資訊檢索為例,說明人們檢索方式(或者可以理解為解決資訊過載方式)的演化:

        在N年前,筆者熱衷於使用類似5566這樣的導航網站檢索資訊:

       該網站將其他網站分門別類地整理好,我對哪個類標籤感興趣就可點進去瀏覽相關網站資訊。這就是所謂"分類目錄"的檢索方式。

       ● 後來,有了百度。筆者直接往裡面輸入關鍵字,它就能提供我想要的網頁,這讓我覺得資訊檢索的效率更高了:

       這就是所謂“搜尋引擎”的檢索方式。直至今天,它依然是資訊檢索的最主流方法。

       ● 再後來,筆者發現QQ經常給我彈出類似這樣的資訊:

       這就是所謂“推薦系統”的方式了:我們不需要主動告訴系統我們對哪類資料感興趣,也不需要提供關鍵字,系統根據我們的歷史行為、偏好資料,將我們需要的資訊提供給我們。

       仔細一想,這不就是從海量的資料中挖掘知識,這不正是資料探勘的定義麼?等等,那推薦系統和資料探勘有什麼關係?好吧,再發散一下,大資料、資料探勘、機器學習、人工智慧、推薦系統等等這些概念又有什麼關係?

       哈哈,是不是有點暈了?這幾個問題就留給讀者自行思考吧,思考的過程,也是我們提升對大資料,或者說對資料本身理解的過程。

小結

       閱讀完本文,讀者已經體會到了推薦系統的重要意義了吧。

       那麼,推薦系統的"後臺"是如何通過建立"高大上"的演算法模型,從海量資料中精準地為使用者篩選出其感興趣的物品,並將之推薦給使用者呢?

       這就是本系列博文後面將要涉及到的重點內容了。歡迎讀者關注,和穆晨一起探討研究當今火熱的推薦系統技術~!

相關文章