AI時代:推薦引擎正在塑造人類

caiyongji發表於2018-01-13

We shape our tools and afterwards our tools shape us. ——Marshall McLuhan

麥克盧漢說:“我們塑造了工具,反過來工具也在塑造我們。”

我本人不反感AI,也相信人工智慧會開創一個偉大的時代,但是我們要思考一些東西,至少知道那是什麼。本人旨在讓你瞭解當前人工智慧應用最普遍的智慧推薦引擎(Intelligent Recommendation Engine),其背後的設計理念,以及一些更深度的思考。關於理念,它不像技術要求太多的基礎,我儘量不使用專業術語,所以本文同樣適合程式設計師以外群體。

從“分類”說起

以大家熟悉的分類資訊網為例,像58同城、趕集網。網站把現實生活中的商品、服務進行分類進行展示,比如房產、二手車、家政服務等。這些內容即是現實世界對應的抽象,我們可以很容易的找到對應關係。

我們再以求職網站為例,像智聯招聘、BOSS直聘。網站按照職業把 人分類,比如程式設計師、廚師、設計師、數學家、物理學家等。

那麼現在問題出現了,眾所周知,人工智慧的完美入門人才是具有數學和計算機雙學位的碩士以上學歷人才。那麼,我們如何把這樣的人分類呢?我們無法單一的將其歸入到程式設計師或者數學家,我們無法為每一個這樣的複合型人(slash)進行單獨分類。

分類產生矛盾。

我們區分南方人、北方人,所以有地域歧視。我們區分亞洲人、歐洲人,所以有種族歧視。“分類”只是人類簡化問題邏輯的手段,薛定諤的貓和羅素的理髮師已經證明了“分類”並不正確。所以在大計算時代,我們引入“貼標籤”的概念。

貼標籤

AI時代是計算能力爆炸增長所帶來的。在強大的計算能力面前,我們真的可以針對每個人進行“分類”,它的表現形式就是—貼標籤

30歲以下、程式設計師、屌絲、奶爸、熬夜、不愛運動、公眾號叫caiyongji、格子襯衫、機械鍵盤、牛仔褲……這些可以是一個程式設計師的標籤。換個角度,“類別”反轉過來服務於單獨的某個人,這是在計算能力短缺的時代所無法想象的。

傳統的智慧推薦引擎對使用者進行多維度的資料採集、資料過濾、資料分析,然後建模,而人工智慧時代的推薦引擎在建立模型步驟中加入Training the models(訓練、測試、驗證)。

最後,推薦引擎就可以根據使用者標籤的權重(可以理解為對標籤的打分,表示側重點),對使用者進行精準推送了。

推薦引擎屬性分化

俗話是這麼說的“旱的旱死,澇的澇死”,“飽漢子不知餓漢子飢”,不知道這些俗語我用的恰當不恰當。我的意思是在智慧引擎的推薦下,會加強屬性兩極分化。

我們以程式設計師為例,選取程式設計技巧、打遊戲、體育運動、熬夜、看書五個維度。經過推薦引擎的“塑造”後如下。

圖片描述

目前,推薦引擎的演算法會將權重比較大的標籤進行優先推廣,這就導致原本權重大的標籤得到更多的曝光次數,最終使得權重大的標籤權重越來越大,而權重小的標籤在長時間的被忽略狀態下逐漸趨近於零。

推薦引擎行為引導

波茲曼認為,媒體能夠以一種隱蔽卻強大的暗示力量來“定義現實世界”。其中媒體的形式極為重要,因為特定的形式會偏好某種特殊的內容,最終會塑造整個文化的特徵。這就是所謂“媒體即隱喻”的主要涵義。

由於“推薦”機制的屬性分化,那些高技術含量的、專業的、科學的、真正對人又幫助的資訊被更少的人接觸,而那些簡單的、輕鬆的、娛樂的、裸露的、粗俗的資訊被越來越多的人接觸。

我們看一下具有影響力的百度、今日頭條和微博在今天(2018年1月13日10:04:xx)所推薦的內容。我刪除了cookie,使用匿名session,移除我的“標籤”。也就是說,下圖所推薦內容對大部分人適用。

圖片描述

只要你好奇點選,你的tittytainment(我翻譯成“愚樂”,那個三俗的譯法不要再傳了)屬性權重就會越來越大。娛樂新聞點選過百萬,科普文章點選不過百,這種現象正是推薦引擎的行為引導導致的。

不客氣的說,百度、今日頭條、微博對國民素質的影響是有責任的。

無關推薦(Non Relational Recommendation)

對於你從來都沒思考過的事物,你可能永遠都接觸不到,因為你不知道求索的路徑,所以有的人每個月都讀與自己專業無關的書,來擴充套件自己的知識面。我們舉個例子:

你可能會在網上搜尋如何與女朋友和諧相處但你未必會搜尋如何讓女朋友們和諧相處,有人笑談“貧窮限制了我的想象力”,其實不然,是你接收不到無關的推薦,你才被限制在特定的知識圈子裡。

所以我提出無關推薦這個概念。

對程式設計師進行畫像:

圖片描述

如圖,當某個標籤沒有到達“程式設計師”的路徑時,他可能永遠無法觸及那個標籤。這時,我們推薦“無關”資訊給使用者,強制產生路徑。

你可能會質疑,這是隨機強制推薦垃圾資訊嗎?

其實不然,通過深度學習,我們可以進行大量的資料收集、資料分析和模型訓練,我們是可以找到對某個個體無關,但會讓其感興趣資訊的興趣點。這種資訊就是無關推薦的

最後

你每天接收到的“推薦”背後是各個團隊經過心理學研究、行為學研究、大量計算設計的,人們正在失去深度思考、自主判斷的能力。對於進步青年、斜槓青年請保持思考。謹以此文獻給希望進步的你,希望你有所收穫和思考。


本文歡迎註明出處的轉載,但微信轉載請聯絡公眾號: caiyongji進行授權轉載。

相關文章