今日頭條與一點資訊,誰能找到演算法匹諾曹的藍仙子

子華發表於2016-01-29

enter image description here 題記:本文從一個媒體人的不安出發,雖然是談演算法,和產品人交流,也是寫給媒體人看的。媒體人如何面對技術的衝擊,如何尋找自己的位置?寫作過程對我本人也是一次挑戰,錯誤也很難避免,歡迎交流。本文首發於虎嗅,這是修訂版,授權雪晴資料網發表。

無論2016年科技圈熱門的噱頭有多少,對資料基礎設施方面的耕耘仍然是決定實力的關鍵。阿里之類電商資料帝國自不待言,今日頭條、一點資訊等在資訊資料領域的開拓更加值得注目。比起電商的物流資料,資訊演算法驅動與使用者資料分析是更加“觸及靈魂”的事情。

1月15日,在頭條主辦的“珠海未來媒體峰會”上,技術出身的CEO張一鳴走到臺前,向臺下一眾媒體人發表演講:《我眼中的未來媒體》。他縱橫媒體發展史、國內外現狀,從古騰堡到貝索斯,從App Store到Instant Articles,看似雄辯地證明媒體人把內容輸送到演算法推薦平臺是大勢所趨。

一點資訊緊跟其後。1月20日,在其與鳳凰博報聯合舉辦“鳳凰一點通”年度影響力自媒體盛典上,一點資訊宣佈打通兩家平臺,資源共享。一點資訊副總裁吳晨光面對臺下上百位自媒體人,也在極力渲染一點資訊的讀者畫像等演算法技術。鷸蚌相爭剛剛白熱化,已有一隻黃雀在身後——騰訊的同類產品“天天快報”已經低調運營了一段日子,不知道在憋什麼大招。

人們應該記得,2014年多家傳統媒體因版權問題對今日頭條發起聲勢浩大的訴訟。2015年11月也有媒體發起對一點資訊的版權訴訟,但反響很小。再到如今,媒體人坐在臺下為張一鳴鼓掌捧場。也許真是時勢變化,技術的發展已經讓內容生產者從驚恐到不得不適應。

頭條不是百度,推薦引擎有別於搜尋引擎。其實頭條所自豪的演算法推薦也不是這幾年才出現,谷歌、百度都是前輩,為什麼是頭條讓演算法成了頗具神祕感的明星?

頭條出名以來,一直有人吐槽推薦演算法不準確、製造資訊繭房,一些評論者宣稱裝了就解除安裝。我也有同感。不過就像帝吧遠征之人力洪流帶來的震撼,今日頭條巨大的流量也促使我重新審視演算法洪流。別忘了頭條招聘啟事上寫著:“對用機器學習演算法解決現實問題有強烈的渴望和堅定的信仰。”

演算法目前的狀況就像笨拙的匹諾曹,他被要求做什麼?

普通讀者這些年對演算法推薦的直觀感受並不佳:瀏覽了某個淘寶頁面之後再去其他網站,頁面也會浮現同類產品的廣告,如果瀏覽的是情趣用品呢……在頭條看新聞也很容易遇到這種情況——相似資訊不斷湧來。(可參見虎嗅上這個批評:《我為什麼看衰內容的個性化推薦?》

即便這種看似粗糙的同類資訊推薦演算法,也足夠我先丟擲對演算法的總體觀點,有三個層面:

首先,演算法是一種類似金融資本的東西,是方法。就像財務投資者不必追求理解公司具體產品本身,只在乎能否增值。演算法不管內容實質是什麼,只管能否數字化、分類集合、反饋優化,是處理海量資訊的方法。與資本一樣,它能提升效率,也與個體有矛盾。

第二,張一鳴在演講中說Facebook把技術支援變成了一項接近水、電、煤氣這樣公共服務的事情。再進一步,當演算法深入生活的方方面面,積累的智慧本身將成為基礎設施。KK(凱文·凱利)在新書《必然》裡說到,未來的人工智慧網路(主要包含演算法)將會成為“如同電力一樣無處不在、暗藏不現的低水平持續存在”。比如辦公室的桌椅和電腦都會識別你,記錄你喜歡的姿勢,在你一走進辦公室就調整好姿態,開啟你常用的軟體、網站等等。

但對於資訊內容傳播來說,這還不夠。內容不是桌椅,桌椅只要伺候我們,內容卻是裝載了他人靈魂的存在,要和我們互動、砥礪。這就是第三層,演算法要想觸及靈魂,還得努力。

頭條到底是什麼?有人已經說了它不是新聞客戶端,而是資訊分發平臺。僅此而已?

張一鳴演講稱:

“將對媒體在今日頭條平臺上的使用者資料進行更詳盡的統計分析。除了性別、終端、年齡、地域分佈等使用者屬性基本分析外,還將提供使用者的興趣和情感傾向分析。通過這一功能媒體可以知曉受眾喜歡哪些分類的文章、使用者最喜歡文章裡的哪些關鍵詞、關注你的人還喜歡哪些內容等等。”

這話本意是針對微信,微信公眾平臺目前恰好只能提供受眾的“性別、終端、年齡、地域分佈”分析。興趣和情感,這是演算法更高的追求。

頭條的銷售人員在推銷自家產品時,可以告訴一家汽車製造商:使用者的閱讀行為資料能夠展現出哪個地方的人最喜歡你們的哪一款車,我們將把你們的廣告推送給合適的讀者。今日頭條的同類產品“一點資訊”也在做同樣的事情。創始人鄭朝暉曾對內容總監吳晨光強調:“比閱讀重要的是閱讀者的行為。”

所以頭條們在做什麼?今日頭條是偽裝成新聞客戶端的使用者行為資料收集器和分析器!(這感覺就像有位美國政治學者說的,現代中國是一個偽裝成民族國家的文明帝國。)每一篇新聞都應該被看作一道對使用者的測試題,使用者的每一次點選、評論都是一種回答,都被系統記錄,和關鍵詞、Dom標籤、作者、閱讀時間、網路環境(wifi還是4g?)等等一起構成多維資料矩陣,刻畫出這個讀者的特徵。每道“測試題”都很粗糙,但是就像KK的“蜂巢思維”所言,海量資訊一起測試出的使用者特徵就比較準確。而且使用者因為是在無意識中完成測試的,答案比較真實。這就是頭條們的技術和商業模式核心所在。(不必在隱私範疇擔心這個問題,按照KK的說法,未來美好資料生活就是以每個人的使用者資料為基礎的。)

讀者難免會質疑,你倒是收集好資料了,可是給了我們什麼?讀者也不需要流量,要的是資訊的準確和善解人意。

我們不妨把演算法看作一個正在成長的生命。一個務實的演算法只須保障商業模式,但一個高尚的,純粹的,理想遠大,脫離了低階趣味的演算法必然也渴望星空,渴望與我們互相引領。它在試圖理解我們,但我們對它的理解也很重要。瘸腿狐狸只想拿匹諾曹做工具,藍仙女卻要他做人。

猜想今日頭條的演算法

經常被頭條員工拿出來說的簡單演算法是AB測試和雙盲檢驗。

演算法架構師曹歡歡和增長團隊的張楠都公開講解過,如何用AB測試來判定一個產品修改的效果。比如一個按鈕是用紅色好還是用藍色好,那麼就各向1%的使用者釋出兩種顏色產品,哪個下載得好就推哪個。如果用在新聞上,就是同一條新聞由編輯給兩種標題,測試哪個標題點選好。

雙盲檢驗,是先讓演算法判斷一個新聞的分類和推薦物件,然後讓兩個編輯分別檢驗,如果結果一樣,就通過,不一樣就請第三人判斷並彙報程式設計師,重新調整演算法。在我看,這背後是一個類似神經演算法的“刺激-反應”模式——根據演算法反應對錯調整某個引數(權重),也是一種人工智慧裡常見的“半監督式學習”。這大概也是張一鳴口中人機結合、發揮人的智慧的證據之一。

不過在這個例子中,編輯的角色比較被動,像工廠流水線上的螺絲釘。

深入透視頭條的演算法

我注意到今日頭條在拉勾網打出一個百萬美元年薪的廣告,招募演算法架構師,要求擅長:貝葉斯學派相關演算法,超大規模離散LR,深度神經網路,各種tree-based的演算法等。其他演算法工程師崗位要求大同小異。 enter image description here

這些在技術人士眼中並不特別,很多IT公司必備,多和概率統計學有關。比如貝葉斯演算法,常用的郵件客戶端上就有出現。 enter image description here

我想盡我所能簡單介紹一下這位百萬年薪工程師具備的演算法知識,不從數學專業角度(專業角度我也不懂,否則我就去應聘了~),而是從使用者角度思考“演算法想要什麼”。

演算法如何閱讀新聞

以招聘啟事中的tree-based演算法為例。為了處理資訊,演算法的初始訴求往往是對海量資訊做分類聚合。人類眼中的詞彙在它眼裡都是引數(維度),一千個不同詞彙組成的一篇文章就是一千個維度組成的一個向量。然後機器在代數世界裡衡量不同向量的相似度——簡單向量距離分類法、貝葉斯演算法、KNN(K最近鄰居)演算法、線性迴歸、邏輯迴歸……

維度太多,於是演算法進化了,不再把每個詞當作維度,而是把html程式碼裡的節點標記(DOM)作為維度,這樣就大大減少了維度個數。人類看見的標題、文字、圖片,被程式碼放在不同的DOM節點裡,比如head,比如body,比如TR、TD(表示表格的程式碼),構成樹狀結構。演算法以這些節點為維度,用各種演算法對比不同的文件異同——k means(硬聚類)演算法,minimax(極小化極大演算法)……再進一步,引入圖論範疇的模式樹,就有了更高階的tree-based演算法。

下圖是個常見的html dom展示,不需要看懂,只要瞭解機器眼中的文章是什麼樣子。 enter image description here

(機器眼中,各種標記最重要,然後通過各種公式來處理。圖片來自愛範兒,公式來自酷勤網)

演算法五花八門,我說的也不準,主要看氣質——演算法這個孩子不知道新聞說了什麼,只知道哪些新聞是同類,哪些是熱點(點的人多當然就是熱點,機器可以通過一種“組合”演算法來判斷,可以參見南京大學新聞傳播學院助理研究員、奧美資料科學實驗室主任王成軍的文章《“今日頭條”怎麼計算:“網路爬蟲+相似矩陣”技術運作流程》)。文章標籤、關鍵詞等也起到作用。

演算法匹諾曹的行為很有趣,好像在努力用各種辦法躲避對內容靈魂本身的認知,只通過外表的形式特徵去猜內容的相關度。

演算法如何研究讀者

讀者身上沒有關鍵詞,沒有標籤,演算法如何把握?數學家們有辦法,貝葉斯演算法就是一種。

經典的貝葉斯問題在小學奧數裡就有(美劇《生活大爆炸》裡也出現過):假如分別有A、B兩個口袋,口袋A裡有7個紅球和3個白球,口袋B裡有1個紅球和9個白球,現從這兩個口袋裡任意抽出了一個球,且是紅球,問這個紅球是來自口袋A的概率是多少?

讓我們換一個更具新聞性的表達方式:假如已知韓國每5年發射一次衛星且每次爆炸失敗率是60%,朝鮮每2年發射一次衛星且每次爆炸失敗率是40%。現在從朝鮮半島傳來一聲衛星發射失敗爆炸的巨響,請問這枚火箭來自朝鮮的概率是多少?

根據貝葉斯公式【P(B|E) = P(B) × P(E|B) / P(E))】就可以推匯出這個概率來,也就是逆向計算概率。

enter image description here (圖片來自“機器之心”網站)

恰好頭條自己提供了一個範例:

2015年10月,在中國傳媒大學新媒體研究院和今日頭條聯合舉辦的“洞見資料的力量——電視媒體高峰論壇”上,一位叫做安娜的女士說:

頭條有個獨特的演算法能推算使用者的年齡,即使你沒在頭條訂閱。系統根據已確定年齡人群的動作、特點和興趣做了一個模型,由協同原則判斷讀者是否符合這個模型,這時機器先預判是否為該年齡段的使用者,同時機器再根據你的閱讀動作最終確定年齡段。

這個獨特的演算法可能就是貝葉斯演算法(當然也許不止一種演算法,比如也可能存在專門用於挖掘不同資料集合間關聯性的Apriori演算法等)。我猜想演算法架構師會預先根據心理學、社會學統計資料以及以往讀者點選資料,構建一個用概率來描述的人格特徵模型,比如男性模型的特徵之一是在閱讀新聞時點選軍事新聞的概率是40%,而女性模型是4%。一旦一個讀者點選了軍事新聞,演算法就開始逆推他的性別,加上TA點選其他新聞的行為資料,綜合計算,就能比較準確地判斷他的性別。綜合IP地址(地理資訊)、點選時間、評論參與、點贊行為這些明確的資訊,就能區分出不同讀者的取向、興趣。

原理不難理解,但做起來考驗智慧和耐心。

競爭的難題:無法區別的風格問題

在傳統的媒體公司,編輯團隊和廣告銷售團隊總會有矛盾和博弈。在頭條一類的公司,則是演算法團隊對編輯團隊佔據絕對優勢。這未必是好事。演算法團隊本身是較難產生風格的。頭條、一點資訊和天天快報究竟有多少區別呢?

風格既人,風格即靈魂。雞蛋個個不同但那不是風格,只是原始特徵。風格是一種需要積極建構的氣質,是生氣灌注的行動。

傳統媒體都是有風格的,沒風格的不是死了,就是殭屍媒體。

下面這個微博截圖體現了風格: enter image description here

美國的紐約時報和赫芬頓郵報同一個“美國夢”,也具有顯著不同的氣質。有自己相信並追求的價值觀,追求新聞事實時候有非如此不可的衝動,寫作時有難平之意化為不休的訴歌,這才是風格。

風格是原創,是觀點交鋒,是議程設定,是話語創新。演算法還沒學會這些,因為設計演算法的技術人可能還不太懂這些。

這還不只是差異化競爭問題,更重要的是產品的內在矛盾。頭條們不止是平臺,因為偽裝不是白裝的,新聞客戶端的表象與演算法機器的矛盾是無法擺脫的“原罪”。形式不是內容之外可有可無的事物,形式就是內容。頭條們註定不可像沒有首頁推薦的微信公號平臺一樣,真的只做完全中立,沒有一點情感和立場的平臺。人們都認為你是資訊客戶端,你就要做資訊媒體的事情,哪怕和演算法的性格有矛盾。但矛盾不是缺陷,矛盾是推動自身進化的動力所在。

他們想有風格。

起步較晚的“一點資訊”在努力表現自己的風格,比如宣稱自己是做興趣搜尋,有別於頭條的演算法推薦。吳晨光宣稱一點資訊是“百度+頭條”:

“正如一點資訊董事長劉爽所說,如果頭條是造紙術和印刷術,那麼一點資訊就是火藥和指南針。這兩個APP都以‘千人千面’為核心競爭力,因為確實像造紙術一樣改變了傳播。但一點比頭條更近一步:所謂火藥,是通過搜尋喚醒了沉睡在APP裡的資訊,你可以通過搜尋、訂閱,兩步完成你對任何你感興趣內容的定製。至於指南針,我這樣理解:因為一點後臺有非常精準的使用者畫像,所以可以把最符合你興趣的內容分發給你。用我們內部的一句話說:大事件作出共鳴,個性化要像蛔蟲。”

可以看出來,作為後起者,一點資訊一方面不得不通過頭條來定義自己,同時又必須有所區別,特別強調搜尋。不過從使用者直觀感受來講,這種區別是很難看出來的。頭條一樣有搜尋功能,也會記錄讀者的搜尋行為。可能,鄭朝暉有雅虎的經歷,在搜尋上會有獨到經驗。

至於“指南針”,只是一個更生動的比喻。所描述的“使用者畫像”,可以猜想也是和貝葉斯演算法之類大同小異的方法。

看拉勾網上“一點資訊”的招聘,唯一的演算法師招聘廣告要求:

“文字分類和語義理解,社交網路分析,網頁搜尋,推薦系統等領域的特定演算法,理解自然語言處理、機器學習、網頁搜尋,推薦系統,使用者資料分析和建模的基本概念和常用方法。”

應該說,所謂“特定演算法”大家都類似。具體的公式和策略五花八門,但那只是雞蛋的不同,最多在比拼誰的演算法最state of the art。能區別風格的還是操作者的思想理念、媒體情懷和輿論場的洞察判斷力。同樣的演算法,具體開發時候也要看悟性、靈性。谷歌與百度在使用者看來,最直觀的區別也還是理念和情懷的不同。

相比之下,吳晨光強調一點資訊在提高自媒體門檻的做法,這種篩選是由媒體人團隊做到的,我認為更重要。

“最近兩個月,一點資訊封掉了大概7000多個號。古玩、健康、財經等,都是重災區。我們的競爭對手,在放寬入駐條件,但我們相反——高標準,並且實行嚴格的分級制度。從一級到六級,級別越高標誌著你的內容越優質,這樣你得到的展示量就越大。”

這是在用人的智力為演算法提供可貴的引數。

頭條大舉招募媒體人入駐平臺,並加大對自媒體平臺的投入,這是有意識地搶佔底盤,獲得內容版權,也是無意識地要讓自己更生動。

可是演算法尚不能理解這種風格化的努力。

演算法匹諾曹的自我障礙:沉淪本我,缺乏超我

我試著用社會心理學的語言來描述演算法獨尊主義帶來的資訊繭房問題。

演算法和讀者一起,沉淪於本我的漩渦。本我的慾望讓你去點選了一條驚悚的社會新聞,但本我不是人性,對本我的自省和超越才是人性。反覆湧來的社會新聞會讓讀者生厭。這個一直被人質疑的問題似乎沒有得到透徹的說明和改善。

求證過員工自己對這個問題的看法,他們會告訴你不喜歡這樣的資訊就用手指劃掉,系統就會減少此類資訊推送。我在虎嗅上也看到類似的回答,如下圖: enter image description here

在我看來,這只是一種簡單的線性思維。演算法只計算異同關係,只機械地問你要還是不要,而沒有計算諸如相對關係、主從關係等等複雜的關係。就像一個不太會戀愛的直男,聽到對方說no的時候,並不善解對方真正的意思。

我同意虎嗅上這個讀者的說法: enter image description here

演算法能否採用更好的策略,除了數學思維本身,還在於演算法對人性的理解。非線性思維才能貼近人性——哪怕是庸常之輩,也會渴望有一隻手能托起自己的頭顱。假如使用者多點選了幾次驚悚社會新聞,演算法可以繼續推送同類資訊,但是一定要顯出一種“我猜你其實也是個有高尚趣味的人”的姿態——可以於驚悚新聞資訊流裡突然插入一條洗眼資訊,可以是正能量,可以是對立面,可以是新聞分析。既然瀑布流裡面可以插入廣告,為什麼不能插入和使用者點選趣味相反的文章?

我不瞭解具體演算法設計問題,也許需要更復雜的集合演算法。每條資訊有自己對應的映象,就像本我對應的超我,就像西斯武士對應的絕地武士。不甘做機器保姆的小編可以參與打造這樣的集合,提升機器靈魂的同時提升自己,共同進化。彼此是對方的啟蒙者,而不是做一個被動的僕人。也許會有偏差,會有博弈,但魅力就在這裡。在《失控》看來,人機之間要有一定的對抗才能共同進化。也許演算法在等待讀者自己走出沉淪,但對抗就要求演算法更彈性一點,更搶先一點,主動試探讀者是否想要逆風而行。

從更高的層面來認識演算法匹諾曹的成長問題,這甚至會危及商業模式

用資訊測試讀者,是把讀者看作已完成的人格。而人性是永遠在路上的未完成之物。人性和人類的創造物,需要彼此激發,螺旋上升。分類聚合演算法只是把自己看作一個置身事外的觀察者,正如科學試驗裡的觀察者,以為自己不在事件之中。但這是不可能的,演算法已然在參與人性的構建,只是採取了消極的方式——人以群分,每個人沉淪在自己的趣味裡。後果是讀者的極化,老死不相往來,像黑客帝國裡的人繭。人繭衰弱的同時,系統的活性也在衰減。

極端分化的人群與極端分化的資訊一樣,缺少活性。而搜尋引擎則沒有那麼主動地去極化人群。人在搜尋時候主動性更強,我倒希望一點資訊是在利用搜尋引擎收集讀者的主動性方面有所建樹,以此刺激演算法。

我們可以用貝葉斯演算法本身的問題來解釋這個危險:

研究者John Horgan在《科學美國人》上發表了一篇文章《被追捧和被歪曲的貝葉斯理論,究竟有什麼大不了?》(由“機器之心”網站提供中文翻譯),講述了貝葉斯演算法自身的一個矛盾(具體論證過程此處免去,可參見上面的文章連結):

“貝葉斯理論沒什麼神奇的。歸根結底,它就是在說,你的信念只和它的證據一樣有效。如果你有好的證據,貝葉斯理論就能得到好結果。如果你的證據不足為信,貝葉斯理論也就沒什麼用。進入的是垃圾,出來的也是垃圾。”

對貝葉斯演算法來說,初始確定的概率很重要,比如前面提到“40%的成年男性喜歡閱讀軍事新聞”,這個概率判斷就是初始確定的概率,能通過社會統計獲得比較接近現實的數字,一般也比較符合常識。但是對於很多事情,比如“上帝存在”,初始概率就難說了,有人會定為百分百,有人會定為零,於是最終結果不過反映了給出初始條件者自己的主觀願望。即便“40%的成年男性喜歡閱讀軍事新聞”,表達的也是現有的社會狀況。最終的資訊推薦結果則反過來強化了這個初始概率——愛看軍事的就更多地看到軍事新聞。認為性別是後天建構的女性主義者恐怕就會討厭這種刻板狀況。

所以,目前的演算法是不太懂得體貼各種人類需求的。未來它應該讓不同的趣味,不同的人群相逢。

演算法匹諾曹的藍仙子在哪裡?

張一鳴演講批評微信朋友圈資訊推薦效率低,在某種程度上是對的。在朋友圈獲得優質資訊的效率取決於你的朋友質量,有精彩朋友才有精彩資訊,如果都是曬海灘的當然沒意思。頭條不受社交關係限制,對於缺乏豐富社交層次的人來說,獲得資訊效率高。可是缺少社交屬性和社交關係的積累也是頭條的軟肋所在。

騰訊目前正在低調執行“天天快報”,與微信平臺以及騰訊媒體開放平臺分開,未來未必不會整合。那樣就可以結合社交推薦和演算法推薦,尤其可以利用朋友圈裡各種專業人士、學者點贊推薦或閱讀撰寫資訊的行為(只要他們願意公開)。帝國的反擊遲早要來,頭條們的演算法武士應該儘早打造具有熵增能力的資訊關係,並發展一種把“興趣”人格化的演算法社交方式。

演算法需要人,這話不止是說需要社交關係,而是策劃者的想象力。我見過有人圍繞豆瓣上的影片打分,手工收集打分者讀書資料,非常有趣。比如給電影《勝利大閱兵》五星的人喜歡看什麼書,給一星的人又看什麼書。在這個基礎上,如果加以聰明的演算法,就可以激發出新型社交模式,不過這裡不展開。

藍媒彙報告稱頭條購買了不少媒體的股份,比如世界說、新榜、華爾街見聞等等。從演算法的邏輯講,我以為這不是最優的收購方向。在我看,與那些擁有社交資料的媒體比如微博合作才是對的。頭條們應該收購豆瓣。不是說要做社交,而是要擁有社交資料並利用演算法啟用之。豆瓣之類集聚的人之想象力,為什麼不能和機器演算法互相滋養?

何妨先做智庫?

這些技術起家的公司已聘請資深媒體人加盟,頭條請了林楚方,一點資訊請了吳晨光,都是媒體圈很有名氣的主編級人物。不過媒體人目前的作用主要是公關,撬動自己掌握的豐富媒體資源,或者利用自己的表達能力替不善言辭的技術人表述產品。

我覺得,如果媒體靈魂和演算法的結合暫時困難的話,何方先做智庫?眼下官方對智庫建設青睞有加,頭條們的資料再加一點媒體眼光,就可提供很多技術落後智庫無法提供的報告。

這需要人的想象力。比如最近帝吧遠征臉書,舉國震驚,也引發了很多評論。無論各方如何評價,這都是90後乃至00後網路新人的一次亮相。各方都不太瞭解他們,商業公司需要了解他們,政府機構也需要了解他們。眾說紛紜,很多是從主觀偏見出發。

想了解他們有很多辦法,比如去採訪他們,去貼吧收集材料做統計。但百度或者頭條們顯然可以有更快捷的智慧辦法,能夠通過相關評論資訊的閱讀和其他關聯資料,來考察相關人群的特點,他們的地域分佈,他們的收入狀況,他們的興趣愛好。

在9月大閱兵期間,范瑋琪因為在微博曬娃遭到大量謾罵,有人批評罵人者是民粹,是買不起好產品的loser。但是學者鄒振東通過大資料分析發現他們的組成和其他群體類似,iPhone使用率很高,顛覆了主觀判斷者的意見。並最終發現是微博的演算法推薦導致范瑋琪和讀者的意外碰撞。

這些命題需要有人想到,才能動用演算法去做。而人的因素不像演算法可以總結成可複製的標準演算法。

洞察並善用人的智慧,發揮人群的博弈,而不是讓個人成為資訊餵食物件,才會讓演算法也變得更有靈氣。今日頭條、一點資訊和天天快報,哪一家會走得更遠?

也許演算法匹諾曹正在高歌那首神曲:張士超,你到底把我的鑰匙放在哪裡了?!

本文為作者餘亮獨家原創內容,已授權雪晴資料網發表。作者是數學系出身,文化研究者,感興趣的同學可以關注他的個人專欄http://www.guancha.cn/YuLiang/list_1.shtml。轉載本文需經作者同意,並註明連結http://www.xueqing.cc/cms/article/120

相關文章