一、準備歌詞素材

歌詞選擇:杰倫至今的所有專輯(從最開始的<JAY>到最新的<周杰倫的床邊故事>)

由於爬蟲木有學會,就只能手動收集歌詞。經過一系列的 google、baidu,終於找到別人整理好的歌詞全集。ok,就這樣歌詞檔案搞定了,一共也沒多大,也就207K(想想周董這麼多年唱的歌詞大半都在這207K的txt檔案裡就不免有些感慨)。

二、對歌詞檔案完成分詞

這是最難的部分,產品汪只會跟程式猿們相愛相殺,哪會寫程式碼呀!!!

沒辦法,硬著頭皮也要寫。網上goolge各種關鍵字,看部落格,花了半天的時間,連蒙帶猜,勉勉強強看懂了網上的程式碼示例,比著葫蘆畫瓢寫了一點點寫。

千難萬險,終於寫完調通,最終主要的部分一共也就12行,沒有任何註釋(簡直乞丐版程式碼,根本看不出來哪裡sexy ~~~~(>_<)~~~~)


三、對分詞的結果進行分析

好,我們終於到了正文,以上都是廢話,下邊才是重要結論。(如果以這種方式寫郵件一定會被老闆打死 ♪(^∇^*) )

結論一:杰倫最喜歡的唱的主題 — 情歌 (我自己也知道這是廢話 O(∩_∩)O)

拉了下出現頻率 top20 的詞語,滿滿的都是文藝、傷感、愛情 :

我們 / 怎麼 / 沒有 / 微笑 / 離開 / 愛情 / 回憶 / 不要 / 開始 / 如果 / 怎麼 / 開始

我擦,感覺隨機排列組合都能成歌詞,方文山以後是不是就可以下崗了 ♪(^∇^*)

結論二:杰倫喜歡媽媽勝過爸爸,喜歡外婆勝過爺爺以及外公(歌詞中沒有出現奶奶)

大家應該都聽過<聽媽媽的話>。

杰倫專門為外婆寫了一首歌<外婆>,其中也就1句歌詞提到了外公。

至於爺爺,杰倫也有那首<爺爺泡的茶>

結論三:杰倫喜歡黑色、白色勝過其他顏色

很符合周董的形象,歌詞裡高大上的黑色&白色力壓其他顏色。看到黑白兩色頻率這麼高,我第一時間想到的是<以父之名>,感覺很符合那個氣質。還有就是青色出現了6次,大概率是因為<青花瓷>吧。

結論四:杰倫最喜歡的語氣詞是 oh~

毋庸置疑,杰倫最喜歡 oh~ ,排除大小寫的因素,[oh] 出現的頻率甚至超過 [我們] 成為出現詞頻最高的詞彙。此外杰倫經典的 “哎呦不錯哦~” 中的 [哎呦] 也名列前茅,看來杰倫真的很喜歡講這句話。

總結:

只是從歌詞來看,大概杰倫就是一個穿著黑白帽衫,表面上酷酷的,但是骨子裡滿是深情、文藝, 只喜歡喝爺爺泡的茶,聽媽媽的話,愛自己外婆的 ,嘴裡時不時地冒出一句‘哎呦,不錯哦’ 的 五好青年 ^_^

以上內容純屬胡說八道,如有雷同,純屬巧合。

本文作者張冬鑫,原文載於作者知乎專欄。