四萬字歌詞分析:那些年,我們一起追的五月天到底在唱什麼?
大資料文摘出品
作者:蔣寶尚、曹培信
你見過自帶熒光棒、中途大合唱、放完不離場的電影觀眾麼?
如果你去電影院看了《五月天人生無限公司》,那麼,你一定明白文摘菌在說什麼。
如果你還沒有看過,文摘菌這裡弱劇透一下,電影的情節是,呃——5位平均年齡超過四十歲的中年男人,靠唱歌打敗了怪獸。
這樣的狗血橋段,你一般會打幾分?然而就靠著這樣的劇情,華麗的演唱會真實畫面也讓五迷們把豆瓣的評分刷到了8.7!五星的超過一半,同時還有八千多條短評和兩百多條影評。(職業病,習慣性碼資料)
文摘菌看完之後也是果斷反手就是一個五星,好吧,攤牌了,文摘菌也是鐵桿五迷!
從1999年釋出第一張創作專輯,到2019年《五月天人生無限公司》收穫了大批眼淚尖叫,這五位大男孩不僅創造了華人搖滾樂團的奇蹟,也成為了無數人心目中的“青春”。
五月天也從此成為了一種文化的代名詞,不管是歌詞還是曲風,或者每一位樂隊成員,都有著自己濃濃的特色。
在五月天最新電影釋出的這個契機,文摘菌想用資料試著去分析一下這個不老的樂隊,看看這些年陪伴我們的這五月天,到底在唱些什麼?
資料介紹
資料介紹
首先,先來看看我們的資料。
從Github上,我們發現了林永佳先生在2017年做的一個五月天歌詞分析專案,他爬取了截止到2017年3月五月天所有的歌的歌詞,並且做了分詞和詞頻的詞雲。文摘菌在和他溝通後,在他的基礎上更新了資料集,一共107首歌。
當然,林永佳也用Python對歌詞做了初步的統計,包括詞頻、詞雲等,文摘菌在此基礎上進一步處理了資料,並做了資料視覺化以及情感分析。
此次資料分析經過了嚴謹的資料清洗,同一個詞彙如果在一首歌中出現多次,詞頻統計只計入一次。另外,刪除了“的”、“我”等停用詞。
資料集連結:
https://github.com/YogaLin/mayday_lyric_analyze
另外我們還從維基百科爬取了五月天演唱會的資訊。
https://zh.wikipedia.org/wiki/%E4%BA%94%E6%9C%88%E5%A4%A9%E6%BC%94%E5%94%B1%E6%9C%83%E5%88%97%E8%A1%A8#%E4%BA%BA%E7%94%9F%E7%84%A1%E9%99%90%E5%85%AC%E5%8F%B8%E4%B8%96%E7%95%8C%E5%B7%A1%E8%BF%B4%E6%BC%94%E5%94%B1%E6%9C%83_MAYDAY_LIFE_TOUR%EF%BC%882017%E5%B9%B4-2019%E5%B9%B4%EF%BC%89(122%E5%A0%B4)
陪我們的這些年,五月天都在唱什麼?
陪我們的這些年,五月天都在唱什麼?
作為紅遍大江南北的樂隊,五月天的歌曲,就像一首首寫在我們青春裡最動人的詩,不論是夢想還是愛情,總有一首能表達出你內心的情感。
從“你的世界,就讓你擁有,不打擾,是我的溫柔。”到“我和我最後的倔強,握緊雙手絕對不放。”五月天的歌詞中總藏著“愛”,可以愛溫柔也可以愛倔強。總是感嘆人生都太短暫,五月天的歌詞人生出現了接近30次,也就是說,107首歌中有30首歌提到了人生。地老天荒,人生最好時光,無論朋友還是親人都應該用心對待。
面對困難,正如歌中所唱“等一天/黑暗過去/苦盡甘來 ”。
所以,通過對歌詞的整體分析,以及世界、愛、人生、笑、心等作為最高頻出現在歌詞中的情況,我們可以給五月天的音樂定一個風格:積極向上、樂觀豁達、美好人生。
“雅”“俗”共賞
“雅”“俗”共賞
從意象方面來看,五月天歌曲選取的意象可以概括為自然類意象和人文類意象兩大類,歌詞“雅”的方面主要由自然類意象體現,“俗”的方面主要由人文類意象體現,其間也有例外情況。五月天歌詞中常見的自然意象主要有:天空、風雨、雲、彩虹、星星、太陽、夜等。
這些詞也是我國古典詩歌中出現頻率較高的意象,其中不少意象本身就非常有意境,比如風:“你是一種感覺/寫在夏夜晚風裡面”(《瘋狂世界》),“晚風吻盡/荷花葉”(《擁抱》)。這兩處寫到的都是“晚風”,除了透露出風這一意象本身帶有的不定、空靈的意境外。
又如星星:天上的星星,笑地上的人(《知足》);多幸運有你一起看星星在爭寵(《私奔到月球》) 。這兩處的星星所表達的都是同了一意境。
另外,天空、雲、彩虹、夜也是歌曲中出現了較多的次數,包含天空的歌曲數目為21、風雨為21、云為4、彩虹為5、夜為9、星星為8。
常見的人文類意象有:眼淚,笑,眼睛,孩子,夢,夢想、酒。在人文意象的運用下偏重指對世俗生活凡塵瑣事的關注,這類詞往往在“俗”的表象下滲透出對現實的反思有時甚至是諷刺。
例如:“鹹魚就算翻身/還是隻鹹魚”。在這首歌裡詞人並沒有著力營造詩意的美感,遣詞造句用的都是直白的口語,揭露著跟歌詞一樣直白的道理:你笑得像個孩子\每個平凡小事\變成永恆故事\世界紛紛擾擾喧喧鬧鬧\什麼是真實\為你跌跌撞撞傻傻笑笑\買一杯果汁,直白的用詞賦予了歌曲更直接的感染力。
類似的還有:孤單的大床 誰貼近我 臉龐\有沒有人 也笑憶過往\跌跌撞撞 當時的蠢樣\最平凡日子 最卑微夢想\何時才發現 最值得珍藏。
五月天歌詞情緒分析:有正面也有負面
五月天歌詞情緒分析:有正面也有負面
接下來,文摘菌開始了對歌名、歌詞的情緒分析,通過對這些歌詞的自然語言處理,我知道了不同歌手們吟唱的到底是開心還是不開心的事情。
情緒分析呼叫Bosonnlp中文語義分析介面,新手註冊每天有500次免費的分析機會。分析結果有兩個0和1之間的值,一個代表正面情緒值,另一個代表負面情緒值。兩個值加起來等於1。文摘菌把得到的正面情緒得分減掉0.5。這樣如果得分大於零就是正面情緒,如果小於零就是負面情緒。
先對歌名進行分析,如上所示,正面情緒的歌名佔大多數,其中《不見不散》得分最低為0.016正面度,而《最好的一天》正面度最高為0.998。
接下來是對歌詞內容進行情緒分析,發現歌詞和歌名的評分有出入,有些歌名是正面,但是歌詞的內容卻是負面。如:《孫悟空》《夜訪吸血鬼》等,這類作品所描寫的物件雖然是人們熟悉的人物,但是角度卻新穎。拿《孫悟空》來說,這個作品並沒有從我們對這兩個人物固有的理解角度出發,而是改變切入點寫出了英雄人物和平常人一樣在現實面前的無力和無奈,就算是英雄也有無能為力,就算是神仙也有難以改變的現實。
演唱會多香港,家家貢獻最多助陣
演唱會多香港,家家貢獻最多助陣
今年5月12日在香港迪士尼,五月天對演唱會的觀眾承諾,要為大家唱到80歲。從1999年到2019年,二十年的時間裡,五月天的足跡遍佈世界四大洲,七十多個城市。文摘菌爬取了五月天所有的演唱會資料,一共413場次,快來看看都有哪些好玩到結果吧!
從地理位置上來看,五月天在香港開演唱會的場次最多,其次就是臺北,但是近幾年在內地開演唱會也是越來越多了,2016年8月26、27、28日的世界巡迴演唱會北京站在鳥巢連開3場,30萬張門票完售,打破歌手在該場地開場的場次及觀賞人數紀錄。
另外,我們還統計了演唱會上助陣的嘉賓。
經統計,參加過五月天演唱會的歌手和樂隊嘉賓數量高達150!我們在這裡給大家列出了前八強。其中參加次數最多的是家家(臺灣女歌手),總計參加過五月天42場演唱會,文摘菌真是實名羨慕她!
“多聽五月天,必成好青年”
“多聽五月天,必成好青年”
75年出生的陳信巨集其實也已經是一個年過四十的中年了,但總有一種錯覺,他們都還只是一群20來歲在舞臺上盡情揮灑的少年!一路追他們的人,現在也都步入中年了,各自奮鬥在自己的工作崗位上,也許還遇到了事業的瓶頸,但是就像《倔強》裡唱的:“逆風的方向,更適合飛翔”。聽五月天的人,不會輕易認輸!
最後,我們依然以一個詞雲結束這篇文章。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31562039/viewspace-2646384/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- Python大佬分析了15萬歌詞,告訴你民謠歌手們到底在唱什麼Python
- 那些年我們一起追過的大佬
- 那些年我們一起追過的高深術語
- 那些年,我們一起追尋的非同步程式設計非同步程式設計
- 那些年,我們一起誤解過的RESTREST
- 那些年我們一起踩過的Dubbo坑
- 到底為什麼我們需要 Clickhouse?
- 我們到底為什麼要用 IoC 和 AOP
- “過時”的SpringMVC我們到底在用什麼?深入分析DispatchServlet原始碼SpringMVCServlet原始碼
- SQL Server DBA:那些年,我們一起用過的工具FASQLServer
- 我們常聽到的WAL到底是什麼
- AI時代,我們到底需要什麼樣的“大腦”AI
- 我們一起聊聊什麼是NAT協議協議
- Python:那些年我們遇到的坑Python
- 當我們說開放世界的時候,我們到底在說些什麼?
- 回溯演算法 | 追憶那些年曾難倒我們的八皇后問題演算法
- 那些年,我們一起做過的 Java 課後練習題(71 - 75)Java
- 那些年,我們一起做過的 Java 課後練習題(1 - 5)Java
- 使用Netty,我們到底在開發些什麼?Netty
- 當我們建立HashMap時,底層到底做了什麼?HashMap
- E3取消,我們到底失去了什麼?
- 現如今的技術浪潮中,我們到底該做些什麼?
- 我們的“防沉迷”一路走來,到底防了什麼?
- 純技術團隊創業,那些年我們一起走過的彎路創業
- 戀愛口語:我們到底要跟男人聊什麼?
- 當我們談論Spring的時候到底在談什麼Spring
- 我們常說的吉卜力風格到底是什麼?
- 我們在講的 Database Plus,到底能解決什麼樣的問題?Database
- 那些年,我們解析過的前端異常前端
- 那些年,我們看不懂的那些Kotlin標準函式Kotlin函式
- 為什麼他們還在用 iPod 聽歌?
- 那些年,我們處理過的SQL問題SQL
- 說一下那些年,我們遇到的404
- 今天我們來談談【畫素流送】到底是什麼?!
- 一起來看看Babel到底執行了什麼?Babel
- 2019年我們追過的jQuery,它的漏洞你知道嗎?jQuery
- 我們的口號是什麼?
- 讓我們一起啃演算法----字母異位詞分組演算法