臨別給《生活大爆炸》做個臺詞資料分析,你猜謝耳朵最愛說什麼?
大資料文摘出品
作者:張弛、王奇文、蔣寶尚
2019年5月1日,美劇《生活大爆炸》最後一集正式宣佈殺青,於北京時間5月17日早8點播出,時長達一個小時。這部陪伴觀眾成長了12年的美劇,已與全球觀眾告別。
如果說《老友記》是上一代的美劇青春,那《生活大爆炸》無疑是今天90後這一代人精神版圖中不可或缺的部分。
12年對全球觀眾意味著多久?中學6年,大學4年,畢業2年,從懵懂到成熟,整個青春時代……
這12年,劇中角色遇到了各自的真愛,經歷了各自的得失,我們也畢業、告別、成家、生子。
劇中人物各具特色,在他們身上,我們或多或少能夠看到自己的影子。文摘菌作為多年美劇《生活大爆炸》的粉絲,拋開情感不談,在看完生活大爆炸最後一集,我開始納悶,到底誰是《生活大爆炸》的主角?
是雖然高智商天才但是個偏執狂謝爾頓?還是感情豐富卻優柔寡斷的萊納德?又或者是一向被稱為“媽媽的好孩子”卻好色的霍華德?還是表面害羞客觀,內心花花公子的拉傑什?
一千個讀者心中有一千個哈姆雷特,每個人對於誰是主角都有不同的答案,但是文摘菌利用資料分析出,到底誰是《生活大爆炸》中的C位。
為了確定這個問題的答案,文摘菌從GitHub中下載了《生活大爆炸》九季的劇情,並且用不同的引數來找出誰是最突出的。
整個分析是使用Python完成的,資料集本身已經被處理的很好,每個場景以及每個人的對白都已經被提取了出來,並以json檔案儲存。文摘菌將檔案轉換成結構資料的過程中省了不少力氣。
資料集地址:
https://github.com/skashyap7/TBBTCorpus
資料分析部分程式碼地址:
https://github.com/wqw547243068/Python-learning/blob/master/courses/chapter_3/big_bang_theory.ipynb?tdsourcetag=s_pcqq_aiomsg
謝耳朵助攻女友躋身主角
首先,看看每個人的臺詞。因為無法得到每個角色在螢幕中實際出現的時間,所以每個人的臺詞量可以作為一個合理的估算標準,所以究竟是哪位的臺詞最多呢。
謝爾頓十多萬的臺詞數目排在第一位,而萊納德雖然排在了第二位,但是和謝爾頓相差一倍。卡蕾·措科飾演的Penny作為唯一的女主角當仁不讓的超過了霍華德和拉傑什排在了第三位。Amy出現在電視劇中第三季最後一集,雖然只是霍華德通過婚介網偷偷幫謝爾頓找的女朋友,但是作為第四季以及之後的班底人物,妥妥的躋身女主角行列。
演員們說了這麼多臺詞,那麼什麼是他們口中最經常出現的臺詞呢?
經過分析,選出了出現頻率為top30的詞彙,去掉The、to、a、of等停用詞,發現幾“I”和“you”在每位主角的臺詞中出現頻率最高,這也符合本劇的設定,因為大多數笑點包袱是通過對話抖出來的。
除此之外,萊納德喜歡說Know、Penny喜歡說oh~謝爾頓喜歡也喜歡說Know,值得一提的是,在9季電視劇中,他叫了萊納德657次。作為謝爾頓的女友,Amy當然叫謝爾頓的次數最多啦~足足有266次。另外,霍華德和拉傑什喊的臺詞最多也是know。
有了“I”和“you”出現的次數,完全可以假定當“I”出現的時候,角色必然會出現在熒幕上,這在一定程度上能夠反映導演給的鏡頭數量~
資料結果非常有趣,謝爾頓仍然是冠軍,其他排名和臺詞數量保持一致,值得注意的是,萊納德和Penny鏡頭相差無幾,霍華德和拉傑什的鏡頭數量相差不多,而作為後登場的Amy顯然不如她的幾位“前輩”。
那麼,考慮全部的臺詞,各位主角的名字出現了多少次呢?顯然,這也是非常能夠體現各位主角地位的地方。
顯然,分析結果和上面的稍微 不一樣,拉傑什稍遜Amy一籌,畢竟作為謝爾頓的女友,臺詞之王給予的助攻是不可忽略的。
謝爾頓多榜第一霸佔C位
謝爾頓多榜第一霸佔C位
來,快速回顧一下。
謝爾頓的臺詞數量最多,超過第二名將近一倍。單詞數量的情況與臺詞量類似。
謝爾頓在銀幕上的出場次數最多,萊納德和Penny鏡頭相差無幾,霍華德和拉傑什的鏡頭數量相差不多。
謝爾頓這個名字在劇情中也是出現最多的,有趣的是。他叫了萊納德的名字657次。
綜合考慮,謝爾頓是生活大爆炸中當之無愧的主角,無論是臺詞數目,還是鏡頭以及名字出現的次數都是冠軍,作為後出場的Amy,導演在後幾季的時候也給與了充分的戲份。
大家都是公寓控
做《生活大爆炸》的資料分析真的很有趣,除了分析誰是主角外,我發現了一些你可能會感興趣的其他事實。
整個電視劇發生的場景非常多,對白髮生最多的地方當屬他們的公寓,其次是餐廳,對白髮生在房間的比例也達到了4.45%。
那麼,各位主角最喜歡在哪個場景發表看法呢?
從上面的熱力圖可以看出,大家都是公寓控。而謝爾頓先生無論是在床上,房間、餐廳、汽車都妥妥的比其他演員的臺詞要多。另外,可以看出整體的臺詞分佈,基本符合場景安排,沒有哪個角色鍾愛哪個場景。
公寓是對白髮生最多的地方,我們來瞧瞧有沒有屬於角色的專屬詞彙!
在公寓,謝耳朵愛說oh以及my
萊納德:What?
penny:oh~
霍華德:my、do、me
Raj:my、me、was
Amy:謝耳朵!
電影中的出場人物除了這幾位主角之外,其他角色也有比較多的戲份,文摘菌粗略統計了一下,發現2009年在第三季的客串角色Bernadette臺詞佔比也有接近5% 。作為劇中三號人物霍華德的女友,臺詞數量雖然比不上一號人物的女朋友,但是也相差確實不多。
作為藝術學校出身,其實在剛開始出場時也是看起來慫一點的Stuart也有不少戲份,但總歸不是主角,臺詞佔比只有1.23%。
最後,用開頭那張合照做了整體臺詞的詞雲視覺化,算是對這部陪伴了我們12年的美劇的一個告別吧~
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31562039/viewspace-2645202/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 特別的程式,給你最愛的人
- 說說你做過讓你覺得最滿意的專案是什麼?為什麼?
- 為什麼說房企正面臨至暗時刻,而恆大隻是個開始?用資料給你答案
- 做資料分析究竟要學哪些計算機知識?全都給你梳理好了,拿走不謝計算機
- EXCEL做資料分析最難邁過的坎,你遇過多少個?Excel
- 為什麼使用Python做資料分析?Python
- 來,我們把玩一下謝耳朵最喜歡的珠子
- 你還敢說不會做資料分析?做程式設計師必須掌握的資料分析思維!程式設計師
- 給你5個億,你怎麼做廣告投放?
- 感謝你給我推薦這個websiteWeb
- EXCEL做資料分析的坎,你遇過多少個?Excel
- 謝謝你,龍應臺女士
- Python培訓分享:如何做資料分析,資料分析流程是什麼?Python
- 為什麼說不要去銀行做軟體開發,而要去做資料分析?
- 做財務資料分析的話,哪個大資料分析平臺更擅長?大資料
- 走好資料中臺最後一公里,為什麼說資料服務 API 是資料中臺的標配?API
- 為什麼說,整個SaaS行業都應該感謝“寒冬”?行業
- 大資料的發展,給我們生活帶來了什麼影響?大資料
- 資料探勘與資料分析的主要區別是什麼
- 大資料分析平臺的目的是什麼大資料
- 大資料分析平臺究竟是什麼大資料
- 大資料分析平臺的作用有什麼大資料
- 為什麼說集中管理資料是個壞主意?
- 拿到一個待檢測的站或給你一個網站,你覺得應該先做什麼?網站
- 為什麼說資料服務是資料中臺的標配?
- 九個方面告訴你,一個合格的資料分析師,到底要什麼能力?
- 用 Java 做個“你畫手機猜”的小遊戲Java遊戲
- 開源demo| 你畫我猜——讓你的生活更有趣
- 為什麼學習大資料,大資料專家寫給大資料分析學習者的10個理由大資料
- 能說會道愛辦公——“別人家的”Chrome外掛到底怎麼做Chrome
- 資料分析報表怎麼做
- 資料分析常用的 23 個 Pandas 程式碼,收好不謝
- 別說眼科醫生不做近視鐳射手術,眼科醫生做給你看
- 為什麼說資料庫是Serverless最難攻堅的堡壘?資料庫Server
- 搭建一個強大的資料平臺,讓你的資料分析事半功倍!
- 說說這半年做的一個專案,並分享給各位
- 什麼是大資料?大資料開發是做什麼的?大資料
- 什麼是資料運營?資料運營是做什麼的?