資料分析奧斯卡女神們,誰是你心中的No.1?
作者 | 徐麟
轉載自資料森麟(公眾號 ID:shujusenlin)
前言
在開始今天的正文前,首先帶來一首經典的由奧黛麗·赫本演唱的《Moon River》,也是電影《蒂凡尼的早餐》中的主題曲。
一年一度的奧斯卡獎於上月落下了帷幕,截止到今年,奧斯卡已經走過了91年的歷程。奧斯卡獎在為我們帶來一次又一次的視覺盛宴同時,也為我們提供了更進一步瞭解活躍在影壇的女神們的機會。
女神節將至,我們首先主要祝願廣大的女性同胞美麗永駐。同時我們來為大家盤點一下那些在奧斯卡閃耀過的女神們,她們“驚豔了時光,溫柔了歲月”,帶給喜愛她們的人們一段段美好的回憶。
資料來源
要先感謝小F(Python大本營作者)之前的一篇文章( 奧斯卡,究竟誰一直在陪跑 )的啟發,讓我們找到了能夠全面地獲取女神們奧斯卡相關資料網站 - 時光網,首先我們獲取的是時光網上歷屆奧斯卡最佳女主角的入圍及獲獎資訊,我們從中確定了此次數說的女神們:
獲得了歷屆獲獎以及提名名單後,我們就要進入女神們的主頁:
女神們的主頁資訊還是很豐富的,主要是兩個部分(a)上圖左下角女神們的身高,星座以及出生年份 (b)上圖中間網友對女神的喜愛度評分。有了這兩部分的資訊,我們就可以開始在後面的部分對女神們進行一系列的分析了。
部分的爬取程式碼如下:
driver = webdriver.Chrome()
driver.maximize_window()
driver.close()
driver.switch_to_window(driver.window_handles[0])
for i in range(queens_name.shape[0]):
url = queens_name['profile'][i]
js='window.open("'+url+'")'
driver.execute_script(js)
driver.close()
driver.switch_to_window(driver.window_handles[0])
try:
queens_name['photo'][i] = driver.find_element_by_xpath('//*[@id="personDetailRegion"]/div[1]/span/a').get_attribute('href')
queens_name['height_star'][i] = driver.find_element_by_xpath('//*[@id="personDetailRegion"]/dl[1]').text
queens_name['born_home'][i] = driver.find_element_by_xpath('//*[@id="personDetailRegion"]/dl[2]').text
queens_name['count_score'][i] = driver.find_element_by_xpath('//*[@id="personRating"]/div[2]').text
except:
err_list=err_list+[i]
數說女神 -- 歡迎度
在開始數說女神與奧斯卡直接的故事前,我們先來看一下女神在大家心中的受歡迎程度,主要看的就是時光網上女神的喜愛度和投票人數兩項指標:
奧黛麗·赫本在榜單中的位置體現了她在觀眾心中無可替代的地位,赫本年輕時用出眾的容貌和演技一次次在電影中驚豔這個世界,隨著歲月的流逝,她選擇了優雅地老去,致力於慈善事業,用一顆善良的心帶給這個世界一份溫柔。
費雯·麗在榜單中僅次於赫本,塑造的郝思嘉這一經典形象也是影響了一代又一代的觀眾。同時在榜單中我們也看到了娜塔莉·波特曼和凱特·溫斯萊特這些年輕觀眾更為熟知的女神身影。
數說女神 -- 關注度
下面我們要看的就是女神們的受關注度,主要看的是有多少人在網站中為女神們進行評價:
這份榜單,相對於之前的受歡迎度,可能出場的女神更為被年輕觀眾所熟知。同時在兩份榜單中出現的只有奧黛麗·赫本和凱特·溫斯萊特,她們也分別代表著經典和現代。
值得一提的是,榜單中排名前四的女神們,目前只有娜塔莉·波特曼染指過最佳女主角的獎項。其它三位高人氣女神海瑟薇、朱莉和奈特莉,我們希望她們能夠在未來拍出更多經典的作品,捧起奧斯卡最佳女主角的小金人獎盃。
數說女神 -- 提名&獲獎
看完了女神的受歡迎度和關注度,我們來看一個大家都會比較關注的問題,那就是究竟哪位女神最受奧斯卡獎的青睞,獲得最多次的奧斯卡最佳女主角獎:
可以看到凱瑟琳·赫本以四次獲獎的成績在這個榜單中獨佔鰲頭,說起赫本,可能奧黛麗·赫本的名字要更加熟悉一些,但實際上,在奧斯卡獎的認可度方面,凱瑟琳·赫本要更勝一籌。同時也看到了有13位女神兩次獲得奧斯卡獎最佳女主角,其中就有大名鼎鼎的費雯·麗、希拉蕊·斯萬克以及 “奧斯卡常青樹“ 梅麗爾·斯特里普。
只要是和獎項相關的,就總是會“幾家歡喜幾家愁”,下面我們就來看一下各位女神入圍最佳女主角獎的次數:
梅麗爾斯·特里普以17次入圍的表現毫無爭議地在這項對比中遙遙領先,更加值得注意的是,這項資料可能在未來被繼續重新整理,我們也拭目以待。通過這份資料,我們也可以感受到獎項競爭的激烈情況,奧黛麗·赫本和葛利亞·嘉遜這種世界巨星也僅僅分在在5次和7次入圍中有1次的獲獎記錄。
同時我們也看到黛博拉·寇兒和艾琳·鄧恩分別入圍6次和5次最佳女主角,最終都與獎項無緣,我們一方面可能會感覺評委會有些不近人情,另一方面也更加體現出了獎項的含金量。
數說女神 -- 年齡
有人說“年齡是女人的祕密”,但是對於女神們來說,年齡只是一個符號。真正的女神會在不同的年齡去散發不同的光芒,每一束光芒都足以照亮這個世界。首先看一下那些入圍時較為年長的女神:
可以看到在這些女神面前,年齡真的只是一個標記,無礙她們散發自己的光芒。朱迪·丹奇更是在自己 72、73、80 歲的時候三次入圍最佳女主角的提名。在10次最年長的提名中,傑西卡·坦迪和凱瑟琳·赫本分別在自己 81、75歲的時候最終摘得桂冠。
我們同時也來看一下,那些年少成名,入圍時最為年輕的女神們:
有兩位都是在自己15歲前就入圍最佳女主角的提名,想想大家的 15 歲,真的是要驚歎於她們把握機遇的能力。在10次最年輕的入圍提名中,只有瑪麗·瑪特琳在1987年最終贏得桂冠,也成為了迄今為止最年輕的影后。
我們看一下各個年份入圍者的平均年齡:
大家可以會從中看到一些有趣的事情,我們就加上一條線性擬合的趨勢線來讓大家更清晰地去解讀這些資料:
這條趨勢線是可以通過我們的線性檢驗,也說明了奧斯卡愈發的看重演員的資歷,年齡真的越來越成為了一種符號,真正的女神就是可以在不同的年齡都展現屬於自己的光芒。
數說女神 -- 身高
”年齡不是問題,身高也不是差距“。下面我們就來說說身高,有些人會比較武斷地對女神的標準身高下一些定義,然而通過我們的資料分析,會發現女神們的身高實際上是很多元化的。利用好自己身材上的優勢,展現出屬於自己的魅力,才是最為重要的。
首先看一下身材高挑的女神們:
女神中不乏有許多超過180cm的模特身材,身高其實真的並不能代表所有。榜單中排名前茅的妮可·基德曼身高180cm,然而其前夫湯姆·克魯斯身高僅僅是173cm,雖然現在已是勞燕分飛,但也不失為一段佳話。
特別值得一提的是榜單中的裴淳華是《消失的愛人》女主角羅莎曼德·派克為自己起的中文名,未來也希望越來越多的女神們為自己起上一個好聽的中文名。下面我們來看一下那些身材嬌小的女神們:
榜單中出現了許多熟悉的身影,比如伊麗莎白·泰勒、朱迪·福斯特 ,她們的身高都沒有超過160cm,但並不妨礙她們成為大家記憶中永恆的女神。
下面我們仿照之前的入圍年齡分析,看一下歷年入圍的影后平均身高:
可以看到整體趨勢與入圍的年齡整體上漲趨勢有所不同,所呈現的趨勢更像是一個拋物線,我們不妨進行一下二次項擬合:
這條曲線也通過了引數的顯著性檢驗,我們可以看到在1980、90年代的入圍名單中,身高趨勢線達到了一個峰值,之後有所下降。我們結合著不同時期出生的女神身高情況來進行對比:
1950-1970之間出生的女神身高確實相對比較高,這樣可以解釋了上面入圍者身高趨勢的變化情況。我們也希望通過這部分的分析讓大家能夠儘量不要那麼去看重一個人的身高,女神們的成功也證明了成功與否與身高無關。
數說女神 -- 遺珠
縱使我們將奧斯卡最佳女主角所有的提名者放在一起,也會發現有很多留給我們經典回憶的女神們,並沒有出現在榜單。下面我們就選取了部分未被提名過的女神們,為大家列出:
名單中有許多我們耳熟能詳的女神名字,比如蘇菲·瑪索、瑪麗蓮·夢露以及在《肖申克的救贖》中海報中出現的麗塔·海華絲。希望未來奧斯卡能夠讓更多的女神們得以入圍。
部分分析程式碼如下:
k <- lm(age~year,data = reward)
reward$smooth_age <- predict(k,year = reward$year)
ggplot(reward,aes(x=year))+geom_line(aes(y=age),size=1.5)+
theme_bw()+
ggtitle('各年度入圍者平均年齡')+
theme(axis.text.x = element_text(size=18),
axis.text.y = element_text(size=18),
plot.title = element_text(hjust=0.5,size=35,face='bold'),
panel.grid = element_blank(),
legend.position = 'none',
axis.title = element_text(size=25)
)+geom_line(aes(y=smooth_age),col='darkblue',size=1.5)
結語
盤點完這些“驚豔了時光,溫柔的歲月”的女神們,我們不妨靜下心來,花上一點時間,找個安靜的地方,選上一部電影佳作。靜靜地品味女神們為我們塑造過的經典角色。
本文的完整程式碼:
https://github.com/shujusenlin/oscar
歡迎大家留言與我們一起聊聊你心中的女神~
(本文為 AI科技大本營轉載文章,轉載請聯絡原作者)
◆
徵稿
◆
推薦閱讀:
❤點選“閱讀原文”,檢視歷史精彩文章。
相關文章
- 2023遊鼎獎提名揭曉:誰是你心中的年度最佳?
- Python資料分析庫之pandas,你該這麼學!No.1Python
- 有獎投票啦,誰是你心中的最佳!大波獎品等你拿~
- 他們是誰?
- 沙特門將是誰?沙烏地阿拉伯封神門將奧韋斯生涯資料身價簡介
- 做BI智慧資料分析,奧威BI系統是專業的
- 數讀奧運!我用資料分析帶你瞭解120年奧運史
- 2014-2021年Netflix出品作品獲得奧斯卡提名數量(附原資料表)
- 投票|選出你心中最優秀的時序資料庫資料庫
- 新 金 寶 廳 17176934555奧斯你就沒
- 迪斯卡(Disrupt DEX)礦池系統開發/資料分析/技術應用
- 故障分析 | 是誰偷走了我的 IO
- 《形骸騎士》入圍indie prize 角逐獨立遊戲奧斯卡遊戲
- 2020年奧斯卡收看人次為2360萬 創歷史新低
- 是誰點燃了人們居家健身的熱情?
- 2019資料庫趨勢研究:誰是最受青睞的資料庫?資料庫
- 誰是真正的洩密者(附原資料表)
- 資料庫同步你們用啥資料庫
- 資料分析過程六步曲—誰說菜鳥不會資料分析
- CIO們眼中的資料治理是怎樣的?
- 資料分析中最缺少的是資料探索工具?
- CAS原理分析:併發程式設計核心中的核心你瞭解多少?程式設計
- 資料湖是誰?那資料倉儲又算什麼?
- 帶你深入瞭解什麼是商業資料分析
- 千萬資訊洩漏,是誰在偷遊戲玩家的資料?遊戲
- RFID之M1卡資料分析
- 什麼是資料分析中的“資料”? - Cassie Kozyrkov
- 我們如何使用CRM做資料分析?
- 人工智慧也能得“奧斯卡”獎?專家呼籲基礎研究人工智慧
- Unity實時渲染動畫《Windup》完整版溫情上線,獲奧斯卡參選資格Unity動畫
- 誰有賣銀行卡的
- 圖解:計算機資料結構中的 6 種「樹」,你心中有數了嗎?圖解計算機資料結構
- 阿里安全摘下AI視覺“奧斯卡”雙料冠軍 突破行為檢測技術瓶頸阿里AI視覺
- 工業資料分析之數倉建模 | 正規化建模和維度建模,你pick誰?
- 大資料分析過程是如何的大資料
- 奧林帕斯懸紅:攻克資料儲存世界級難題的詩與遠方
- 完整的資料分析是怎樣的流程
- 追蹤網賺遊戲:是誰割了你,而你又割了誰?遊戲