Python分析42年高考資料,告訴你高考為什麼這麼難?

xulinlucas發表於2019-06-10


Python分析42年高考資料,告訴你高考為什麼這麼難?

大資料文摘授權轉載自資料森麟

作者:徐麟


對於已經工作的“上班族”來說,6月7號到9號三天無疑是興奮到飛起的,終於迎來了令人愉悅的端午假期。

Python分析42年高考資料,告訴你高考為什麼這麼難?


然而有那麼一群人,將在端午節日之際迎來人生特別重要的一次經歷或者說是挑戰,那就是高考生們。高考的重要性無須贅述,今天我們就來聊聊那些年我們一起經歷的高考。

歷年錄取率

可能很多經歷過高考的人都不知道高考的全稱,高考實際上是普通高等學校招生全國統一考試的簡稱。從1977年國家恢復高考制度至今,高考經歷了許多的改革,其中最為顯著的變化就是錄取率的顯著提升,曾經的“千軍萬馬過獨木橋”的場景得到了一定程度的緩解。

我們首先看下1977-2018年曆年的錄取人數和未錄取(落榜)人數變化情況,本文資料均來自於網路公開高考資料:

Python分析42年高考資料,告訴你高考為什麼這麼難?

可以看到1977年恢復高考之後的幾年,由於種種原因,高考人數到達了一個比較高的點,隨後有所下降。到2000年之後,高考的人數有了進一步的提升,錄取人數也隨之大幅提升,2008、2009達到了頂峰,2010年之後參與高考的人數趨於平穩。

透過上圖也可以發現,早期的高考難度之高,未錄取人數是錄取人數的數倍之多,而且早期的高考實際上在開始之前有預選的過程,能夠參加高考的考生實際上已經經過了一輪大浪淘沙的過程。隨著教育改革,越來越多的考生有機會透過高考接受更進一步的教育。

我們透過下面的百分比圖,對於錄取率的變化進一步加深認知:

Python分析42年高考資料,告訴你高考為什麼這麼難?

部分程式碼如下:

setwd('D:/爬蟲/高考')
data = read_excel('歷年錄取率.xlsx')
data_year = melt(data,id.vars = '年份',measure.vars = c('錄取','未錄取'),
variable.name='錄取情況', value.name='人數(萬)')
ggplot(data_year,aes(x=年份,y=`人數(萬)`,fill=錄取情況))+
      geom_area(position = 'stack')+
      ggtitle('歷年高考人數統計(1977-2018)')+ theme_wsj()+ 
      theme(axis.text.x = element_text(size=15),
            axis.text.y = element_text(size=15),
            axis.title =element_text(size=15),
            plot.title = element_text(hjust=0.5,size=25,face='bold'),
            panel.grid = element_blank(),
            legend.position = 'top',
            legend.title = element_blank(),
            legend.text = element_text(size=15),
            panel.background = element_blank(),
            axis.line = element_blank(),
            axis.ticks = element_blank()
            )+xlim(1977,2018)

說到這,似乎大家會認為現在的高考並不困難,錄取率已經到達了8成左右,透過高考已經成了家常便飯,如果你真的這樣認為,那隻能將下面的表情包送你:

Python分析42年高考資料,告訴你高考為什麼這麼難?

橫亙在高考生面前的三座大山

名校錄取率

前面我們提到的錄取率有了顯著的提升,然而錄取率實際上是包括了所有的錄取情況,同時包含了本科以及專科的錄取情況。真正的“211”,“985”名校的競爭實際上還是異常激烈的,特別是在一些處於“地獄模式”的高考省份(由於沒有在網上找到海南省的相關資料,我們選取了其他三十個省份、直轄市的資料。

下面就為大家對比各個省份2018年的985、211錄取率:

Python分析42年高考資料,告訴你高考為什麼這麼難?


Python分析42年高考資料,告訴你高考為什麼這麼難?

可以看到,不同省份的985和211錄取率有著比較明顯的差距,12個省份的985錄取率低於1.5%,安徽,河南,江蘇和貴州更是低於1.2%,作為山東考生的作者也不由得表示“自愧不如”。

即使是錄取率最高的省份,985和211的錄取率也只是5.8%和13.9%,結合現在各大企業在招人要求中對985和211的要求,高考真的並沒有真的變得簡單。

高考人數

除了名校錄取率低之外,高考人數之多也是橫亙在考生面前需要跨過的一個挑戰。由於參與高考人數非常多,對於考試精細度就有了非常高的要求,可能一個細節的失誤就會在全省的排名中下降非常多。

同樣,我們看下各省2018年參與高考的人數:

Python分析42年高考資料,告訴你高考為什麼這麼難?

河南省2018年的高考人數達到了86.5萬,超過了不丹(80.7萬)整個國家的人口數量,86.5萬這個資料也超過了世界上很多的國家人口數量。廣東、山東、四川三個省的高考人數也超過了50萬。由於參與高考的人數眾多,這些省的高考幾乎都是“肉搏戰”。

高考題目難

除了名校錄取率低,競爭人數多,另一個讓廣大考生為之“折服”的就是那些難度大到放飛自我的題目。其中一個省份的題目難度幾乎是所有考生公認的最高,那就是江蘇省,包括小編所在山東省在內的很多其他省的老師,都會告訴學生不需要關注江蘇的歷年題目,因為本省的考試題目不會那麼難。

除了題目難度大,江蘇高考改革的力度和速度也是冠絕全國,我們整理了一份江蘇省2000年以來的歷年高考改革的路線圖:

Python分析42年高考資料,告訴你高考為什麼這麼難?

看到這些模式的名稱,可能大家已經有些眩暈,也深切體會到能從江蘇高考中殺出重圍的都是勇士。既然已經眩暈,不如就眩暈到底,下面是一道江蘇省高考的真題,自行體驗難度:

Python分析42年高考資料,告訴你高考為什麼這麼難?

數學、物理這種大殺器都無需出場,只需一道作文題在作者這種“語文天殘”看來就已經slay全場。

高考“殺器”

前面我們說了那麼多高考的困難之處,是不是考生們真的就手足無措了呢,實際上並不是,只需要手握一些高考專屬“殺器”就可以迎刃而解(以上純屬虛構)

五年高考三年模擬

此殺器的使用方法無需贅述,只需把其全部吃透,雖然這也不表示高考就一定會有好成績。希望各位考生努力複習,切勿如同書名一樣“五年高考,三年模擬”。

Python分析42年高考資料,告訴你高考為什麼這麼難?


葛老師

葛老師乃高考中的超級大殺器,其威力可以參考下圖,正所謂人不在江湖,但江湖上始終流傳著他的傳說:

Python分析42年高考資料,告訴你高考為什麼這麼難?

由於葛老師過於強大,切勿幻想能將葛老師像“五年高考、三年模擬“那樣吃透之後融會貫通,最好的方法就是“走為上計”,B站上的廣大考生已經開始透過彈幕進行了實踐:

Python分析42年高考資料,告訴你高考為什麼這麼難?

寫在最後

雖然我們前面列舉了高考那麼多的不易,但高考實際上為廣大考生提供了改變自己人未來人生命運的機會。相較於其他很多縹緲不定的發展道路,高考給了大家一個明確的努力方向。

最後祝願廣大考生都能夠放平心態(雖然並不現實),在高考中發揮自己所學,不留遺憾。取得不錯的結果也不要因此沾沾自喜,沒有達到自己的預期的也不要因此消沉,高考是我們人生中非常重要的一段歷程,但不能完全決定我們未來的人生,未來還有很多需要去奮鬥、去努力的地方。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31555699/viewspace-2647206/,如需轉載,請註明出處,否則將追究法律責任。

相關文章