破14億,Python分析我國存在哪些人口危機!
2020年1月17日,國家統計局釋出了2019年國民經濟報告,報告中指出我國人口突破14億。
豬哥的朋友圈被14億人口刷屏,但是很多人並沒有看到我國複雜的人口問題:老齡化、男女比例失衡、生育率下降、人口紅利下降等。
今天我們就來分析一下我們國家的人口資料吧!
一、背景
1.人口突破14億
2020年1月17日,國家統計局釋出了 2019年國民經濟報告 ,報告中指出:年末中國大陸總人口(包括31個省、自治區、直轄市和中國人民解放軍現役軍人,不包括香港、澳門特別行政區和臺灣省以及海外華僑人數)140005萬人。
也就是說2019年底我國人口突破14億!
報告連結:http://www.stats.gov.cn/tjsj/zxfb/202001/t20200117_1723383.html
2.人口普查年
根據2010年5月12日國務院第111次常務會議通過的《全國人口普查條例》第一章 第八條規定:人口普查每10年進行一次,尾數逢0的年份為普查年度,標準時點為普查年度的11月1日零時。
也就是說2020年11月將進行第七次人口普查,新中國成立後前六次人口普查分別為:1953、1964、1982、1990、2000、2010年。
ps:有些同學可能會有疑問:十年普查一次,那其他年份人口數怎麼得來?在非普查年,當年總人口=上年總人口+當年出生人口-當年死亡人口 而計算得出!
3.全面放開二胎
《中華人民共和國人口與計劃生育法修正案(草案)》明確規定,“全面兩孩”政策2016年元旦開始即可實施。全面實施一對夫婦可生育兩個孩子政策,是中國生育政策的一次歷史性調整,實行了36年的獨生子女政策全面終止。
二、分析目標
新中國成立70,經歷了許許多多的風風雨雨,政策、經濟、文化也有很多的變化,人口也隨之變化。
人口變化對社會經濟發展帶來巨大而深遠的影響,所以今天我們從多角度來分析我國人口變化:
- 人口總數
- 男女比
- 城鎮化
- 增長率
- 人口結構
三、爬取資料
關於我國人口的資料來源,可以從“國家資料”網站中獲取。這是一個由國家統計局提供的網站,裡面有很多國家公開的資料資訊!
1.請求單頁資料
在國家資料網站中,有從新中國成立到2018年的人口相關資料。
在人口資料中,有三項是我們需要的資料:總人口、增長率、人口結構。
我們按F12檢視一下請求的連結,然後複製連結使用requests
請求資料。
只使用一個簡單的get請求,就把資料獲取了,而且返回的直接是json資料!
2.分頁資料
我們此次的目的是抓取從新中國至今的所有人口資料,而頁面中最多可以獲取近20年的資料,所以我們需要分析網頁請求中關於分頁的引數。
分析請求引數豬哥發現主要有兩個引數:zb
、sj
,分別表示指標和時間。
引數:sj=LAST10,表示近10年,於是豬哥猜想:sj=LAST70 是不是就可以獲取70年的資料呢?
然後我們再將zb
引數更換,獲取到所有的資料!
3.儲存Excel
獲取到資料之後,我們先將資料清洗,提取出我們需要的資料,然後整理儲存到Excel中,資料處理方面我們仍然使用 潘大師(pandas)。
我們來看看儲存的excel檔案資料。
4.2019年資料
目前資料唯一的不完整就是沒有2019年的資料,因為2019年剛剛完結所以資料還沒有登記到網站上,我們只能自己算出來然後補齊。
豬哥根據2020年1月17日,國家統計局釋出了 2019年國民經濟報告中關於人口的資料得出了2019年的相關資料。
來看看完整的70年人口資料。
四、資料分析
資料儲存完畢後我們就可以開始資料分析步驟了,一般在我們資料分析之前我們需要有個思路:要分析什麼?從哪些角度分析?選擇何種視覺化圖形?得出了什麼結論?(當然實際工作時的分析報告需要更為嚴謹,但大體思路類似。)
1.總人口
首先我們提取Excel中的“年末總人口”這一列的資料進行分析。
直接上程式碼,豬哥先使用潘大師讀取Excel,然後再獲取總人口的列資料(完整程式碼請檢視原始碼)。
上面的程式碼和之前畫曲線有點不同的是:新增了自定義曲線背景色和區域色的功能,下次有同學想自定義pyecharts曲線背景就可以參考這裡的程式碼。
在下圖中豬哥標註了四個點:
- 1949年:新中國成立,總人口 5.42億
- 1980年:計劃生育正式開始,總人口 9.87億
- 2016年:全面放開二胎,總人口 13.83億
- 2019年:總人口 14億
通過觀察總人口曲線圖得知:
- 人口總體在增加,但增長曲線慢慢放緩,據社科院預測:中國人口將在2029年達到峰值14.42億,往後逐步下降
- 新中國成立至今(2020年)唯一出現人口減少的是1960和1961年,這兩年是我國的自然災害年。
- 根據總人口數,我們再來分析一下 執行計劃生育生育前31年與 後31年增長的人口分別是多少?
根據上圖我們可以看出:計劃生育確實控制了人口的增長!
而放開二胎後並未迎來生育高峰期,聯合國相關機構釋出的《世界人口展望》2017修訂版給出了類似的預期。它傾向於認定中國人口已經開始了倒V型反轉,在人口到達高峰後,2050年將會保持13億多,然後就會加速下滑(低、中、高三種生育率,來自聯合國人口基金)。
2.男女人口比例
我們經常會聽到別人說:“中國男女比例失衡,將有3000萬中國男性娶不到老婆”。
其實這是我國男女比例失衡造成的結果。
下面豬哥就從以下4個角度來分析我國男女比例的關係:
- 2019年男女比
- 男性佔總人口比例
- 男女人口數曲線
- 男女人口數差值
根據上面4圖我們可以得出一些結論:
- 新中國成立以來男性人口一直比女性人口多,可能與我國重男輕女思想有一定關係。
- 男性佔比最高是在新中國成立之初為51.96%,最低是在1996年為50.82%。下圖是來自快易資料提供的 中國、印度、日本、英國、美國 五國的男性佔比圖,從圖中可以清晰看出中國與印度的男女比一直處於失衡狀態。
- 2000年我國男女人口差值最大為4131萬人,最小差值是在1965年為1718萬人。
- 2006年以來我國男女比例失衡狀況逐年緩解
我國到底有多少男性同胞們會打光棍? 由於篇幅有限,我們下期做一個專題分析這個問題!
3.人口城鎮化
有很多同學不理解何為“人口城鎮化”,下面豬哥引用百度百科的介紹:
人口城鎮化是指農村人口轉變為城鎮人口、農業人口轉變為非農業人口的過程,它是社會生產力發展到一定階段的產物。
城鎮化是一個綜合指標,可以用來衡量當地經濟發展情況、基礎設施和人民生活水平。
同時,城鎮化的程式也是房地產市場在需求層面的重要支撐力量,下圖是一張人口城鎮化與社會發展關係的圖。
根據美國地理學家諾瑟姆對世界各國城市化的研究,世界城市化分為三個階段:
- 初期(人口城鎮化在30%以下):農村人口占優勢,工農業生產力水平較低,工業提供就業機會少,農業剩餘勞動力得不到釋放。
- 中期(人口城鎮化30%~70%):工業基礎比較雄厚,經濟實力明顯增強,農村勞動生產率提高,剩餘勞動力轉向工業,城市人口比重快速突破50%,而後上升到70%。
- 後期(人口城鎮化70%~90%):農村人口向城鎮人口的轉化趨於停止,農村人口占比穩定在10%左右,城市人口可以達到90%左右,趨於飽和,這個過程的城市化不再是人口從農村流向城市,而是城市人口在產業之間的結構性轉移,主要是從第二產業向第三產業轉移。
來看看我國人口城鎮化資料分析:
由上圖分析可知:
- 2019年我國人口城鎮化達到60.6%,處於人口城鎮化的中期。
- 1995年我國鄉村人口達到峰值:8.59億。
- 1996年我國城鎮化步伐加快,同年城鎮化超過30%,進入城鎮化的中期。
- 在2010年我國城市人口與鄉村人口持平約為6.7億,城鎮化為50%。
聯合國對中國人口城鎮化程式進行了預測:我國城鎮化初期是1949年~1995年,中期是1996年~2032年,後期是2033年以後。
4.人口增長率
資料視覺化的程式碼豬哥就不放出來了,想看的同學直接取看原始碼吧,我們直接看圖片。
由上圖得知:
- 在自然災害三年(1959、1960、1961)我國人口死亡率陡增,出生率也下降,人口出現新中國成立以來第一次負增長!
- 在自然災害過後的兩年(1962、1963)迎來我國最大的一波生育潮,我們通過2010年人口第五次普查的資料也可以驗證這個結論。
- 自然災害三年過後我國的死亡率一直趨於穩定,維持在6-7‰左右。
- 我國出生率整體一直在下降,在計劃生育之前出生率就在下降。
- 在2016年我國全面放開二胎之後的三年(2017-2019),出生率並沒有出現好轉,反而持續走低。
目前的育齡婦女基本都是85-90後,受計劃生育(1980年)影響,育齡婦女人數比以前少了,生孩子的數量自然就比以前少了,這一情況會持續下去。
出生率降低,死亡率增加,人口增長就慢慢放緩,社科院預測在2029年左右我國人口達到峰值(14.42億)之後慢慢減少!
題外話:豬哥在爬取資料之後,發現 國家資料網站 提供的資料也是有誤的:1961年人口比1960年人口下降,而增長率卻為整數!
5.年齡結構
人口年齡結構是衡量 老齡化 與 人口紅利 的指標。
老齡化:指老年人口相對增多,在總人口中所佔比例不斷上升的過程,國際上通常看法是,當一個國家或地區60歲以上老年人口占人口總數的10%,或65歲以上老年人口占人口總數的7%,即意味著這個國家或地區的人口處於老齡化社會。 ——百度百科
老齡化是每個國家每個社會都會經歷的階段,目前來講已開發國家的老齡化問題比發展中國家更嚴重,據快易資料提供的一份 世界各國老齡化排名來看,中國只排到了65名,第一名是日本,而前幾名基本都是歐洲國家。
人口紅利:經濟學術語,是指一個國家的勞動年齡人口占總人口比重較大,撫養率比較低,為經濟發展創造了有利的人口條件,整個國家的經濟呈高儲蓄、高投資和高增長的局面。
人口紅利簡單來說就是 勞動力人口數 大於 非 勞動力人口,勞動人口比例較高,保證了經濟增長中的勞動力需求,勞動力資源豐富和成本優勢已經使中國成為世界工廠和世界經濟增長的引擎。
從上面三圖分析我們可得:
- 1982年我國 0-14歲少兒佔比33.59%,而2019年減至17.9%,比例減至近半。
- 2019年我國65歲以上人口占比為12.57%,已經進入老齡化社會。世界有92個國家進入老齡化,中國排在65。
- 2010年我國總撫養比達到最低為:34.2%,意味著每3個勞動力需要養一個老人或小孩。
- 人口紅利在2010年達到頂峰,之後在慢慢降低。
2019年我國老年人口為1.76億,中國的老齡化即將進入快速老齡化階段,目前我國多個省的養老金告急,我國養老金體系改革迫在眉睫。
五、總結
由於篇幅過長,很多分析程式碼並未放出,如果想學習的同學可以檢視原始碼(https://github.com/pig6/china_population)。
我們來總結一下我們今天分析的結果吧:
- 總人口:我國總人口穩步增長,據社科院預測:中國人口將在2029年達到峰值14.42億,往後逐步下降
- 男女比例:我國自新中國成立以來,一直處於男多女少的狀態中,2019年男女差為3000萬。因為老年人中女性多於男女,所以年輕男女的差值應該會更大,下期我們可以專門分析一下:中國將會有多少光棍?
- 人口城鎮化:2019年我國城鎮化超過60%,處於城鎮化發展的中期階段。聯合國對中國人口城鎮化程式進行了預測:我國城鎮化初期是1949年~1995年,中期是1996年~2032年,後期是2033年以後。
- 人口增長率:我國出生率持續走低,在全面放開二胎之後並未出現生育潮,人口增長慢慢放緩,據社科院預測在2029年人口增長率為0,之後出現負增長,生育率低使得我的老齡化程式加快。
- 人口年齡結構:人口年齡結構影響著兩個重要的指標:人口紅利、老齡化。我國人口紅利在2010年達到頂峰,之後慢慢減少。老齡化問題是國際普遍存在的問題,尤其是已開發國家。據快易資料顯示:2018年全世界有92個國家進入老齡化,排在第一的日本老齡化為:27.58%,我國老齡化排在第65位。但隨著時間推移我國即將進入快速老化期,養老問題日益凸顯!
總結來說我國人口結構存在兩個嚴峻的問題:
- 養老問題:生育率低、勞動力萎縮、老齡化加速、人口即將見頂、人口紅利消失、多省養老金告急,需中央補貼!
- 剩男問題:計劃生育實行後男女人口差拉大,男女失衡,剩男問題嚴峻,越南買媳婦新聞屢見不鮮!
面對兩個嚴峻的考驗,希望有專業人士能為我們國家出謀劃策,希望我們的國家早日實現偉大復興!
資料來源:
1、http://data.stats.gov.cn/easyquery.htm?cn=C01
2、http://www.stats.gov.cn/tjsj/zxfb/202001/t20200117_1723383.html
3、https://www.kylc.com/stats
參考:
1、https://yq.aliyun.com/articles/668824
2、https://mp.weixin.qq.com/s/SmNxflkaYgBewwmjoqOfJw
3、https://www.ssap.com.cn/c/2019-01-03/1074956.shtml
原始碼地址:https://github.com/pig6/china_population
相關文章
- 演算法工程師的生存危機,我們怎麼破?演算法工程師
- 美國人口普查局:美國全職工作女性收入超過金融危機前
- 危機逼近?奉啟玉分析聯合國17億人或面臨糧食危機
- 聯合國報告:新冠疫情危機或使全球赤貧人口增至11億
- 優思學院|我們的企業面對哪些危機?六西格瑪如何處理這些危機?
- 程式設計師 35 歲危機,如何破局 ?程式設計師
- 《Lacuna》:偵探的煙,和他的存在主義危機
- 除了世界上人口最多,你對中國人口還有哪些瞭解?
- 大資料分析存在哪些困難大資料
- 聯合國世界糧食計劃署:預計2020年全球遭遇糧食危機人口將達2.65億
- 澤平巨集觀:漸行漸近的人口危機 剩男問題日益嚴峻
- 卡普空:截止2020年6月《生化危機》系列銷量破億
- 房地產分析十一:人口因素
- 生化危機3:重製版》發售5天銷量破200萬份
- Python:請原諒我這放蕩不羈的存在Python
- 我們分析了9萬家創業公司,發現美國風投中存在的歧視創業
- 機房精密空調存在哪些優勢特點
- 保密隨身碟仍然存在資料安全危機?該怎麼用才能規避?
- Docker的危機Docker
- Python資料分析常用庫有哪些?Python學習!Python
- 推行FMEA存在哪些阻力?
- 美國人口普查局:美國人口總數上升至超過3.3億
- 危中尋機:海外保險疫情影響分析(附下載)
- 學爬蟲,我需要掌握哪些Python基礎?爬蟲Python
- Python常用資料分析庫有哪些?Python學習班!Python
- 周朝陽:警惕新一輪經濟危機!我們要如何應對?
- 美國國家犯罪資訊中心:2022年美國失蹤人口和身份不明人口統計
- 傳統電銷存在哪些問題?電銷機器人又能給予哪些幫助?機器人
- 系統不做限流,我看你是對中國人口數量有什麼誤解
- 中國曆次人口普查全國人口及年均增長率(附原資料表)
- B站的危與機
- Counterpoint:中國智慧手機市場是否還存在增長機會
- 玩過《生化危機4》VR版後,我想我不再需要重製版了VR
- GitHub:我開源我自己;CEO:不存在的Github
- Python Pygal繪製世界人口地圖Python地圖
- 一個“外國人”引發的ofo押金擠兌危機
- IDC發展存在哪些問題?
- 拖拽式快速建站存在哪些缺陷?