python 求職 Top10 城市,來看看是否有你所在的城市

發表於2017-07-14

python 求職 Top10 城市,來看看是否有你所在的城市

前言

從智聯招聘爬取相關資訊後,我們關心的是如何對內容進行分析,獲取用用的資訊。

本次以上篇文章“5分鐘掌握智聯招聘網站爬取並儲存到MongoDB資料庫”中爬取的資料為基礎,分析關鍵詞為“python”的爬取資料的情況,獲取包括全國python招聘數量Top10的城市列表以及其他相關資訊。

一、主要分析步驟

  • 資料讀取
  • 資料整理
  • 對職位數量在全國主要城市的分佈情況進行分析
  • 對全國範圍內的職位月薪情況進行分析
  • 對該職位招聘崗位要求描述進行詞雲圖分析,獲取頻率最高的關鍵字
  • 選取兩個城市,分別分析月薪分佈情況以及招聘要求的詞雲圖分析

二、具體分析過程

1 讀取資料

結果如圖1所示:

python 求職 Top10 城市,來看看是否有你所在的城市

2 資料整理

2.1 將str格式的日期變為 datatime

2.2 篩選月薪格式為“XXXX-XXXX”的資訊

2.3 分割月薪欄位,分別獲取月薪的下限值和上限值

執行結果如圖2所示:python 求職 Top10 城市,來看看是否有你所在的城市

  • 將資料資訊按職位月薪進行排序

  • 判斷爬取的資料是否有重複值

  • 從上述結果可看出,資料是沒有重複的。

3 對全國範圍內的職位進行分析

3.1 主要城市的招聘職位數量分佈情況

  • 對結果進行繪圖:

執行結果如下述餅圖所示:python 求職 Top10 城市,來看看是否有你所在的城市

3.2 月薪分佈情況(全國)

執行結果如下述圖所示:python 求職 Top10 城市,來看看是否有你所在的城市

不考慮部分極值後,分析月薪分佈情況

執行結果如下述圖所示:python 求職 Top10 城市,來看看是否有你所在的城市

3.3 相關技能要求

對獲取到的職位招聘要求進行詞雲圖分析,程式碼如下:

得到結果如下:python 求職 Top10 城市,來看看是否有你所在的城市

4 北京

4.1 月薪分佈情況

參考全國分析時的程式碼,月薪分佈情況圖如下:python 求職 Top10 城市,來看看是否有你所在的城市

4.2 相關技能要求

詞雲圖如下:python 求職 Top10 城市,來看看是否有你所在的城市

5 長沙

5.1 月薪分佈情況

參考全國分析時的程式碼,月薪分佈情況圖如下:python 求職 Top10 城市,來看看是否有你所在的城市

5.2 相關技能要求

詞雲圖如下:python 求職 Top10 城市,來看看是否有你所在的城市

相關文章