Pyhton抓取BOSS直聘職位描述和資料清洗,很簡單沒有那麼難

嬌兮心有之發表於2018-12-17

一、抓取詳細的職位描述資訊

詳情頁分析

Python學習資料或者需要程式碼、視訊加Python學習群:960410445

Pyhton抓取BOSS直聘職位描述和資料清洗,很簡單沒有那麼難

 

在詳情頁中,比較重要的就是職位描述和工作地址這兩個

由於在頁面程式碼中崗位職責和任職要求是在一個 div 中的,所以在抓的時候就不太好分,後續需要把這個連體嬰兒,分開分析。

Pyhton抓取BOSS直聘職位描述和資料清洗,很簡單沒有那麼難

 

爬蟲用到的庫

使用的庫有:

  • requests
  • BeautifulSoup4
  • pymongo

Python 程式碼

Pyhton抓取BOSS直聘職位描述和資料清洗,很簡單沒有那麼難

 

程式碼 easy,初學者都能看懂。

二、資料清洗

校正釋出日期

Pyhton抓取BOSS直聘職位描述和資料清洗,很簡單沒有那麼難

 

校正薪水以數字儲存

Pyhton抓取BOSS直聘職位描述和資料清洗,很簡單沒有那麼難

 

根據 工作經驗年限 劃分招聘等級

Pyhton抓取BOSS直聘職位描述和資料清洗,很簡單沒有那麼難

相關文章