當你學會使用 Python爬蟲之後就會發現想要得到某些資料再也不用自己費力的去尋找，今天小千就給大家介紹一個很實用的爬蟲案例，獲取Boss直聘上面的招聘資訊，同學們一起來學習一下了。

Boss直聘爬蟲案例

這次我們以北京地區的銷售崗位為案例，開啟Boss直聘搜尋【銷售】，但是很遺憾boss直聘的反爬措施不能直接使用requests庫獲取資訊，所以採用webdriver自動化方式獲取網頁原始碼。

webdriver的使用需要：pip3 install selenium、配置chrome瀏覽器的chrome driver。

Python培訓boss直聘案例1

點選了多頁之後，發現位址列的地址變化如下：

Python培訓boss直聘案例2

所以我們就發現了地址的規律變化，因此程式碼如下：

Python培訓boss直聘案例3

此時執行程式碼，發現htmls_list中有好多的資料。這下也就放心了，說明我們獲取到了網頁的資料。有了資料我們就開始遍歷htmls_list，因為htmls_list存放著多頁的資料，我們要一頁一頁的獲取並提取裡面的職位、薪資等資訊。提取的過程我們使用的是BeautifulSoup，具體的使用說明這裡不在贅述。

使用BeautifulSoup提取的資料我們都存放在job_list=[]這個列表中。頁面分析如下：

Python培訓boss直聘案例4

以此類推，我們都可以找到對應的標籤。

Python培訓boss直聘案例5

以上就是Python獲取boss直聘上面的崗位資訊過程的介紹了。最後歡迎對 Python開發感興趣的小夥伴關注小千，後期分享跟多Python技術知識！

本文來自千鋒教育，轉載請註明出處。

利用Python爬蟲獲取招聘網站職位資訊

相關文章