利用Python爬蟲獲取招聘網站職位資訊

千鋒武漢發表於2021-08-09

      當你學會使用 Python爬蟲之後就會發現想要得到某些資料再也不用自己費力的去尋找,今天小千就給大家介紹一個很實用的爬蟲案例,獲取Boss直聘上面的招聘資訊,同學們一起來學習一下了。

      Boss直聘爬蟲案例

      這次我們以北京地區的銷售崗位為案例,開啟Boss直聘搜尋【銷售】,但是很遺憾boss直聘的反爬措施不能直接使用requests庫獲取資訊,所以採用webdriver自動化方式獲取網頁原始碼。

      webdriver的使用需要:pip3 install selenium、配置chrome瀏覽器的chrome driver。

Python培訓boss直聘案例1

      點選了多頁之後,發現位址列的地址變化如下:

Python培訓boss直聘案例2

      所以我們就發現了地址的規律變化,因此程式碼如下:

Python培訓boss直聘案例3

      此時執行程式碼,發現htmls_list中有好多的資料。這下也就放心了,說明我們獲取到了網頁的資料。 有了資料我們就開始遍歷htmls_list,因為htmls_list存放著多頁的資料,我們要一頁一頁的獲取並提取裡面的職位、薪資等資訊。提取的過程我們使用的是BeautifulSoup,具體的使用說明這裡不在贅述。

      使用BeautifulSoup提取的資料我們都存放在job_list=[]這個列表中。頁面分析如下:

Python培訓boss直聘案例4

      以此類推,我們都可以找到對應的標籤。

Python培訓boss直聘案例5

      以上就是Python獲取boss直聘上面的崗位資訊過程的介紹了。最後歡迎對 Python開發感興趣的小夥伴關注小千,後期分享跟多Python技術知識!

      本文來自千鋒教育,轉載請註明出處。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31548651/viewspace-2785917/,如需轉載,請註明出處,否則將追究法律責任。

相關文章