python爬蟲解決趕集網掃碼獲取手機號

我不喜歡這個世界發表於2018-03-13

(1)正常的抓取頁面:
不需要掃碼,需要點選檢視的
這裡寫圖片描述
但是沒有這個必要,我們仔細看html程式碼:
這裡寫圖片描述
發現裡面就已經包含了手機號碼;點選檢視手機號只是個擺設。

(2)需要掃碼的一個頁面,網址為:

http://hz.ganji.com/fang1/2938272612x.htm

這裡寫圖片描述

這個的話我們再次檢視html程式碼:

這裡寫圖片描述

發現並沒有手機號存在;
先彆著急,我們先研究一下二維碼到底包含了什麼資訊:
用(草料識別二維碼或者python庫識別)發現解析出來是:

http://3g.ganji.com/hz_fang1/2938272612x

我們發現:
我們訪問的網址和二維碼訪問得到的網址如下:

訪問:
http://hz.ganji.com/fang1/2938272612x.htm
二維碼解析:
http://3g.ganji.com/hz_fang1/2938272612x

主要不同的就是多了(3g),然後就是hz和fang1位置變了。
我們用電腦訪問解析出來的網址:

這裡寫圖片描述
看到沒,出現了手機號。
我們只需要把原網址拼接成http://3g.ganji.com/…這種型別
就可以不用理會二維碼了。二維碼也是個擺設。

歡迎閱讀我的更多文章。
歡迎進(Q)群,幫你解決問題:
在這裡插入圖片描述

相關文章