爬蟲分析利器：谷歌Chrome F12抓包分析

王平發表於2018-12-02

原文網址 : https://www.yuanrenxue.com/crawler/chrome-for-crawler.html

爬蟲谷歌Chrome

瀏覽器開啟網頁的過程就是爬蟲獲取資料的過程，兩者是一樣一樣的。瀏覽器渲染的網頁是豐富多彩的資料集合，而爬蟲得到的是網頁的原始碼html。

爬蟲利用瀏覽器抓包分析URL

有時候，我們不能在網頁的html程式碼裡面找到想要的資料，但是瀏覽器開啟的網頁上面卻有這些資料。這就是瀏覽器通過ajax技術非同步載入（偷偷下載）了這些資料。

小猿們禁不住要問：那麼該如何看到瀏覽器偷偷下載的那些資料呢？

答案就是谷歌Chrome瀏覽器的F12快捷鍵，也可以通過滑鼠右鍵選單“檢查”（Inspect）開啟Chrome自帶的開發者工具，開發者工具會出現在瀏覽器網頁的左側或者是下面（可調整），它的樣子就是這樣的：

chrome瀏覽器開發者工具f12

讓我們簡單瞭解一下它如何使用：

谷歌Chrome抓包:1. 最上面一行選單

左上角箭頭用來點選檢視網頁的元素
第二個手機、平板圖示是用來模擬移動端顯示網頁
Elements 檢視渲染後的網頁標籤元素
提醒是渲染後（包括非同步載入的圖片、資料等）的完整網頁的html，不是最初下載的那個html。
Console 檢視JavaScript的console log資訊，寫網頁時比較有用
Sources 顯示網頁原始碼、CSS、JavaScript程式碼
Network 檢視所有載入的請求，對爬蟲很有幫助

後面的暫且不管。

谷歌Chrome抓包:2. 重要區域

圖中紅框的兩個按鈕比較有用，編號為2的是清空請求記錄；編號3的是保持記錄，這在網頁有重定向的時候很有用
圖中綠色區域就是載入完整個網頁，瀏覽器的全部請求記錄，包括網址、狀態、型別等。寫爬蟲時，我們就要在這裡尋找線索，提煉金礦。
最下面編號為4的紅框顯示了載入這個網頁，一共請求了181次，數量是多麼地驚人，讓人不禁心疼七瀏覽器來。

點選一條請求的網址，右側就會出現新的視窗顯示該條請求的相信資訊：

Chrome請求詳情

圖中左邊紅框就是點選的請求網址；綠框就是詳情視窗。
詳情視窗包括，Headers（請求頭）、Preview（預覽響應）、Response（伺服器響應內容）和Timing（耗時）。
Preview、Response 幫助我們檢視該條請求是不是有爬蟲想要的資料；
Headers幫助我們在爬蟲中重建http請求，以便爬蟲得到和瀏覽器一樣的資料。

瞭解和熟練使用Chrome的開發者工具，小猿們就如虎添翼可以順利寫出自己的爬蟲啦。

還有最後一篇科普文章，我們就進入正題啦，下一篇我們講：
Python為什麼適合用來寫網路爬蟲

我的公眾號：猿人學 Python 上會分享更多心得體會，敬請關注。

***版權申明:若沒有特殊說明，文章皆是猿人學 yuanrenxue.com 原創，沒有猿人學授權，請勿以任何形式轉載。***

Python 爬蟲、抓包
2020-05-04
Python爬蟲
BLE抓包分析
2020-12-08
IPSEC隧道抓包分析
2019-09-27
通過抓包分析 HTTPS
2018-10-15
HTTP
tcpdump抓包分析NAT ping不通
2024-05-24
TCP
UDP協議抓包分析 -- wireshark
2020-10-03
UDP協議
IP和TCP抓包分析實驗
2021-12-02
TCP
使用WireShark抓包分析TCP協議
2020-12-05
TCP協議
Whistle，web 抓包與 debug 利器
2018-11-25
Web
APP爬蟲-雙向認證抓包的兩種方法
2020-03-27
APP爬蟲
爬蟲—有道翻譯案例分析
2021-09-03
爬蟲
爬蟲包
2019-12-10
Python爬蟲之路-chrome在爬蟲中的使用
2021-01-04
Python爬蟲Chrome
TLS1.3抓包分析----解密Application Data
2024-12-09
TLS解密APP
我爬取了爬蟲崗位薪資，分析後發現爬蟲真香
2020-12-09
爬蟲
使用tcpdump+wireshark抓包分析網路資料包
2018-12-16
TCP
爬蟲專案:大麥網分析
2019-08-22
爬蟲
Python爬蟲之JS逆向分析技巧
2020-04-17
Python爬蟲JS
wireshark安裝使用與tcpdump的抓包分析
2018-05-08
TCP
Fiddler抓包---手機APP--python爬蟲基本設定和操作
2018-10-24
APPPython爬蟲
【爬蟲】網頁抓包工具--Fiddler
2018-12-19
爬蟲網頁
資料分析專案（一）——爬蟲篇
2018-11-30
爬蟲
爬蟲學習日記（四）分析Freenium
2018-12-12
爬蟲
用PyCharm Profile分析非同步爬蟲效率
2019-04-24
PyCharm非同步爬蟲
識別網路爬蟲的策略分析
2022-09-14
爬蟲
python併發爬蟲利器tomorrow(一)
2018-10-16
Python爬蟲
scrapy 爬蟲利器初體驗(1)
2018-11-26
爬蟲
Java爬蟲利器HTML解析工具-Jsoup
2019-06-21
Java爬蟲HTMLJS
Debookee 8.1.2 網路資料抓包及分析工具
2023-11-01
利用Wireshark抓包分析DNS域名解析過程
2024-06-13
DNS
谷歌chrome瀏覽器network中Stalled分析和優化
2021-06-16
谷歌Chrome瀏覽器優化
代理IP幫助Python爬蟲分析市場
2023-03-28
Python爬蟲
python爬蟲利用代理IP分析大資料
2020-12-01
Python爬蟲大資料
? 抓包分析 TCP 建立和斷開連線的流程
2019-03-31
TCP
原來你是這樣的Websocket--抓包分析
2018-05-10
Web
SSH 協議基本原理及 wireshark 抓包分析
2018-09-27
協議
Https、SSL/TLS相關知識及wireShark抓包分析
2018-09-13
HTTPTLS
一次app抓包引發的Android分析（續）
2020-08-19
APPAndroid

爬蟲分析利器：谷歌Chrome F12抓包分析

谷歌Chrome抓包:1. 最上面一行選單

谷歌Chrome抓包:2. 重要區域

相關文章