讀書筆記:《Python3網路爬蟲開發實戰》——第2章:爬蟲基礎
第2章 爬蟲基礎
2.1 HTTP基本原理
2.1.1 URI和URL
URI: Uniform Resource Identifier 統一資源識別符號
URL:Universal Resource Locator 統一資源定位符
2.1.2 超文字
hypertext
2.1.3 http和https
https:Hyper Text Transfer Protocol over Secure Socket Layer
https是以安全為目標的HTTP通道,簡單地講師HTTP的安全版,即HTTP下加入SSL層,簡稱為HTTPS
2.1.4 HTTP請求過程
2.1.5 請求
- 請求方法:get和post
- get請求中的引數包含在URL中,資料可以在URL中看到;而post請求的URL不會包含這些資料,資料通過表單形式傳輸的,會包含在請求體中
- get請求提交的資料最多隻有1024位元組,post無限制
- 請求的網址
即URL - 請求頭
- 請求體
2.1.6 響應
- 相應狀態碼
- 響應頭
- 響應體
2.2 網頁基礎
2.3 爬蟲的基本原理
2.3.1 爬蟲概述
獲取網頁 —> 提取資訊 —> 儲存資料 —> 自動化程式
2.4 會話和cookies
後面有cookies池搭建,此處不贅述
2.5 代理的基本原理
同上
相關文章
- python3網路爬蟲開發實戰_Python3 爬蟲實戰Python爬蟲
- [Python3網路爬蟲開發實戰] 2-爬蟲基礎 2-網頁基礎Python爬蟲網頁
- 《Python3網路爬蟲開發實戰》教程||爬蟲教程Python爬蟲
- 【閱讀筆記】《Python3網路爬蟲開發實戰》PDF文件筆記Python爬蟲
- 《Python3 網路爬蟲開發實戰》—學習筆記Python爬蟲筆記
- [Python3網路爬蟲開發實戰] 分散式爬蟲原理Python爬蟲分散式
- python3網路爬蟲開發實戰_Python 3開發網路爬蟲(一)Python爬蟲
- 《網路爬蟲開發實戰案例》筆記爬蟲筆記
- Python3網路爬蟲開發實戰Python爬蟲
- [Python3網路爬蟲開發實戰] 2-爬蟲基礎 1-HTTP基本原理Python爬蟲HTTP
- python3網路爬蟲開發實戰pdfPython爬蟲
- 《python3網路爬蟲開發實戰》--pyspiderPython爬蟲IDE
- 我的爬蟲入門書 —— 《Python3網路爬蟲開發實戰(第二版)》爬蟲Python
- [Python3網路爬蟲開發實戰] 2-爬蟲基礎 5-代理的基本原理Python爬蟲
- 網路爬蟲——爬蟲實戰(一)爬蟲
- Python3網路爬蟲開發實戰——第1章 開發環境Python爬蟲開發環境
- 《Python3網路爬蟲開發實戰》開源啦!Python爬蟲
- 《Python3網路爬蟲開發實戰》抽獎贈書活動Python爬蟲
- [Python3網路爬蟲開發實戰] Charles 的使用Python爬蟲
- [Python3網路爬蟲開發實戰] --Splash的使用Python爬蟲
- Python3網路爬蟲開發實戰——第3章 基本庫的使用Python爬蟲
- 計算機書籍- 網路爬蟲開發實戰計算機爬蟲
- Python3網路爬蟲開發實戰(第二版)Python爬蟲
- Python 3網路爬蟲開發實戰Python爬蟲
- 基礎爬蟲案例實戰爬蟲
- python網路爬蟲(9)構建基礎爬蟲思路Python爬蟲
- python3 網路爬蟲開發實戰 貓眼top100Python爬蟲
- 《Python3網路爬蟲開發實戰程式碼》基本庫使用Python爬蟲
- 面前最全《崔慶才python3網路爬蟲開發實戰》Python爬蟲
- Python網路爬蟲實戰Python爬蟲
- python網路爬蟲應用_python網路爬蟲應用實戰Python爬蟲
- python3 爬蟲實戰:為爬蟲新增 GUI 影象介面Python爬蟲GUI
- python3網路爬蟲開發實戰【高清掃描帶目錄】Python爬蟲
- python網路爬蟲筆記(一)Python爬蟲筆記
- Python3 網路爬蟲開發實戰 第2版 (崔慶才) PDF 高畫質Python爬蟲
- Python3網路爬蟲快速入門實戰解析Python爬蟲
- 【0基礎學爬蟲】爬蟲基礎之網路請求庫的使用爬蟲
- Python3 網路爬蟲實戰的視訊和掃描版書Python爬蟲