《Python3網路爬蟲開發實戰(第二版)》今天正式上市了!!!!
“
閱讀本文大概需要 5 分鐘。
”大家好!我是崔慶才。
今天告訴大家一個好訊息:《Python3網路爬蟲開發實戰(第二版)》今天正式上市了!!!!
沒錯,就是這本:
2018 年 5 月我的《Python3網路爬蟲開發實戰》的第一版出版了,從上市到現在三年多銷量約 10w 冊(真的非常感謝各位讀者的支援)。後來,由於一些技術更迭,我開始策劃編寫本書的第二版。
2021 年11月,這本書歷經各種反覆修改、審稿等階段,到今天終於上市了!
這幾個月我收到了太多讀者的詢問,第二版什麼時候出來,真的抱歉實在是讓大家久等了。
沒錯,就是今天,它來了!
第二版更新內容
大家第一個問題可能就會問,第二版比第一版更新了哪些內容?
因為技術總是在不斷髮展和進步的,爬蟲技術也是一樣,它在爬蟲和反爬蟲不斷鬥爭的過程中也在不斷演進。比如現在越來越多的網頁採取了各種防護措施,比如前端程式碼的壓縮和混淆、API 的引數加密、WebDriver 的檢測,要做到高效的資料爬取,我們就需要懂得一些 JavaScript 逆向分析相關技術。App 也是一樣,App 的抓包防護、加殼保護、Native 化、風控檢測使得越來越多的 App 資料難以爬取,所以我們也不得不瞭解一些逆向相關技術,如 Xposed、Frida、IDA Pro 等工具的使用。除此之外,近幾年深度學習和人工智慧發展得也是如火如荼,所以爬蟲也可以和人工智慧結合起來,比如基於深度學習的驗證碼識別、網頁內容的智慧化解析和提取等技術我們也可以進行學習和了解。另外,一些大規模爬蟲的管理和運維技術也在不斷髮展,當前 Kubernetes、Docker、Prometheus 等雲原生技術也非常火爆,基於 Kubernetes 等雲原生技術的爬蟲管理和運維解決方案也已經很受青睞。然而,之前第一版書對以上提到的這些新興技術幾乎沒有提及。
除此之外,第一版書在講解資料爬取的過程中引用了很多案例和服務,比如貓眼電影網站、淘寶網站、代理服務網站,然而幾年過去了,有些案例網站和服務早已經改版或者停止維護,這就導致第一版書中的很多案例已經不能正常執行了。這其實是一個很大的問題,因為程式執行不通會大大降低學習的積極性和成就感,而且會浪費不少時間。另外,即使案例對應的爬蟲程式碼及時更新了,那我們也不知道這些案例網站和服務什麼時候會再次改版,因為這都是不可控的。所以,為了徹底解決這個問題,我花費了近半年的時間構建了一個爬蟲案例平臺(https://scrape.center),平臺包含了幾十個爬蟲案例,包括服務端渲染(SSR)網站、單頁面應用(SPA)網站、各類反爬網站、驗證碼網站、模擬登入網站、各類 App 等,覆蓋了現在爬蟲和反爬蟲相關的大多數技術,整個平臺都是我來維護的,書中幾乎所有案例都是從案例平臺來的,從而解決了頁面改版的問題。
所以,本書相比第一版來說,更新的內容主要如下:
絕大多數都遷移到了自建的案例平臺,以後再也不用擔心案例有過期或改版問題。
替換了原本第一章環境安裝的章節,將環境配置的部分全部彙總並遷移到案例平臺(https://setup.scrape.center)並在書中以外鏈的形式附上,以確保環境的配置和安裝說明能夠被及時更新。
增加了一些新的請求庫、解析庫、儲存庫等的介紹,如 httpx、parsel、Elasticsearch 等庫的介紹。
增加了非同步爬蟲的介紹,如協程的基本原理、aiohttp 的使用和爬取實戰介紹。
增加了一些新興自動化工具的介紹,如 Pyppeteer、Playwright 的介紹。
增加了深度學習相關內容,如圖形驗證碼、滑動驗證碼的識別方案。
豐富了模擬登入章節的內容,如增加了 JWT 模擬登入的介紹和實戰、大規模賬號池的優化。
增加了 JavaScript 逆向的章節,包括網站加密和混淆技術、JavaScript 逆向除錯技巧、JavaScript 的各種模擬執行方式、AST 還原混淆程式碼、WebAssembly 等相關技術的介紹。
豐富了 App 自動化爬取技術的章節,如新興框架 Airtest 的介紹、手機群控和雲手機技術的介紹。
增加了 Android 逆向章節,如反編譯、反彙編、Hook、脫殼、so 檔案分析和模擬執行等技術的介紹。
增加了網頁智慧化解析章節,包括列表頁、詳情頁內容提取演算法和分類演算法。
豐富了 Scrapy 相關章節的介紹,如 Pyppeteer 的對接、RabbitMQ 的對接、Prometheus 的對接等。
增加了基於 Kubernetes、Docker、Prometheus、Grafana 等雲原生技術爬蟲管理和運維解決方案的介紹。
以上就是第二版的主要更新內容,更多詳情可以看《Python3網路爬蟲開發實戰(第二版)》內容介紹
章節介紹
為了讓大家更直接地瞭解到全書的內容,這裡就直接放目錄了:
整體來說,新增了很多很多爬蟲知識點,更新了全書爬蟲案例並解決了案例過期的問題。
另外通過目錄可以看到,全書一共 900 多頁,(量了下有 4.3 釐米厚),定價是 139.8 元。
可以直接看第二版嗎?
當然,有朋友也會擔心,我需不需要先學習第一版,然後才能學第二版呢?
答案是:可以直接學第二版,第二版書爬蟲的內容知識體系是完整的,一些舊的技術已經在第一版中移除,第二版的書籍是對所有爬蟲知識體系的全新升級。
沒有基礎可以學嗎?
有朋友也可能會問,沒有爬蟲或者 Python 基礎可以學嗎?
答案是:可以。本書就是專為零爬蟲基礎的朋友準備的,本書從最基礎的環境配置、基礎知識的講解開始,循序漸進地對爬蟲的各個知識點進行介紹,所以完全不用擔心沒有爬蟲基礎學不會的問題。如果沒有 Python 基礎,那也沒關係(當然有會更好),書中也會提及 Python 環境的配置並附上一些 Python 入門學習資料和連結,同時也會通過各個 Python 程式碼片段來進行講解,很多案例也很簡單易懂,學爬蟲的時候 Python 也就會逐漸掌握了。
大咖推薦
這本書同時還獲得了 Python 之父的推薦(沒錯就是 Python 的創始人,Guido van Rossum)。另外我還有幸獲得了微軟亞洲網際網路工程院副院長曾文峰、知名爬蟲專家樑斌penny、中國人民大學高瓴人工智慧學院長聘副教授宋睿華的推薦。
下面是推薦語的內容:
宣傳彩頁
另外編輯還為本書製作了幾張宣傳彩頁,是對整本書的一個宣傳介紹,大家可以看下:
有沒有電子版?
看到這裡,大家可能也會問了,有沒有電子版呢?可能有的朋友習慣看電子版的書本來學習,有的朋友可能在海外也不方便購買,所以想要電子版。
但還是很遺憾地說:沒有電子版。
因為你知道的,如果出了電子版,那麼馬上就會有各種盜版襲來,網上也會造成各種惡意傳播。
所以,為了保護版權,這本書是沒有上電子版的,還請各位讀者諒解,謝謝。
購買連結
是的,最後就是大家最關心的部分了,到哪裡能夠買到呢?
上架之前,我與編輯經過各種溝通,原本是想給廣大讀者和粉絲們有個專屬優惠的,但是這個比較難操作,所以最終決定,整本書現在全網統一 7 折銷售了!
也就是說,原價 139.8 元,現在只需要 97.9 元就能買到了。
不過這個也是限時的,7 折優惠只到下週五,也就是 12 月 3 日,之後會恢復 84 折銷售,也就是 117 元。
另外還有一個訊息,前幾天我不是簽名了 1000 本書嗎?所以,現在這個階段,賣的全都是簽名版(只在京東),一共 1000 本,賣完即止,先到先得。
大家拿到書之後,扉頁就會有我的簽名,是這樣子的:
如果不想要簽名版的朋友可以再等等,等簽名版的賣完了就是非簽名版的了。
下面是京東商品的截圖,可以看到寫著 1000 冊簽名版先到先得。
好了,廢話不多說了,上購買連結:
https://item.jd.com/13527222.html
為了方便購買,我把這個連結轉成了二維碼,大家可以直接掃碼購買:
送書活動
為了慶祝新書上市,本公眾號也送福利給各位讀者啦,這裡一共有三個活動。
1. 公號留言送簽名書
在本公眾號底部留言,內容不限,比如說你是怎樣與爬蟲或我這本書結緣的,比如你是怎麼知道我的,或者簡單直接一點,我就想要一本簽名書,反正內容都行哈。
然後我會直接給評論點讚的前 10 名發籤名版的書,時間截止到本週日(11 月 28 日 23:59:59)。
到時候我會再發一篇公號文章來公佈獲獎的朋友的名單,到時候加我的微信給我發收貨地址就好哈。
不過這個活動有一個漏洞:公眾號限制了留言最多隻能 100 條,如果留言過多,可能你的留言就不能被精選了,所以可能後面就沒有機會了。
2. 抽獎送書
當然,除了憑藉留言點贊,這裡我也發起了一個抽獎,抽 5 本簽名版,這個就純屬靠運氣了,大家可以直接掃碼參與抽獎。
中獎之後可以直接小程式填寫收貨地址,然後就會安排發貨哈。
3. 星球送書
大家也知道,之前我也建立了一個知識星球,用於給星球的各位朋友解答問題,同時我也會在星球分享一些想法、乾貨等內容,星球售價是 99 元,具體的詳情大家可以看這篇文章我創辦了一個知識星球。
現在我宣佈,之前加入星球的和以後加入星球的,統統都送一本《Python3網路爬蟲開發實戰(第二版)》的簽名書,目前無限期有效(如果有特殊變動會在星球公佈)。
所以說,如果上面的方式依然沒有獲取到簽名書,這個方式就是一個穩定有效的獲取簽名書的方式。
也就是說現在 99 元(以後可能會漲價)加入星球,現在能獲取原價 139.8 的書(現在 7 折 97.9 元),還能有一年的星球服務。(等等,我這是做了個啥買賣?)
具體領取方式可以聯絡星球管理,或者新增微信「CQCcqc4」來詢問具體事宜。
這是星球的連結,大家感興趣可以掃碼加入:
好了,以上就是本篇文章的全部內容了!願各位讀者都可以如願得到想要的書籍~
最後,讓我再次對各位讀者和朋友們說一聲謝謝!(給您鞠躬啦。
好文和朋友一起看
相關文章
- Python3網路爬蟲開發實戰(第二版)Python爬蟲
- python3網路爬蟲開發實戰_Python3 爬蟲實戰Python爬蟲
- 我的爬蟲入門書 —— 《Python3網路爬蟲開發實戰(第二版)》爬蟲Python
- Python3網路爬蟲開發實戰Python爬蟲
- 《Python3網路爬蟲開發實戰(第二版)》內容介紹Python爬蟲
- python3網路爬蟲開發實戰_Python 3開發網路爬蟲(一)Python爬蟲
- 《Python3網路爬蟲開發實戰》教程||爬蟲教程Python爬蟲
- 《python3網路爬蟲開發實戰》--pyspiderPython爬蟲IDE
- python3網路爬蟲開發實戰pdfPython爬蟲
- [Python3網路爬蟲開發實戰] 分散式爬蟲原理Python爬蟲分散式
- 《Python3網路爬蟲開發實戰》開源啦!Python爬蟲
- 《Python3網路爬蟲開發實戰》第二波抽獎贈書活動來了!Python爬蟲
- [Python3網路爬蟲開發實戰] Charles 的使用Python爬蟲
- [Python3網路爬蟲開發實戰] --Splash的使用Python爬蟲
- 《Python3 網路爬蟲開發實戰》—學習筆記Python爬蟲筆記
- python3網路爬蟲開發實戰-線上版-可複製貼上Python爬蟲
- Python3網路爬蟲開發實戰——第1章 開發環境Python爬蟲開發環境
- 面前最全《崔慶才python3網路爬蟲開發實戰》Python爬蟲
- python3 網路爬蟲開發實戰 貓眼top100Python爬蟲
- 《Python3網路爬蟲開發實戰程式碼》基本庫使用Python爬蟲
- [Python3網路爬蟲開發實戰] 2-爬蟲基礎 2-網頁基礎Python爬蟲網頁
- 讀書筆記:《Python3網路爬蟲開發實戰》——第2章:爬蟲基礎筆記Python爬蟲
- Python 3網路爬蟲開發實戰Python爬蟲
- 《Python3網路爬蟲開發實戰》抽獎贈書活動Python爬蟲
- python3網路爬蟲開發實戰【高清掃描帶目錄】Python爬蟲
- 【閱讀筆記】《Python3網路爬蟲開發實戰》PDF文件筆記Python爬蟲
- Python3 網路爬蟲開發實戰 第2版 (崔慶才) PDF 高畫質Python爬蟲
- Python3網路爬蟲開發實戰——第3章 基本庫的使用Python爬蟲
- 網路爬蟲——爬蟲實戰(一)爬蟲
- 《網路爬蟲開發實戰案例》筆記爬蟲筆記
- Python3 網路爬蟲實戰的視訊和掃描版書Python爬蟲
- [Python3網路爬蟲開發實戰] 2-爬蟲基礎 1-HTTP基本原理Python爬蟲HTTP
- Python3網路爬蟲快速入門實戰解析Python爬蟲
- 【Python3網路爬蟲開發實戰】3.4-抓取貓眼電影排行Python爬蟲
- 2019最新崔慶才python3網路爬蟲開發專案實戰(完整)Python爬蟲
- python3網路爬蟲開發實戰(配置踩坑及學習備忘)Python爬蟲
- [Python3網路爬蟲開發實戰] 2-爬蟲基礎 5-代理的基本原理Python爬蟲
- python爬蟲實戰教程-Python爬蟲開發實戰教程(微課版)Python爬蟲