《Python3網路爬蟲開發實戰(第二版)》今天正式上市了!!!!

VIP_CQCRE發表於2021-11-26

閱讀本文大概需要 5 分鐘。

大家好!我是崔慶才。

今天告訴大家一個好訊息:《Python3網路爬蟲開發實戰(第二版)》今天正式上市了!!!!

沒錯,就是這本:

bd2b5437bbbd4fa1772caa9c2f4a24df.png

2018 年 5 月我的《Python3網路爬蟲開發實戰》的第一版出版了,從上市到現在三年多銷量約 10w 冊(真的非常感謝各位讀者的支援)。後來,由於一些技術更迭,我開始策劃編寫本書的第二版。

2021 年11月,這本書歷經各種反覆修改、審稿等階段,到今天終於上市了!

這幾個月我收到了太多讀者的詢問,第二版什麼時候出來,真的抱歉實在是讓大家久等了。

沒錯,就是今天,它來了!

第二版更新內容

大家第一個問題可能就會問,第二版比第一版更新了哪些內容?

因為技術總是在不斷髮展和進步的,爬蟲技術也是一樣,它在爬蟲和反爬蟲不斷鬥爭的過程中也在不斷演進。比如現在越來越多的網頁採取了各種防護措施,比如前端程式碼的壓縮和混淆、API 的引數加密、WebDriver 的檢測,要做到高效的資料爬取,我們就需要懂得一些 JavaScript 逆向分析相關技術。App 也是一樣,App 的抓包防護、加殼保護、Native 化、風控檢測使得越來越多的 App 資料難以爬取,所以我們也不得不瞭解一些逆向相關技術,如 Xposed、Frida、IDA Pro 等工具的使用。除此之外,近幾年深度學習和人工智慧發展得也是如火如荼,所以爬蟲也可以和人工智慧結合起來,比如基於深度學習的驗證碼識別、網頁內容的智慧化解析和提取等技術我們也可以進行學習和了解。另外,一些大規模爬蟲的管理和運維技術也在不斷髮展,當前 Kubernetes、Docker、Prometheus 等雲原生技術也非常火爆,基於 Kubernetes 等雲原生技術的爬蟲管理和運維解決方案也已經很受青睞。然而,之前第一版書對以上提到的這些新興技術幾乎沒有提及。

除此之外,第一版書在講解資料爬取的過程中引用了很多案例和服務,比如貓眼電影網站、淘寶網站、代理服務網站,然而幾年過去了,有些案例網站和服務早已經改版或者停止維護,這就導致第一版書中的很多案例已經不能正常執行了。這其實是一個很大的問題,因為程式執行不通會大大降低學習的積極性和成就感,而且會浪費不少時間。另外,即使案例對應的爬蟲程式碼及時更新了,那我們也不知道這些案例網站和服務什麼時候會再次改版,因為這都是不可控的。所以,為了徹底解決這個問題,我花費了近半年的時間構建了一個爬蟲案例平臺(https://scrape.center),平臺包含了幾十個爬蟲案例,包括服務端渲染(SSR)網站、單頁面應用(SPA)網站、各類反爬網站、驗證碼網站、模擬登入網站、各類 App 等,覆蓋了現在爬蟲和反爬蟲相關的大多數技術,整個平臺都是我來維護的,書中幾乎所有案例都是從案例平臺來的,從而解決了頁面改版的問題。

所以,本書相比第一版來說,更新的內容主要如下:

  • 絕大多數都遷移到了自建的案例平臺,以後再也不用擔心案例有過期或改版問題。

  • 替換了原本第一章環境安裝的章節,將環境配置的部分全部彙總並遷移到案例平臺(https://setup.scrape.center)並在書中以外鏈的形式附上,以確保環境的配置和安裝說明能夠被及時更新。

  • 增加了一些新的請求庫、解析庫、儲存庫等的介紹,如 httpx、parsel、Elasticsearch 等庫的介紹。

  • 增加了非同步爬蟲的介紹,如協程的基本原理、aiohttp 的使用和爬取實戰介紹。

  • 增加了一些新興自動化工具的介紹,如 Pyppeteer、Playwright 的介紹。

  • 增加了深度學習相關內容,如圖形驗證碼、滑動驗證碼的識別方案。

  • 豐富了模擬登入章節的內容,如增加了 JWT 模擬登入的介紹和實戰、大規模賬號池的優化。

  • 增加了 JavaScript 逆向的章節,包括網站加密和混淆技術、JavaScript 逆向除錯技巧、JavaScript 的各種模擬執行方式、AST 還原混淆程式碼、WebAssembly 等相關技術的介紹。

  • 豐富了 App 自動化爬取技術的章節,如新興框架 Airtest 的介紹、手機群控和雲手機技術的介紹。

  • 增加了 Android 逆向章節,如反編譯、反彙編、Hook、脫殼、so 檔案分析和模擬執行等技術的介紹。

  • 增加了網頁智慧化解析章節,包括列表頁、詳情頁內容提取演算法和分類演算法。

  • 豐富了 Scrapy 相關章節的介紹,如 Pyppeteer 的對接、RabbitMQ 的對接、Prometheus 的對接等。

  • 增加了基於 Kubernetes、Docker、Prometheus、Grafana 等雲原生技術爬蟲管理和運維解決方案的介紹。

以上就是第二版的主要更新內容,更多詳情可以看《Python3網路爬蟲開發實戰(第二版)》內容介紹

章節介紹

為了讓大家更直接地瞭解到全書的內容,這裡就直接放目錄了:

dc0773bdb6975c7c69742c87f095460f.png aa08813c20fd70baf0fb66d47171a65c.png

整體來說,新增了很多很多爬蟲知識點,更新了全書爬蟲案例並解決了案例過期的問題。

另外通過目錄可以看到,全書一共 900 多頁,(量了下有 4.3 釐米厚),定價是 139.8 元。

可以直接看第二版嗎?

當然,有朋友也會擔心,我需不需要先學習第一版,然後才能學第二版呢?

答案是:可以直接學第二版,第二版書爬蟲的內容知識體系是完整的,一些舊的技術已經在第一版中移除,第二版的書籍是對所有爬蟲知識體系的全新升級。

沒有基礎可以學嗎?

有朋友也可能會問,沒有爬蟲或者 Python 基礎可以學嗎?

答案是:可以。本書就是專為零爬蟲基礎的朋友準備的,本書從最基礎的環境配置、基礎知識的講解開始,循序漸進地對爬蟲的各個知識點進行介紹,所以完全不用擔心沒有爬蟲基礎學不會的問題。如果沒有 Python 基礎,那也沒關係(當然有會更好),書中也會提及 Python 環境的配置並附上一些 Python 入門學習資料和連結,同時也會通過各個 Python 程式碼片段來進行講解,很多案例也很簡單易懂,學爬蟲的時候 Python 也就會逐漸掌握了。

大咖推薦

這本書同時還獲得了 Python 之父的推薦(沒錯就是 Python 的創始人,Guido van Rossum)。另外我還有幸獲得了微軟亞洲網際網路工程院副院長曾文峰、知名爬蟲專家樑斌penny、中國人民大學高瓴人工智慧學院長聘副教授宋睿華的推薦。

下面是推薦語的內容:

fbcfdbfc681326bfcfc448d65757af6b.png

宣傳彩頁

另外編輯還為本書製作了幾張宣傳彩頁,是對整本書的一個宣傳介紹,大家可以看下:

9d7a02acb54fb21234aba16e16669be6.png

有沒有電子版?

看到這裡,大家可能也會問了,有沒有電子版呢?可能有的朋友習慣看電子版的書本來學習,有的朋友可能在海外也不方便購買,所以想要電子版。

但還是很遺憾地說:沒有電子版。

因為你知道的,如果出了電子版,那麼馬上就會有各種盜版襲來,網上也會造成各種惡意傳播。

所以,為了保護版權,這本書是沒有上電子版的,還請各位讀者諒解,謝謝。

購買連結

是的,最後就是大家最關心的部分了,到哪裡能夠買到呢?

上架之前,我與編輯經過各種溝通,原本是想給廣大讀者和粉絲們有個專屬優惠的,但是這個比較難操作,所以最終決定,整本書現在全網統一 7 折銷售了!

也就是說,原價 139.8 元,現在只需要 97.9 元就能買到了。

不過這個也是限時的,7 折優惠只到下週五,也就是 12 月 3 日,之後會恢復 84 折銷售,也就是 117 元。

另外還有一個訊息,前幾天我不是簽名了 1000 本書嗎?所以,現在這個階段,賣的全都是簽名版(只在京東),一共 1000 本,賣完即止,先到先得。

大家拿到書之後,扉頁就會有我的簽名,是這樣子的:

c5ef9dd62e93acd891e0786d39c5de8e.png

如果不想要簽名版的朋友可以再等等,等簽名版的賣完了就是非簽名版的了。

下面是京東商品的截圖,可以看到寫著 1000 冊簽名版先到先得。

44bcdecc52af64214c9a122b66497b20.png

好了,廢話不多說了,上購買連結:

https://item.jd.com/13527222.html

為了方便購買,我把這個連結轉成了二維碼,大家可以直接掃碼購買:

ffdf5f121ba6535131d54bca6c4fbeec.png

送書活動

為了慶祝新書上市,本公眾號也送福利給各位讀者啦,這裡一共有三個活動。

1. 公號留言送簽名書

在本公眾號底部留言,內容不限,比如說你是怎樣與爬蟲或我這本書結緣的,比如你是怎麼知道我的,或者簡單直接一點,我就想要一本簽名書,反正內容都行哈。

然後我會直接給評論點讚的前 10 名發籤名版的書,時間截止到本週日(11 月 28 日 23:59:59)。

到時候我會再發一篇公號文章來公佈獲獎的朋友的名單,到時候加我的微信給我發收貨地址就好哈。

不過這個活動有一個漏洞:公眾號限制了留言最多隻能 100 條,如果留言過多,可能你的留言就不能被精選了,所以可能後面就沒有機會了。

2. 抽獎送書

當然,除了憑藉留言點贊,這裡我也發起了一個抽獎,抽 5 本簽名版,這個就純屬靠運氣了,大家可以直接掃碼參與抽獎。

42fcfcc5a43dce7d9b4cbfd9491f026c.png

中獎之後可以直接小程式填寫收貨地址,然後就會安排發貨哈。

3. 星球送書

大家也知道,之前我也建立了一個知識星球,用於給星球的各位朋友解答問題,同時我也會在星球分享一些想法、乾貨等內容,星球售價是 99 元,具體的詳情大家可以看這篇文章我創辦了一個知識星球

現在我宣佈,之前加入星球的和以後加入星球的,統統都送一本《Python3網路爬蟲開發實戰(第二版)》的簽名書,目前無限期有效(如果有特殊變動會在星球公佈)。

所以說,如果上面的方式依然沒有獲取到簽名書,這個方式就是一個穩定有效的獲取簽名書的方式。

也就是說現在 99 元(以後可能會漲價)加入星球,現在能獲取原價 139.8 的書(現在 7 折 97.9 元),還能有一年的星球服務。(等等,我這是做了個啥買賣?)

具體領取方式可以聯絡星球管理,或者新增微信「CQCcqc4」來詢問具體事宜。

這是星球的連結,大家感興趣可以掃碼加入:

93010f41ca1fcdf7b763407ec2f31c6b.png

好了,以上就是本篇文章的全部內容了!願各位讀者都可以如願得到想要的書籍~

最後,讓我再次對各位讀者和朋友們說一聲謝謝!(給您鞠躬啦。

好文和朋友一起看

相關文章