教你用Python爬取圖蟲網

iMorta發表於2019-02-26

原文網址 : https://flycode.co/archives/276245

TuChong_Spider

(新手爬蟲專案大牛勿噴)

偶然的機會在抖音看到這個APP,發現有很多高質量的手機桌布和圖片,對於一個爬蟲初學者,這就非常美滋滋了,好多歐美小姐姐啊,哎嘿嘿....

圖蟲網共享相簿爬蟲, 通過抓取Ajax獲取圖片ID進行圖片儲存

爬取網站: https://stock.tuchong.com

爬取結果

教你用Python爬取圖蟲網

執行環境:

Python 3.5+
Windows 10
VSCode

如何使用

下載專案原始碼

https://github.com/cexll/tuchong_Spider.git

安裝依賴

$ pip install -r requirements.txt

執行專案

$ python spider.py
輸入想要搜尋的內容: 少女
獲取圖片ID.....
解析imageID
存在ID,解析
解析HTML圖片URL...
準備下載... //p3a.pstatp.com/weili/l/199813*************89.jpg
下載成功----------------------
拼接url訪問網頁
解析HTML圖片URL...
準備下載... //p3a.pstatp.com/weili/l/189***********417.jpg
下載成功----------------------
拼接url訪問網頁
解析HTML圖片URL...
準備下載... //p3a.pstatp.com/weili/l/1**************25.png
拼接url訪問網頁
解析HTML圖片URL...
準備下載... //p3a.pstatp.com/weili/l/2***********62820.jpg
拼接url訪問網頁
解析HTML圖片URL...
準備下載... //p3a.pstatp.com/weili/l/************2.jpg
拼接url訪問網頁
...
複製程式碼

圖片連結我就大碼了,免得被打....

思路(前方高能,請流量黨注意)

首先爬取一個網頁,第一步,先開啟這個網頁(/滑稽,,,,

教你用Python爬取圖蟲網

開啟之後,先看看怎麼搜尋圖片,下載圖片的..

教你用Python爬取圖蟲網

教你用Python爬取圖蟲網

嗯~~,好看山山水水...(我是來幹嘛的....

回到正題~

開啟開發者工具(F12 或者右鍵 ,然後重新整理

教你用Python爬取圖蟲網

然後看一看有沒有什麼有用的東西....好像仔細找了找是沒有發現什麼有用的...怎麼辦呢?

好像真找不到了,怎麼辦?

網頁往下翻一翻,,,,,

教你用Python爬取圖蟲網

圖片中間出現了個奸細....這就是我們需要的東西,,但是開啟發現不對啊,怎麼沒有圖片下載的連結??

教你用Python爬取圖蟲網

哎,別慌,先去網頁開啟一個圖片看看是什麼結構的...

教你用Python爬取圖蟲網

到這裡我們發現了,網頁url連結有個imageID=這東西,好像和之前找到個奸細內容是一樣的,,,開啟後發現的確是一樣的

那麼整體的結構就清楚了,先把剛才的奸細連結開啟看看是什麼

教你用Python爬取圖蟲網

教你用Python爬取圖蟲網

密集恐懼症都犯了,....仔細看了看,發現最開始都有imageID,那麼思路就有了

通過訪問奸細的連結得到每一頁的imageID,在用 https://stock.tuchong.com/free/image/? + imageID就可以訪問到圖片了,好一氣呵成

程式碼

完整程式碼見專案地址: github.com/cexll/tucho…

教你用Python爬取圖蟲網

教你用Python爬取圖蟲網

總結

抓取所有的網頁都是類似的思路,首先先通過人的邏輯去找到資料,在通過程式碼去得到,不要一來就上手程式碼,

細心的朋友肯定發現了,我們抓的是免費相簿裡的圖片,是的,至於為什麼不抓優選相簿,高階相簿,1是我也是才發現他們不一樣,2是別人賺錢的生意我就這樣發出來了萬一被抓了怎麼辦....

有能力的可以自己去琢磨一下,我上次看了一下imageID這次是儲存在HTML裡面的,有點類似今日頭條的

專案地址: github.com/cexll/tucho…

相關文章

python爬蟲---網頁爬蟲，圖片爬蟲，文章爬蟲，Python爬蟲爬取新聞網站新聞
2019-01-04
Python爬蟲網頁網站
Python爬蟲—爬取某網站圖片
2020-11-19
Python爬蟲網站
教你用Python爬取妹子圖APP
2018-08-30
PythonAPP
教你用python爬蟲爬blibili網站彈幕！
2021-03-22
Python爬蟲網站
Python爬蟲入門【9】：圖蟲網多執行緒爬取
2019-07-31
Python爬蟲執行緒
node：爬蟲爬取網頁圖片
2019-02-16
爬蟲網頁
【python--爬蟲】千圖網高清背景圖片爬蟲
2019-05-21
Python爬蟲
【python--爬蟲】彼岸圖網高清桌布爬蟲
2019-07-21
Python爬蟲
python爬取網圖
2019-10-15
Python
Python爬蟲入門教程 2-100 妹子圖網站爬取
2018-12-13
Python爬蟲網站
【Python爬蟲】正則爬取趕集網
2020-12-24
Python爬蟲
Python爬蟲入門【5】：27270圖片爬取
2019-07-30
Python爬蟲
網路爬蟲---從千圖網爬取圖片到本地
2019-09-03
爬蟲
Python網路爬蟲2 - 爬取新浪微博使用者圖片
2018-04-10
Python爬蟲
Python爬蟲入門【4】：美空網未登入圖片爬取
2019-07-30
Python爬蟲
爬蟲Selenium+PhantomJS爬取動態網站圖片資訊（Python）
2018-03-24
爬蟲JS網站Python
python網路爬蟲--爬取淘寶聯盟
2018-07-17
Python爬蟲
Python爬蟲實戰詳解：爬取圖片之家
2020-11-04
Python爬蟲
python例項，python網路爬蟲爬取大學排名!
2018-11-20
Python爬蟲
Python資料爬蟲學習筆記（11）爬取千圖網圖片資料
2018-09-18
Python爬蟲筆記
Node JS爬蟲：爬取瀑布流網頁高清圖
2018-05-17
JS爬蟲網頁
Python爬蟲實踐--爬取網易雲音樂
2022-02-15
Python爬蟲
用PYTHON爬蟲簡單爬取網路小說
2021-09-11
Python爬蟲
Python爬蟲入門【11】：半次元COS圖爬取
2019-07-31
Python爬蟲
Python爬蟲新手教程：知乎文章圖片爬取器
2019-07-20
Python爬蟲
Python爬蟲遞迴呼叫爬取動漫美女圖片
2020-10-19
Python爬蟲遞迴
爬蟲 Scrapy框架爬取圖蟲圖片並下載
2018-08-27
爬蟲框架
Java爬蟲批量爬取圖片
2021-09-24
Java爬蟲
Python爬蟲入門【3】：美空網資料爬取
2019-07-30
Python爬蟲
Python使用多程式提高網路爬蟲的爬取速度
2019-02-01
Python爬蟲
新手爬蟲教程：Python爬取知乎文章中的圖片
2019-01-17
爬蟲Python
如何用Python網路爬蟲爬取網易雲音樂歌曲
2018-04-27
Python爬蟲
Python爬蟲入門教程 4-100 美空網未登入圖片爬取
2018-12-17
Python爬蟲
python網路爬蟲_Python爬蟲：30個小時搞定Python網路爬蟲視訊教程
2020-10-21
Python爬蟲
爬蟲---xpath解析（爬取美女圖片）
2020-12-23
爬蟲
教你用Python爬蟲自制有道翻譯詞典
2021-04-01
Python爬蟲
python 爬蟲爬取 learnku 精華文章
2020-04-17
Python爬蟲
Python爬蟲入門教程 50-100 Python3爬蟲爬取VIP視訊-Python爬蟲6操作
2019-02-14
Python爬蟲