python爬取鬥圖啦表情包並下載到本地

四年發表於2018-12-25

Python

迫於無聊，又剛好正在學習python，就來記錄一篇關於python爬取圖片連結下載本地的入門文章...

主要用到的模組： request 和 BeautifulSoup4 開發之前建議先看一下官方給出關於這兩個模組的文件

request
bs4

開發環境：

python3.6.6
vscode
node v8.10

不同的python版本在部分程式碼上可能會有差異，請務必核對好版本...

開發流程解析

第一步:需要通過request獲取頁面的原始碼

response = requests.get(url, headers=header, timeout=30)
複製程式碼

第二步:分析頁面結構

通過上圖發現，他的每一個img標籤的class都是img-responsive lazy image_dta

那麼我們就可以直接通過bs4的find_all屬性將其取出...

datas = soup.find_all(
        name="img", attrs={"class": "img-responsive lazy image_dta"})
複製程式碼

因為find_all取出的是一個陣列，那麼我們就需要去進行迴圈讀取每個img標籤

for data in datas:
        print("downloading:", data.attrs['data-original'])
        request.urlretrieve(
            data.attrs['data-original'], downPath+'\%s.jpg' % time.time())
複製程式碼

這邊用的是request.urlretrieve進行資源下載...

需要注意的是，一般來講我們都是去獲取圖片的src屬性，但是由於這個網站使用了圖片延時載入，所以我們直接獲取src的話就取到他預設的圖片，這邊我們可以看到img的data-original屬性是包含了圖片的路徑的，所以我們就直接取data-original就可以了....

最後main方法執行...

if __name__ == '__main__':
    pool = ThreadPool(4)
    urls = [
        "http://www.doutula.com/photo/list/?page={}".format(str(i)) for i in range(1, 3)]
    pool.map(getImg, urls)
    pool.close()
    pool.join()
複製程式碼

這邊運用了線城池進行簡單的程式碼優化,後面會加入代理池和佇列進行優化。

程式碼地址：python爬取表情包並下載到本地

如果程式碼有幫助到您，記得點個start哦~~~

Python爬蟲入門教程 13-100 鬥圖啦表情包多執行緒爬取
2018-12-27
Python爬蟲執行緒
python 爬蟲之requests爬取頁面圖片的url，並將圖片下載到本地
2019-06-12
Python爬蟲
Python爬蟲——批次爬取douyin影片，下載到本地
2024-12-06
Python爬蟲
python爬蟲如何獲取表情包
2021-09-11
Python爬蟲
鬥圖？教你用Python製作表情包
2019-01-29
Python
爬蟲 Scrapy框架爬取圖蟲圖片並下載
2018-08-27
爬蟲框架
pip和conda下載包到本地並安裝
2024-11-16
Java爬蟲爬取bing必應每日一圖背景圖下載到本地(HttpClient+Jsoup+Jackson)
2020-10-20
Java爬蟲HTTPclientJS
Python爬取鬥圖啦，媽媽再也不會擔心我無圖可刷了
2019-03-07
Python
利用python爬取丁香醫生上新型肺炎資料，並下載到本地，附帶經緯度資訊
2020-02-07
Python
網路爬蟲---從千圖網爬取圖片到本地
2019-09-03
爬蟲
python入門012～使用requests爬取網路圖片並儲存到本地
2021-09-09
Python
使用Scrapy爬取圖片入庫,並儲存在本地
2019-06-27
js實現canvas儲存圖片為png格式並下載到本地
2018-05-22
JSCanvas
Android 下載Zip檔案，並解壓到本地
2022-04-15
Android
Python實時爬取鬥魚彈幕
2019-01-22
Python
Java爬取並下載酷狗TOP500歌曲
2019-01-03
Java
python 爬取飄花電影下載地址
2020-11-22
Python
python爬取網圖
2019-10-15
Python
有什麼製作軟體可以製作QQ鬥圖表情包
2018-11-19
[Python]爬蟲獲取知乎某個問題下所有圖片並去除水印
2021-09-20
Python爬蟲
Python爬蟲全網搜尋並下載音樂
2021-02-14
Python爬蟲
html2canvas擷取圖片並下載
2024-11-22
HTMLCanvas
程式設計師鬥圖時最愛用哪些表情包？拿走不謝！
2018-07-16
程式設計師
使用C#爬取快手作者主頁，並下載影片/圖集(附原始碼及軟體下載連結)
2024-08-25
C#原始碼
linux yum下載依賴包到本地，不進行安裝
2024-12-01
Linux
python 爬蟲下載百度美女圖片
2024-04-18
Python爬蟲
將libc database下載到本地
2024-04-07
Database
下載、安裝Git並複製GitHub專案到本地的流程
2024-02-06
Github
python爬取股票最新資料並用excel繪製樹狀圖
2021-02-28
PythonExcel
python下載包（pycharm）
2024-03-26
PythonPyCharm
前端js儲存頁面為圖片下載到本地
2020-10-27
前端JS
Python爬蟲—爬取某網站圖片
2020-11-19
Python爬蟲網站
爬蟲新手入門實戰專案（爬取筆趣閣小說並下載）
2019-05-09
爬蟲
第二彈！python爬蟲批量下載高清大圖
2019-10-06
Python爬蟲
使用Python爬蟲實現自動下載圖片
2021-09-11
Python爬蟲
鬥圖神器–純前端實現視訊轉GIF製作表情包（已開源）
2019-01-06
前端
本地HTML中圖片下載
2018-08-25
HTML

python爬取鬥圖啦表情包並下載到本地

開發流程解析

第一步:需要通過request獲取頁面的原始碼

第二步:分析頁面結構

相關文章