一個實現批量抓取淘女郎寫真圖片的爬蟲
淘女郎,也被很多人稱作“網路模特”,就是專門給淘寶、天貓等線上商家拍攝圖片的平面模特。
我們將用Python3和Selenium Webdriver抓取每一個美眉的個人主頁內的寫真圖片,把每一個美眉的寫真圖片按照資料夾儲存到本地。
先說一下網頁爬取的一般步驟:
1.檢視目標網站頁面的原始碼,找到需要爬取的內容
2.用正則或其他如xpath/bs4的工具獲取爬取內容
3.寫出完整的python程式碼,實現爬取過程
檢視網站原始碼,火狐瀏覽器右鍵-檢視原始碼即可獲取:
程式碼編寫的關鍵步驟:
①需要用到的模組
②解析目標網頁的 Html 原始碼
bsObj = BeautifulSoup(driver.page_source, parser)
③用正規表示式獲取美女圖片 imagesUrl = re.findall(`//gtd.alicdn.com/sns_logo.*.jpg`,driver.page_source)
④解析出個人主頁地址等資訊 girlsUrl = bsObj.find_all("a",{"href":re.compile("//.*.htm?(userId=)d*")})
⑤獲取所有美女的圖片url girlsHURL = [(`http:` + i[`href`]) for i in girlsUrl]
⑥判斷路徑資料夾是否建立,如果未建立則建立資料夾儲存圖片
def mkdir(path):
# 判斷路徑是否存在
isExists = os.path.exists(path)
# 判斷結果
if not isExists:
# 如果不存在則建立目錄
print(" [*]新建了資料夾", path)
# 建立目錄操作函式
os.makedirs(path)
else:
# 如果目錄存在則不建立,並提示目錄已存在
print(` [+]資料夾`, path, `已建立`)
if __name__ == `__main__`:
if not os.path.exists(outputDir):
os.makedirs(outputDir)
main()
Python執行檔案後抓取的效果如下圖所示:
原文釋出時間為:2016-11-01
本文來自雲棲社群合作伙伴“Python中文社群”,瞭解相關資訊可以關注“Python中文社群”微信公眾號
相關文章
- Java爬蟲批量爬取圖片Java爬蟲
- 教你如何快速實現一個圖片爬蟲爬蟲
- 一個事件驅動的圖片爬蟲事件爬蟲
- 實戰:如何通過python requests庫寫一個抓取小網站圖片的小爬蟲Python網站爬蟲
- 批量抓取豆瓣電影圖片
- python批量抓取美女圖片Python
- 用雲函式快速實現圖片爬蟲函式爬蟲
- Python 爬蟲 + 人臉檢測 —— 知乎高顏值圖片抓取Python爬蟲
- 京東商品圖片 自動下載 抓取 c# 爬蟲C#爬蟲
- 小小圖片爬蟲爬蟲
- ReactPHP 爬蟲實戰:下載整個網站的圖片ReactPHP爬蟲網站
- 基於RxJava2實現的簡單圖片爬蟲RxJava爬蟲
- 使用Python爬蟲實現自動下載圖片Python爬蟲
- 爬蟲 Scrapy框架 爬取圖蟲圖片並下載爬蟲框架
- 網路爬蟲:使用Scrapy框架編寫一個抓取書籍資訊的爬蟲服務爬蟲框架
- node實現批量修改圖片尺寸
- 【python--爬蟲】千圖網高清背景圖片爬蟲Python爬蟲
- node:爬蟲爬取網頁圖片爬蟲網頁
- 爬蟲---xpath解析(爬取美女圖片)爬蟲
- Python爬蟲實戰詳解:爬取圖片之家Python爬蟲
- java實現一個簡單的爬蟲小程式Java爬蟲
- Python爬蟲: 抓取One網頁上的每日一話和圖Python爬蟲網頁
- Google 爬蟲如何抓取 JavaScript 的?Go爬蟲JavaScript
- go語言實現簡單爬蟲獲取頁面圖片Go爬蟲
- node 爬蟲,使用 Google puppeteer 抓取 One一個 的網頁資料爬蟲Go網頁
- 圖片爬取實戰一
- 用python實現的抓取騰訊視訊所有電影的爬蟲Python爬蟲
- 爬蟲抓取UserAgent問題爬蟲
- Python 爬蟲零基礎教程(1):爬單個圖片Python爬蟲
- Python爬蟲入門教程 18-100 煎蛋網XXOO圖片抓取Python爬蟲
- python爬蟲---網頁爬蟲,圖片爬蟲,文章爬蟲,Python爬蟲爬取新聞網站新聞Python爬蟲網頁網站
- Python3 大型網路爬蟲實戰 003 — scrapy 大型靜態圖片網站爬蟲專案實戰 — 實戰:爬取 169美女圖片網 高清圖片Python爬蟲網站
- Python爬蟲—爬取某網站圖片Python爬蟲網站
- 大規模非同步新聞爬蟲:實現一個同步定向新聞爬蟲非同步爬蟲
- 爬蟲怎麼根據一個關鍵詞爬取上千張網路圖片爬蟲
- 50行爬蟲?️抓取並處理圖靈書目爬蟲圖靈
- 爬蟲原理與資料抓取爬蟲
- Python爬蟲抓取股票資訊Python爬蟲