簡單的爬蟲：爬取網站內容正文與圖片

wangsys發表於2021-09-09

原文網址 : http://blog.itpub.net/3244/viewspace-2809922/

我們來寫個簡單的爬蟲####

需要用到的模組

需要用到python的urllib和lxml模組，urllib為python的自帶模組，lxml需要自行安裝：

pip install lxml

簡單介紹urllib和lxml的使用

我們使用urllib來爬去一個網頁比如：

In [1]: import urllib

In [2]: # 爬起豆瓣首頁In [3]: html = urllib.urlopen("").read()

In [4]: # 整個html列印出來太多，這裡我們就儲存在檔案中，再檢視In [5]: of = open("db_index.html","w")

In [6]: of.write(html)

In [7]: of.close()

使用lxml主要用於解析網頁(這裡只是簡單示範)，比如：

In [8]: from lxml import etree

In [9]: html = u'
我是標題
哈哈哈哈

來自 “ ITPUB部落格 ” ，連結：http://blog.itpub.net/3244/viewspace-2809922/，如需轉載，請註明出處，否則將追究法律責任。

Python爬蟲—爬取某網站圖片
2020-11-19
Python爬蟲網站
使用正則編寫簡單的爬蟲爬取某網站的圖片
2018-06-06
爬蟲網站
最簡單的網路圖片的爬取 --Pyhon網路爬蟲與資訊獲取
2020-04-04
爬蟲
python爬蟲---網頁爬蟲，圖片爬蟲，文章爬蟲，Python爬蟲爬取新聞網站新聞
2019-01-04
Python爬蟲網頁網站
node：爬蟲爬取網頁圖片
2019-02-16
爬蟲網頁
Java爬蟲批量爬取圖片
2021-09-24
Java爬蟲
網路爬蟲---從千圖網爬取圖片到本地
2019-09-03
爬蟲
爬蟲Selenium+PhantomJS爬取動態網站圖片資訊（Python）
2018-03-24
爬蟲JS網站Python
Python爬蟲爬取B站up主所有動態內容
2024-05-08
Python爬蟲
java 爬取網頁內容。標題、圖片等
2021-09-24
Java網頁
python 爬蟲如何爬取動態生成的網頁內容
2024-10-31
Python爬蟲網頁
爬蟲---xpath解析（爬取美女圖片）
2020-12-23
爬蟲
python 爬蟲 mc 皮膚站 little skin 的簡單爬取
2019-08-02
Python爬蟲
爬蟲 Scrapy框架爬取圖蟲圖片並下載
2018-08-27
爬蟲框架
用PYTHON爬蟲簡單爬取網路小說
2021-09-11
Python爬蟲
【python--爬蟲】千圖網高清背景圖片爬蟲
2019-05-21
Python爬蟲
Python爬蟲入門【5】：27270圖片爬取
2019-07-30
Python爬蟲
go語言實現簡單爬蟲獲取頁面圖片
2022-11-14
Go爬蟲
JB的Python之旅-爬蟲篇-新浪微博內容爬取
2018-06-30
Python爬蟲
爬蟲：HTTP請求與HTML解析（爬取某乎網站）
2021-05-19
爬蟲HTTPHTML網站
Python爬蟲實戰詳解：爬取圖片之家
2020-11-04
Python爬蟲
ScienceDirect內容爬蟲
2021-07-21
爬蟲
Python爬蟲入門教程 2-100 妹子圖網站爬取
2018-12-13
Python爬蟲網站
新手爬蟲教程：Python爬取知乎文章中的圖片
2019-01-17
爬蟲Python
Python網路爬蟲2 - 爬取新浪微博使用者圖片
2018-04-10
Python爬蟲
Python爬蟲入門【4】：美空網未登入圖片爬取
2019-07-30
Python爬蟲
蘇寧易購網址爬蟲爬取商品資訊及圖片
2021-10-12
爬蟲
Python爬蟲新手教程：知乎文章圖片爬取器
2019-07-20
Python爬蟲
Python爬蟲遞迴呼叫爬取動漫美女圖片
2020-10-19
Python爬蟲遞迴
[譯] 如何使用 Python 和 BeautifulSoup 爬取網站內容
2019-02-23
Python網站
爬蟲搭建代理池、爬取某網站影片案例、爬取新聞案例
2023-03-16
爬蟲網站
ReactPHP 爬蟲實戰：下載整個網站的圖片
2019-01-20
ReactPHP爬蟲網站
Python資料爬蟲學習筆記（11）爬取千圖網圖片資料
2018-09-18
Python爬蟲筆記
利用Python爬取攝影網站圖片，切勿商用
2018-12-18
Python網站
爬取愛套圖網上的圖片
2018-03-28
Node JS爬蟲：爬取瀑布流網頁高清圖
2018-05-17
JS爬蟲網頁
簡單的爬蟲程式
2024-03-24
爬蟲
Python 爬蟲進階篇-利用beautifulsoup庫爬取網頁文章內容實戰演示
2020-09-14
Python爬蟲網頁

簡單的爬蟲：爬取網站內容正文與圖片

我們來寫個簡單的爬蟲####

我是標題

相關文章