爬蟲練習——爬取縱橫中文網
爬蟲練習——爬取縱橫中文網
import requests,os #匯入模組
from lxml import etree
ress = requests.get('http://book.zongheng.com/store.html') #縱橫中文的書庫
html = etree.HTML(ress.text) #轉譯
db = html.xpath('//div[@class="bookname"]/a/@href') #篩選書庫書的連結
for a in range(3): #迴圈前3本小說原始碼
res0 = requests.get(db[a])
html0 = etree.HTML(res0.text)
qian = html0.xpath('//a[@class="all-catalog"]') #篩選網頁中的目錄連結
qian = qian[0].xpath('./@href')
qians = html0.xpath('//div[@class="book-name"]')[0]
qians = qians.text.replace('\r\n','').replace(' ','')
print(qians)
if os.path.exists(qians):
pass
else:
os.mkdir(qians)
res1 = requests.get(qian[0]) #進入小說目錄
html1= etree.HTML(res1.text)
for b in range(0,len(html1.xpath('//li[@class=" col-4"]/a'))):
ml=html1.xpath('//li[@class=" col-4"]/a')[b] #篩選目錄的每個單章連結
danz=ml.xpath('./@href')[0]
res2=requests.get(danz) #小說單章
html2=etree.HTML(res2.text)
shum=html2.xpath('//div[@class="title_txtbox"]')[0] #單章題目
shum=qians+'\\'+shum.text+'.txt'
dz=''
for i in range(0,len(html2.xpath('//div/p'))): #迴圈匯出
dz=dz+html2.xpath('//div/p')[i].text
f = open(shum,'w',encoding='utf-8') #建立txt
f.write(dz) #內容存入
作為剛入門的小白第一次寫部落格,只上傳了程式碼。
相關文章
- 爬蟲學習筆記:練習爬取多頁天涯帖子爬蟲筆記
- 爬蟲練習--草稿爬蟲
- python爬蟲---網頁爬蟲,圖片爬蟲,文章爬蟲,Python爬蟲爬取新聞網站新聞Python爬蟲網頁網站
- python爬蟲練習--爬取虎牙主播原畫視訊Python爬蟲
- Python爬蟲訓練:爬取酷燃網視訊資料Python爬蟲
- 【Python學習】爬蟲爬蟲爬蟲爬蟲~Python爬蟲
- python爬蟲爬取網頁中文亂碼問題的解決Python爬蟲網頁
- node:爬蟲爬取網頁圖片爬蟲網頁
- Python爬蟲—爬取某網站圖片Python爬蟲網站
- 【Python爬蟲】正則爬取趕集網Python爬蟲
- 爬蟲——網頁爬取方法和網頁解析方法爬蟲網頁
- python網路爬蟲--爬取淘寶聯盟Python爬蟲
- 爬蟲之股票定向爬取爬蟲
- 爬蟲搭建代理池、爬取某網站影片案例、爬取新聞案例爬蟲網站
- 爬蟲 第二篇 縱觀爬蟲
- python爬蟲學習01--電子書爬取Python爬蟲
- Node JS爬蟲:爬取瀑布流網頁高清圖JS爬蟲網頁
- Python爬蟲實踐--爬取網易雲音樂Python爬蟲
- 用PYTHON爬蟲簡單爬取網路小說Python爬蟲
- Python爬蟲入門【9】:圖蟲網多執行緒爬取Python爬蟲執行緒
- 爬蟲爬取微信小程式爬蟲微信小程式
- Java爬蟲批量爬取圖片Java爬蟲
- 如何合理控制爬蟲爬取速度?爬蟲
- 網路爬蟲---從千圖網爬取圖片到本地爬蟲
- python爬蟲練習之爬取豆瓣讀書所有標籤下的書籍資訊Python爬蟲
- 不會Python爬蟲?教你一個通用爬蟲思路輕鬆爬取網頁資料Python爬蟲網頁
- 網路爬蟲——爬蟲實戰(一)爬蟲
- 一起學爬蟲——使用Beautiful Soup爬取網頁爬蟲網頁
- python例項,python網路爬蟲爬取大學排名!Python爬蟲
- 【爬蟲】專案篇-使用selenium爬取大魚潮汐網爬蟲
- Python爬蟲入門【3】:美空網資料爬取Python爬蟲
- Python使用多程式提高網路爬蟲的爬取速度Python爬蟲
- 如何用Python網路爬蟲爬取網易雲音樂歌曲Python爬蟲
- python 爬蟲 爬取 learnku 精華文章Python爬蟲
- Java爬蟲-爬取疫苗批次資訊Java爬蟲
- 提高爬蟲爬取效率的辦法爬蟲
- 爬蟲---xpath解析(爬取美女圖片)爬蟲
- Python爬蟲教程-13-爬蟲使用cookie爬取登入後的頁面(人人網)(下)Python爬蟲Cookie