爬蟲練習——爬取縱橫中文網

?avoid發表於2020-10-19

原文網址 : https://blog.csdn.net/W947666/article/details/109154123

爬蟲練習——爬取縱橫中文網

import requests,os                                                          #匯入模組
from lxml import etree
ress = requests.get('http://book.zongheng.com/store.html')                  #縱橫中文的書庫
html = etree.HTML(ress.text)                                                #轉譯
db = html.xpath('//div[@class="bookname"]/a/@href')                         #篩選書庫書的連結


for a in range(3):                                                          #迴圈前3本小說原始碼
    res0 = requests.get(db[a])
    html0 = etree.HTML(res0.text)
    qian = html0.xpath('//a[@class="all-catalog"]')                         #篩選網頁中的目錄連結
    qian = qian[0].xpath('./@href')
    qians = html0.xpath('//div[@class="book-name"]')[0]
    qians = qians.text.replace('\r\n','').replace(' ','')
    print(qians)
    if os.path.exists(qians):
        pass
    else:
        os.mkdir(qians)



    res1 = requests.get(qian[0])                                              #進入小說目錄
    html1= etree.HTML(res1.text)
    for b in range(0,len(html1.xpath('//li[@class=" col-4"]/a'))):
        ml=html1.xpath('//li[@class=" col-4"]/a')[b]                       #篩選目錄的每個單章連結
        danz=ml.xpath('./@href')[0]


        res2=requests.get(danz)                                                 #小說單章
        html2=etree.HTML(res2.text)
        shum=html2.xpath('//div[@class="title_txtbox"]')[0]                     #單章題目
        shum=qians+'\\'+shum.text+'.txt'
        dz=''
        for i in range(0,len(html2.xpath('//div/p'))):                          #迴圈匯出

            dz=dz+html2.xpath('//div/p')[i].text
        f = open(shum,'w',encoding='utf-8')                           #建立txt
        f.write(dz)                                                    #內容存入

作為剛入門的小白第一次寫部落格，只上傳了程式碼。

爬蟲學習筆記：練習爬取多頁天涯帖子
2019-02-16
爬蟲筆記
爬蟲練習--草稿
2018-04-27
爬蟲
python爬蟲---網頁爬蟲，圖片爬蟲，文章爬蟲，Python爬蟲爬取新聞網站新聞
2019-01-04
Python爬蟲網頁網站
python爬蟲練習--爬取虎牙主播原畫視訊
2020-11-28
Python爬蟲
Python爬蟲訓練：爬取酷燃網視訊資料
2020-10-23
Python爬蟲
【Python學習】爬蟲爬蟲爬蟲爬蟲~
2018-05-03
Python爬蟲
python爬蟲爬取網頁中文亂碼問題的解決
2024-11-17
Python爬蟲網頁
node：爬蟲爬取網頁圖片
2019-02-16
爬蟲網頁
Python爬蟲—爬取某網站圖片
2020-11-19
Python爬蟲網站
【Python爬蟲】正則爬取趕集網
2020-12-24
Python爬蟲
爬蟲——網頁爬取方法和網頁解析方法
2020-12-07
爬蟲網頁
python網路爬蟲--爬取淘寶聯盟
2018-07-17
Python爬蟲
爬蟲之股票定向爬取
2018-12-06
爬蟲
爬蟲搭建代理池、爬取某網站影片案例、爬取新聞案例
2023-03-16
爬蟲網站
爬蟲第二篇縱觀
2024-04-25
爬蟲
python爬蟲學習01--電子書爬取
2020-07-13
Python爬蟲
Node JS爬蟲：爬取瀑布流網頁高清圖
2018-05-17
JS爬蟲網頁
Python爬蟲實踐--爬取網易雲音樂
2022-02-15
Python爬蟲
用PYTHON爬蟲簡單爬取網路小說
2021-09-11
Python爬蟲
Python爬蟲入門【9】：圖蟲網多執行緒爬取
2019-07-31
Python爬蟲執行緒
爬蟲爬取微信小程式
2019-02-16
爬蟲微信小程式
Java爬蟲批量爬取圖片
2021-09-24
Java爬蟲
如何合理控制爬蟲爬取速度？
2022-06-02
爬蟲
網路爬蟲---從千圖網爬取圖片到本地
2019-09-03
爬蟲
python爬蟲練習之爬取豆瓣讀書所有標籤下的書籍資訊
2018-07-23
Python爬蟲
不會Python爬蟲？教你一個通用爬蟲思路輕鬆爬取網頁資料
2019-01-08
Python爬蟲網頁
網路爬蟲——爬蟲實戰（一）
2022-01-29
爬蟲
一起學爬蟲——使用Beautiful Soup爬取網頁
2018-11-26
爬蟲網頁
python例項，python網路爬蟲爬取大學排名!
2018-11-20
Python爬蟲
【爬蟲】專案篇-使用selenium爬取大魚潮汐網
2024-04-05
爬蟲
Python爬蟲入門【3】：美空網資料爬取
2019-07-30
Python爬蟲
Python使用多程式提高網路爬蟲的爬取速度
2019-02-01
Python爬蟲
如何用Python網路爬蟲爬取網易雲音樂歌曲
2018-04-27
Python爬蟲
python 爬蟲爬取 learnku 精華文章
2020-04-17
Python爬蟲
Java爬蟲-爬取疫苗批次資訊
2024-06-03
Java爬蟲
提高爬蟲爬取效率的辦法
2022-04-06
爬蟲
爬蟲---xpath解析（爬取美女圖片）
2020-12-23
爬蟲
Python爬蟲教程-13-爬蟲使用cookie爬取登入後的頁面(人人網)（下）
2018-09-06
Python爬蟲Cookie

爬蟲練習——爬取縱橫中文網

相關文章