爬蟲小專案

PT、小小馬發表於2019-05-10

原文網址 : https://blog.csdn.net/qq_44862918/article/details/90084450

#對豆瓣讀書中的管理標籤下的內容進行輸出
#使用程式導向的方式進行爬取
import requests
import time
from lxml import html
headers = {
'User-Agent':'Mozilla/5.0 (Windows NT 6.2) AppleWebKit/535.11 (KHTML, like Gecko) Chrome/17.0.963.12 Safari/535.11'
}
for i in range(0,990,20):
    v = 0
    #在原地址中只有一個%號，由於我們的佔位符中也有%，導致程式以為它是轉移符，所以我們要使用兩個%%解決這個問題
    url = 'https://book.douban.com/tag/%%E7%%AE%%A1%%E7%%90%%86?start=%s&type=T'%i
    # print(url)
    res = requests.get(url=url,headers=headers)
    etree = html.etree
    cont = etree.HTML(res.text)
    s1 = cont.xpath("//div[@class='info']/h2/a/text()")
    s1_con = [i.strip() for i in s1 if i.strip() != '']
    s2 = cont.xpath("//div[@class='info']/div[@class='pub']/text()")
    s2_con = [j.strip() for j in s2 if j.strip() != '']
    s3 = cont.xpath("//div[@class='star clearfix']/span[@class='rating_nums']/text()")
    s4 = cont.xpath("//div[@class='star clearfix']/span[@class='pl']/text()")
    s4_con = [z.strip() for z in s4 if z.strip() != '']
    s5 = cont.xpath("//p/text()")
    del s5[:2]
    del s5[-2:]
    for i1, i2, i3, i4, i5 in zip(s1_con, s2_con, s3, s4_con, s5):
        content = '書名：%s\n作者及出版社：%s\n豆瓣評分：%s\n評價數：%s\n作品簡介：%s\n\n' % (i1, i2, i3, i4, i5)
        #print('書名：%s\n作者及出版社：%s\n豆瓣評分：%s\n評價數：%s\n作品簡介：%s\n\n' % (i1, i2, i3, i4, i5))
        files = open('doubantotal_codes.txt', 'a', encoding='utf8')
        files.write(content)
        files.close()
        # print('列印中')
        v += 1
        print(v)
        time.sleep(0.1)

爬蟲專案
2019-06-07
爬蟲
python爬蟲實操專案_Python爬蟲開發與專案實戰 1.6 小結
2021-02-04
Python爬蟲
【爬蟲】爬蟲專案推薦 / 思路
2020-04-21
爬蟲
Python網路爬蟲實戰小專案
2021-04-12
Python爬蟲
Python爬蟲小專案：爬一個圖書網站
2018-11-21
Python爬蟲網站
爬蟲專案部署
2018-04-03
爬蟲
奇伢爬蟲專案
2018-10-08
爬蟲
爬蟲專案總結
2020-08-31
爬蟲
scrapyd 部署爬蟲專案
2018-03-22
爬蟲
網路爬蟲專案
2022-01-29
爬蟲
送給Python小白學習爬蟲的小專案
2020-04-12
Python爬蟲
Java 爬蟲專案實戰之爬蟲簡介
2018-11-24
Java爬蟲
python爬蟲初探--第一個python爬蟲專案
2018-05-18
Python爬蟲
Python網路爬蟲實戰專案大全 32個Python爬蟲專案demo
2019-04-24
Python爬蟲
python爬蟲小專案--飛常準航班資訊爬取variflight（上）
2019-03-23
Python爬蟲
爬蟲實戰專案集合
2019-02-28
爬蟲
網路爬蟲（python專案）
2018-12-04
爬蟲Python
100爬蟲專案遷移
2018-09-19
爬蟲
gerapy框架爬蟲專案部署
2018-09-27
框架爬蟲
爬蟲專案實戰（一）
2020-06-15
爬蟲
專案－－python網路爬蟲
2020-08-15
Python爬蟲
爬蟲的例項專案
2019-04-26
爬蟲
爬蟲實戰專案合集
2022-01-25
爬蟲
Python爬蟲教程-31-建立 Scrapy 爬蟲框架專案
2018-09-04
Python爬蟲框架
python爬蟲例項專案大全-GitHub 上有哪些優秀的 Python 爬蟲專案？
2020-10-30
Python爬蟲Github
python爬蟲-33個Python爬蟲專案實戰(推薦)
2020-10-28
Python爬蟲
精通Scrapy網路爬蟲【一】第一個爬蟲專案
2021-06-19
爬蟲
最新《30小時搞定Python網路爬蟲專案實戰》
2020-02-18
Python爬蟲
企業資料爬蟲專案
2018-10-05
爬蟲
Java爬蟲專案環境搭建
2018-09-18
Java爬蟲
中科院爬蟲完整專案
2018-07-10
爬蟲
32個Python爬蟲專案demo
2018-08-26
Python爬蟲
爬蟲專案:大麥網分析
2019-08-22
爬蟲
Python爬蟲開源專案合集
2020-06-04
Python爬蟲
github上的python爬蟲專案_GitHub - ahaharry/PythonCrawler: 用python編寫的爬蟲專案集合
2022-02-18
GithubPython爬蟲
（python）爬蟲----八個專案帶你進入爬蟲的世界
2021-07-17
Python爬蟲
爬蟲新手入門實戰專案（爬取筆趣閣小說並下載）
2019-05-09
爬蟲
資料分析專案（一）——爬蟲篇
2018-11-30
爬蟲

爬蟲小專案

相關文章