python爬取知乎專欄文章標題及URL

不負長風發表於2017-12-21

# -*- coding:utf-8 -*-
from selenium import webdriver
import time

# 執行程式要安裝selenium模組，並下載Chrome瀏覽器驅動
driver = webdriver.Chrome()
driver.get('https://zhuanlan.zhihu.com/buzhisuowei')                           # 專欄地址

# 將滾動條拉到頁面最底部，使頁面載入全部文章
i = 0
while(i < 10):                                                  #當文章數量多時，把10變大一些
    driver.execute_script("window.scrollBy(0,5000)")
    time.sleep(2)
    i += 1

# 通過class name找到所有文章的標題
titles = driver.find_elements_by_class_name('PostListItem-title')
print(len(titles))


j = 1
xpath_1 = '//*[@id="react-root"]/div/div/div[3]/div[2]/div[2]/ul/li['
xpath_2 = ']/div/div/a'
while(j <= 17):                                                              #專欄文章數量

    # 通過 xpath 找到所有文章的url
    xpath = xpath_1 + str(j) + xpath_2
    url = driver.find_element_by_xpath(xpath).get_property('href')

    # 列印資訊
    print url + titles[j-1].text
    j += 1

Python爬蟲新手教程：知乎文章圖片爬取器
2019-07-20
Python爬蟲
新手爬蟲教程：Python爬取知乎文章中的圖片
2019-01-17
爬蟲Python
python爬蟲如何爬知乎的話題？
2019-02-16
Python爬蟲
Python網路爬蟲實戰：爬取知乎話題下 18934 條回答資料
2019-01-17
Python爬蟲
scrapy實戰專案（簡單的爬取知乎專案）
2018-05-17
爬取知乎單個網頁問題和回答
2021-09-09
網頁
python爬蟲專案（新手教程）之知乎（requests方式）
2018-06-13
Python爬蟲
[Python]爬蟲獲取知乎某個問題下所有圖片並去除水印
2021-09-20
Python爬蟲
Vue3.0+TS仿知乎專欄
2020-12-21
Vue
python 爬蟲爬取 learnku 精華文章
2020-04-17
Python爬蟲
60行程式碼爬取知乎神回覆
2018-11-15
行程
分散式爬蟲之知乎使用者資訊爬取
2018-08-31
分散式爬蟲
python 爬蟲之獲取標題和連結
2020-11-27
Python爬蟲
做了個知乎專欄小程式版，分享給大家
2019-02-16
用python爬取知識星球
2019-02-16
Python
Python爬蟲抓取知乎所有使用者資訊
2018-03-14
Python爬蟲
爬取網頁文章
2021-09-29
網頁
Vue3.0（正式版） + TS 仿知乎專欄企業級專案
2020-10-03
Vue
LevelDB專欄文章索引
2018-12-15
索引
python爬蟲---網頁爬蟲，圖片爬蟲，文章爬蟲，Python爬蟲爬取新聞網站新聞
2019-01-04
Python爬蟲網頁網站
60行程式碼爬取知乎“神回覆”，句句戳中淚點
2019-03-06
行程
爬取部落格園文章
2020-07-31
Python 爬蟲 + 人臉檢測 —— 知乎高顏值圖片抓取
2020-12-21
Python爬蟲
網路爬蟲——專案實戰（爬取糗事百科所有文章）
2020-02-07
爬蟲
自動化釋出文章到知乎的探索
2021-09-24
Java爬取先知論壇文章
2020-08-12
Java
Python爬蟲實戰案例-爬取幣世界標紅快訊
2019-02-16
Python爬蟲
爬蟲：HTTP請求與HTML解析（爬取某乎網站）
2021-05-19
爬蟲HTTPHTML網站
[python爬蟲] selenium爬取區域性動態重新整理網站（URL始終固定）
2018-04-26
Python爬蟲網站
使用知乎的介面給字串打標籤
2024-11-01
字串
Python爬蟲百度新聞標題
2020-11-29
Python爬蟲
Python 爬蟲進階篇-利用beautifulsoup庫爬取網頁文章內容實戰演示
2020-09-14
Python爬蟲網頁
【爬蟲】利用Python爬蟲爬取小麥苗itpub部落格的所有文章的連線地址（1）
2018-12-26
爬蟲Python
python 爬蟲之requests爬取頁面圖片的url，並將圖片下載到本地
2019-06-12
Python爬蟲
輸入文章標題
2018-05-09
Qt隱藏系統標題欄，使用自定義標題欄
2020-09-23
QT
java 爬取網頁內容。標題、圖片等
2021-09-24
Java網頁
新人報導，咋把文章弄成專欄？沒找到專欄入口啊
2020-04-20
爬取微信公眾號文章工具
2021-03-31

python爬取知乎專欄文章標題及URL

相關文章