python爬取知乎專欄文章標題及URL
# -*- coding:utf-8 -*-
from selenium import webdriver
import time
# 執行程式要安裝selenium模組,並下載Chrome瀏覽器驅動
driver = webdriver.Chrome()
driver.get('https://zhuanlan.zhihu.com/buzhisuowei') # 專欄地址
# 將滾動條拉到頁面最底部,使頁面載入全部文章
i = 0
while(i < 10): #當文章數量多時,把10變大一些
driver.execute_script("window.scrollBy(0,5000)")
time.sleep(2)
i += 1
# 通過class name找到所有文章的標題
titles = driver.find_elements_by_class_name('PostListItem-title')
print(len(titles))
j = 1
xpath_1 = '//*[@id="react-root"]/div/div/div[3]/div[2]/div[2]/ul/li['
xpath_2 = ']/div/div/a'
while(j <= 17): #專欄文章數量
# 通過 xpath 找到所有文章的url
xpath = xpath_1 + str(j) + xpath_2
url = driver.find_element_by_xpath(xpath).get_property('href')
# 列印資訊
print url + titles[j-1].text
j += 1
相關文章
- Python爬蟲新手教程: 知乎文章圖片爬取器Python爬蟲
- 新手爬蟲教程:Python爬取知乎文章中的圖片爬蟲Python
- python爬蟲如何爬知乎的話題?Python爬蟲
- Python網路爬蟲實戰:爬取知乎話題下 18934 條回答資料Python爬蟲
- scrapy實戰專案(簡單的爬取知乎專案)
- 爬取知乎單個網頁問題和回答網頁
- python爬蟲專案(新手教程)之知乎(requests方式)Python爬蟲
- [Python]爬蟲獲取知乎某個問題下所有圖片並去除水印Python爬蟲
- Vue3.0+TS仿知乎專欄Vue
- python 爬蟲 爬取 learnku 精華文章Python爬蟲
- 60行程式碼爬取知乎神回覆行程
- 分散式爬蟲之知乎使用者資訊爬取分散式爬蟲
- python 爬蟲之獲取標題和連結Python爬蟲
- 做了個知乎專欄小程式版,分享給大家
- 用python爬取知識星球Python
- Python爬蟲抓取知乎所有使用者資訊Python爬蟲
- 爬取網頁文章網頁
- Vue3.0(正式版) + TS 仿知乎專欄企業級專案Vue
- LevelDB專欄文章索引索引
- python爬蟲---網頁爬蟲,圖片爬蟲,文章爬蟲,Python爬蟲爬取新聞網站新聞Python爬蟲網頁網站
- 60行程式碼爬取知乎“神回覆”,句句戳中淚點行程
- 爬取部落格園文章
- Python 爬蟲 + 人臉檢測 —— 知乎高顏值圖片抓取Python爬蟲
- 網路爬蟲——專案實戰(爬取糗事百科所有文章)爬蟲
- 自動化釋出文章到知乎的探索
- Java爬取先知論壇文章Java
- Python爬蟲實戰案例-爬取幣世界標紅快訊Python爬蟲
- 爬蟲:HTTP請求與HTML解析(爬取某乎網站)爬蟲HTTPHTML網站
- [python爬蟲] selenium爬取區域性動態重新整理網站(URL始終固定)Python爬蟲網站
- 使用知乎的介面給字串打標籤字串
- Python爬蟲百度新聞標題Python爬蟲
- Python 爬蟲進階篇-利用beautifulsoup庫爬取網頁文章內容實戰演示Python爬蟲網頁
- 【爬蟲】利用Python爬蟲爬取小麥苗itpub部落格的所有文章的連線地址(1)爬蟲Python
- python 爬蟲之requests爬取頁面圖片的url,並將圖片下載到本地Python爬蟲
- 輸入文章標題
- Qt隱藏系統標題欄,使用自定義標題欄QT
- java 爬取網頁內容。 標題、圖片等Java網頁
- 新人報導,咋把文章弄成專欄?沒找到專欄入口啊
- 爬取微信公眾號文章工具