python爬取知乎專欄文章標題及URL
# -*- coding:utf-8 -*-
from selenium import webdriver
import time
# 執行程式要安裝selenium模組,並下載Chrome瀏覽器驅動
driver = webdriver.Chrome()
driver.get('https://zhuanlan.zhihu.com/buzhisuowei') # 專欄地址
# 將滾動條拉到頁面最底部,使頁面載入全部文章
i = 0
while(i < 10): #當文章數量多時,把10變大一些
driver.execute_script("window.scrollBy(0,5000)")
time.sleep(2)
i += 1
# 通過class name找到所有文章的標題
titles = driver.find_elements_by_class_name('PostListItem-title')
print(len(titles))
j = 1
xpath_1 = '//*[@id="react-root"]/div/div/div[3]/div[2]/div[2]/ul/li['
xpath_2 = ']/div/div/a'
while(j <= 17): #專欄文章數量
# 通過 xpath 找到所有文章的url
xpath = xpath_1 + str(j) + xpath_2
url = driver.find_element_by_xpath(xpath).get_property('href')
# 列印資訊
print url + titles[j-1].text
j += 1
相關文章
- Python爬蟲新手教程: 知乎文章圖片爬取器Python爬蟲
- 新手爬蟲教程:Python爬取知乎文章中的圖片爬蟲Python
- python爬蟲如何爬知乎的話題?Python爬蟲
- python 爬蟲 爬取 learnku 精華文章Python爬蟲
- 爬蟲作業03-爬取解密大資料專欄下的所有文章爬蟲解密大資料
- 光棍節專題:python程式設計師如何爬取知乎使用者找女朋友Python程式設計師
- scrapy實戰專案(簡單的爬取知乎專案)
- 爬取知乎單個網頁問題和回答網頁
- Python網路爬蟲實戰:爬取知乎話題下 18934 條回答資料Python爬蟲
- 最全知乎專欄合集:程式設計、python、爬蟲、資料分析、挖掘、ML、NLP、DL...程式設計Python爬蟲
- Python爬蟲學習筆記(1)爬取知乎使用者資訊Python爬蟲筆記
- python 爬蟲之獲取標題和連結Python爬蟲
- python爬蟲專案(新手教程)之知乎(requests方式)Python爬蟲
- [Python]爬蟲獲取知乎某個問題下所有圖片並去除水印Python爬蟲
- python 爬蟲——登入知乎Python爬蟲
- 爬取網頁文章網頁
- Vue3.0+TS仿知乎專欄Vue
- 分散式爬蟲之知乎使用者資訊爬取分散式爬蟲
- 爬蟲專案(一)爬蟲+jsoup輕鬆爬知乎爬蟲JS
- PHP 爬蟲爬取社群文章內容PHP爬蟲
- Python3 大型網路爬蟲實戰 002 --- scrapy 爬蟲專案的建立及爬蟲的建立 --- 例項:爬取百度標題和CSDN部落格Python爬蟲
- 60行程式碼爬取知乎神回覆行程
- python爬蟲---網頁爬蟲,圖片爬蟲,文章爬蟲,Python爬蟲爬取新聞網站新聞Python爬蟲網頁網站
- 網路爬蟲——專案實戰(爬取糗事百科所有文章)爬蟲
- Java爬取先知論壇文章Java
- Python爬蟲實戰案例-爬取幣世界標紅快訊Python爬蟲
- Python多執行緒爬取知乎獲贊過千的答案連結Python執行緒
- Scrapy爬蟲 - 獲取知乎使用者資料爬蟲
- Python爬蟲之模擬知乎登入Python爬蟲
- Python 招聘資訊爬取及視覺化Python視覺化
- python 爬取指定url的ICP備案資訊(結構化抓取)Python
- 做了個知乎專欄小程式版,分享給大家
- 爬取微信公眾號文章工具
- 【php爬蟲】百萬級別知乎使用者資料爬取與分析PHP爬蟲
- PHP爬蟲:百萬級別知乎使用者資料爬取與分析PHP爬蟲
- [python 爬蟲]第一個Python爬蟲,爬取某個新浪部落格所有文章並儲存為doc文件Python爬蟲
- 使用jquery獲取url及url引數的方法jQuery
- 通過文章獲得的贊同數爬取、過濾“掘金”中的文章(python Web)PythonWeb