爬取知乎單個網頁問題和回答
# -*- coding: utf-8 -*-
import urllib
import urllib.request
from bs4 import BeautifulSoup
url=''
request = urllib.request.Request(url)
response = urllib.request.urlopen(url)
page = response.read().decode('utf-8')
soup = BeautifulSoup(page,'html5lib')
# 問題是什麼
question = soup.find_all('h2')[0]
print(question.find('span').string)
# 贊最多的回答
all_answer = soup.find_all('div',class_='zm-item-answer zm-item-expanded')
goodAnswer = 0
bestAnswer = 0
for answer in all_answer:
goodAnswer = answer.find('span',class_='count').string
#if(goodAnswer > bestAnswer):
# bestAnswer = goodAnswer
answerText = answer.find('div',class_='zm-editable-content clearfix')
print(goodAnswer +' '+ answerText.text[:10].replace('n',''))
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/4822/viewspace-2798422/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- Python網路爬蟲實戰:爬取知乎話題下 18934 條回答資料Python爬蟲
- [Python]爬蟲獲取知乎某個問題下所有圖片並去除水印Python爬蟲
- 爬蟲——網頁爬取方法和網頁解析方法爬蟲網頁
- 使用ChatGPT人工智慧回答國外知乎Stack Overflow上問題?ChatGPT人工智慧
- scrapy實戰專案(簡單的爬取知乎專案)
- python爬蟲爬取網頁中文亂碼問題的解決Python爬蟲網頁
- python爬蟲如何爬知乎的話題?Python爬蟲
- Python爬蟲新手教程: 知乎文章圖片爬取器Python爬蟲
- 60行程式碼爬取知乎神回覆行程
- 新手爬蟲教程:Python爬取知乎文章中的圖片爬蟲Python
- 分散式爬蟲之知乎使用者資訊爬取分散式爬蟲
- 爬取網頁文章網頁
- node:爬蟲爬取網頁圖片爬蟲網頁
- 爬蟲:HTTP請求與HTML解析(爬取某乎網站)爬蟲HTTPHTML網站
- ferret 爬取動態網頁網頁
- Puppeteer爬取網頁資料網頁
- 關於python爬取網頁Python網頁
- java 爬取網頁內容。 標題、圖片等Java網頁
- 「譯」如何用 Node.Js 和 Puppeteer 爬取網頁Node.js網頁
- python爬取網頁詳細教程Python網頁
- 知乎高贊:拼多多和國家電網,選哪個?
- 面試官:你能回答這兩個簡單的問題嗎面試
- 60行程式碼爬取知乎“神回覆”,句句戳中淚點行程
- 不會Python爬蟲?教你一個通用爬蟲思路輕鬆爬取網頁資料Python爬蟲網頁
- Node JS爬蟲:爬取瀑布流網頁高清圖JS爬蟲網頁
- seo-mask -- 為單頁應用建立一個適合蜘蛛爬取的seo網站網站
- 爬取子頁
- 如何使用python進行網頁爬取?Python網頁
- 如何使用Python讀取文字檔案並回答問題?Python
- 知乎問題:如何說服技術老大用 Redis ?Redis
- 一起學爬蟲——使用Beautiful Soup爬取網頁爬蟲網頁
- 基於React+Mobx類知乎文章方面的單頁應用React
- 我們從爬取1000億個網頁中學到了什麼?網頁
- 網頁用python爬取後如何解析網頁Python
- Python爬取網頁的所有內外鏈Python網頁
- 手機版python爬取網頁書籍Python網頁
- 王俊涵回答問題
- 用PYTHON爬蟲簡單爬取網路小說Python爬蟲