爬取知乎單個網頁問題和回答
# -*- coding: utf-8 -*-
import urllib
import urllib.request
from bs4 import BeautifulSoup
url=''
request = urllib.request.Request(url)
response = urllib.request.urlopen(url)
page = response.read().decode('utf-8')
soup = BeautifulSoup(page,'html5lib')
# 問題是什麼
question = soup.find_all('h2')[0]
print(question.find('span').string)
# 贊最多的回答
all_answer = soup.find_all('div',class_='zm-item-answer zm-item-expanded')
goodAnswer = 0
bestAnswer = 0
for answer in all_answer:
goodAnswer = answer.find('span',class_='count').string
#if(goodAnswer > bestAnswer):
# bestAnswer = goodAnswer
answerText = answer.find('div',class_='zm-editable-content clearfix')
print(goodAnswer +' '+ answerText.text[:10].replace('n',''))
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/4822/viewspace-2798422/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- Python網路爬蟲實戰:爬取知乎話題下 18934 條回答資料Python爬蟲
- 爬蟲——網頁爬取方法和網頁解析方法爬蟲網頁
- python爬蟲爬取網頁中文亂碼問題的解決Python爬蟲網頁
- [Python]爬蟲獲取知乎某個問題下所有圖片並去除水印Python爬蟲
- 爬取網頁文章網頁
- 使用ChatGPT人工智慧回答國外知乎Stack Overflow上問題?ChatGPT人工智慧
- python爬取知乎專欄文章標題及URLPython
- node:爬蟲爬取網頁圖片爬蟲網頁
- scrapy實戰專案(簡單的爬取知乎專案)
- ferret 爬取動態網頁網頁
- Puppeteer爬取網頁資料網頁
- 爬取js渲染過的頁面(爬取一個婚慶網站為例)JS網站
- java 爬取網頁內容。 標題、圖片等Java網頁
- 面試官:你能回答這兩個簡單的問題嗎面試
- 「譯」如何用 Node.Js 和 Puppeteer 爬取網頁Node.js網頁
- python爬蟲如何爬知乎的話題?Python爬蟲
- 分散式爬蟲之知乎使用者資訊爬取分散式爬蟲
- 爬取多個頁面的資料
- 關於python爬取網頁Python網頁
- Python爬蟲新手教程: 知乎文章圖片爬取器Python爬蟲
- 60行程式碼爬取知乎神回覆行程
- python爬取網頁詳細教程Python網頁
- seo-mask -- 為單頁應用建立一個適合蜘蛛爬取的seo網站網站
- 讀程式回答問題
- 16個經典面試問題及回答思路面試
- Delphi自動提交網頁表單和獲取框架網頁原始碼網頁框架原始碼
- 不會Python爬蟲?教你一個通用爬蟲思路輕鬆爬取網頁資料Python爬蟲網頁
- 新手爬蟲教程:Python爬取知乎文章中的圖片爬蟲Python
- 一起學爬蟲——使用Beautiful Soup爬取網頁爬蟲網頁
- Node JS爬蟲:爬取瀑布流網頁高清圖JS爬蟲網頁
- Scrapy爬蟲 - 獲取知乎使用者資料爬蟲
- Request模組實戰01 ---簡單爬取頁面
- 如何使用python進行網頁爬取?Python網頁
- python初學-爬取網頁資料Python網頁
- 如何使用Python讀取文字檔案並回答問題?Python
- 用PYTHON爬蟲簡單爬取網路小說Python爬蟲
- Oracle面試常見的二十個問題及回答Oracle面試
- 閱讀程式回答問題