處理JS分頁載入的網頁_recv
# # shark-pager-next
# # h3 class:ellipsis
# # span class:dy-num fr
# # shark-pager-disable-next
from selenium import webdriver
from bs4 import BeautifulSoup as bs
import unittest
class douyu(unittest.TestCase):
#初始化方法
def setUp(self):
self.driver=webdriver.PhantomJS()
self.count=0
#測試方法必須有text字樣開頭
def testdouyu(self):
self.driver.get("https://www.douyu.com/directory/all")
while True:
soup=bs(self.driver.page_source,"lxml")
#房間名,返回列表
names=soup.find_all("h3",{"class":"ellipsis"})
#觀眾人數,返回列表
numbers=soup.find_all("span",{"class":"dy-num fr"})
#zip(names,numbers)將names和numbers這兩個列表合併為一個元組:[(1,2),(3,4)....]
for name,number in zip(names,numbers):
print ("觀眾人數: "+number.get_text().strip()+" "+"\t房間名: "+name.get_text().strip()).encode("gb18030")
self.count=self.count+1
#如果在頁面上原始碼裡面找到“下一頁”為隱藏的標籤,就退出迴圈(因為“下一頁”就按不動例如)
if self.driver.page_source.find("shark-pager-disable-next")!=-1:
break;
#一直點選下一頁
self.driver.find_element_by_class_name("shark-pager-next").click()
#測試結束執行的方法
def tearDown(self):
print u"此網站的視訊"+str(self.count)
#退出PhantomJS瀏覽器
self.driver.quit()
if __name__=="__main__":
unittest.main()
爬鬥魚頁面上每個房間,和每個房間的訪問人數。每次按下一頁的時候都要得到相關文章
- 想獲取JS載入網頁的源網頁的原始碼,不想獲取JS載入後的資料JS網頁原始碼
- Spring專案處理分頁(邏輯和物理分頁)Spring
- js 進入頁面載入的方法JS
- 一種實現 MediaWiki 分頁面載入 JS 的思路JS
- 處理分頁的result型別問題型別
- 關於 groupBy 分組查詢的分頁處理
- thinkPHP 分頁後如何處理資料PHP
- thinkphp5 分頁資料物件的處理PHP物件
- 微信小程式分頁載入微信小程式
- Nodejs專案網頁圖示的處理NodeJS網頁
- 如何完美地處理JavaScript渲染頁面中的非同步載入?JavaScript非同步
- 網頁效能優化之非同步載入js檔案網頁優化非同步JS
- 小程式列表頁上滑載入更多配合 Laravel 分頁Laravel
- 大量資料如何做分頁處理
- Laravel 專案 偽靜態分頁處理Laravel
- DRF 過濾排序分頁異常處理排序
- JS 頁面載入過程問題JS
- Spring Boot GraphQL 實戰 03_分頁、全域性異常處理和非同步載入Spring Boot非同步
- Django來敲門~第一部分【8.網頁中的css/js/image處理Django網頁CSSJS
- DRF之過濾排序分頁異常處理排序
- SyntaxHighlighter 頁面動態js載入方式整理JS
- Android Paging分頁庫的學習(一)—— 結合本地資料進行分頁載入Android
- bug處理--antdesign中umi升級後無法載入子頁面
- 001.01 一般網頁爬蟲處理網頁爬蟲
- 簡單的網頁登入頁面網頁
- Android Paging分頁庫的學習(二)—— 結合Room資料庫進行分頁載入AndroidOOM資料庫
- S/4HANA for Customer Management裡的搜尋分頁處理
- layui 資料表格重新載入資料分頁器回到第一頁UI
- Vue 網站首頁載入優化Vue網站優化
- 網頁載入CAD圖紙的兩個方案網頁
- js操作網頁中的元素JS網頁
- iOS 中使用 protocol 來重構分頁載入iOSProtocol
- 分頁練習-網頁開發常用網頁
- steam頁面載入錯誤怎麼辦 steam無法載入網頁118win10網頁Win10
- 列印網頁的時候,如何讓指定的元素另起一頁(列印分頁)?網頁
- 網頁特效,網頁模板,pdf下載 - IT書包網頁特效
- 用js修改網頁中的js檔案JS網頁
- 001.01 一般網頁爬蟲處理範例網頁爬蟲
- windows商店無法載入頁面怎麼解決 微軟應用商店無法載入處理方法Windows微軟