處理JS分頁載入的網頁_recv

wanghandou發表於2017-10-28

# # shark-pager-next
# # h3 class:ellipsis
# # span class:dy-num fr
# # shark-pager-disable-next
from selenium import webdriver
from bs4  import BeautifulSoup as bs
import unittest
class douyu(unittest.TestCase):
	#初始化方法
	def setUp(self):
		self.driver=webdriver.PhantomJS()
		self.count=0
	#測試方法必須有text字樣開頭
	def testdouyu(self):
		self.driver.get("https://www.douyu.com/directory/all")
		while True:
			soup=bs(self.driver.page_source,"lxml")
			#房間名，返回列表
			names=soup.find_all("h3",{"class":"ellipsis"})
			#觀眾人數，返回列表
			numbers=soup.find_all("span",{"class":"dy-num fr"})
			#zip(names,numbers)將names和numbers這兩個列表合併為一個元組:[(1,2),(3,4)....]
			for name,number in zip(names,numbers):
				print ("觀眾人數: "+number.get_text().strip()+"  "+"\t房間名: "+name.get_text().strip()).encode("gb18030")
				self.count=self.count+1
			#如果在頁面上原始碼裡面找到“下一頁”為隱藏的標籤，就退出迴圈（因為“下一頁”就按不動例如）
			if self.driver.page_source.find("shark-pager-disable-next")!=-1:
				break;
			#一直點選下一頁
			self.driver.find_element_by_class_name("shark-pager-next").click()
	#測試結束執行的方法
	def tearDown(self):
		print u"此網站的視訊"+str(self.count)
		#退出PhantomJS瀏覽器
		self.driver.quit()
if __name__=="__main__":
	unittest.main()

爬鬥魚頁面上每個房間，和每個房間的訪問人數。每次按下一頁的時候都要得到

想獲取JS載入網頁的源網頁的原始碼，不想獲取JS載入後的資料
2024-04-10
JS網頁原始碼
Spring專案處理分頁（邏輯和物理分頁）
2020-09-27
Spring
js 進入頁面載入的方法
2020-11-12
JS
一種實現 MediaWiki 分頁面載入 JS 的思路
2024-08-29
JS
處理分頁的result型別問題
2020-04-04
型別
關於 groupBy 分組查詢的分頁處理
2019-11-27
thinkPHP 分頁後如何處理資料
2024-03-06
PHP
thinkphp5 分頁資料物件的處理
2018-05-22
PHP物件
微信小程式分頁載入
2019-03-01
微信小程式
Nodejs專案網頁圖示的處理
2018-04-16
NodeJS網頁
如何完美地處理JavaScript渲染頁面中的非同步載入？
2023-10-12
JavaScript非同步
網頁效能優化之非同步載入js檔案
2018-10-22
網頁優化非同步JS
小程式列表頁上滑載入更多配合 Laravel 分頁
2020-07-05
Laravel
大量資料如何做分頁處理
2024-04-10
Laravel 專案偽靜態分頁處理
2019-12-31
Laravel
DRF 過濾排序分頁異常處理
2022-04-07
排序
JS 頁面載入過程問題
2020-11-22
JS
Spring Boot GraphQL 實戰 03_分頁、全域性異常處理和非同步載入
2021-01-13
Spring Boot非同步
Django來敲門~第一部分【8.網頁中的css/js/image處理
2021-09-09
Django網頁CSSJS
DRF之過濾排序分頁異常處理
2021-07-11
排序
SyntaxHighlighter 頁面動態js載入方式整理
2019-05-11
JS
Android Paging分頁庫的學習（一）—— 結合本地資料進行分頁載入
2018-10-22
Android
bug處理--antdesign中umi升級後無法載入子頁面
2024-07-21
001.01 一般網頁爬蟲處理
2019-08-06
網頁爬蟲
簡單的網頁登入頁面
2024-04-10
網頁
Android Paging分頁庫的學習（二）—— 結合Room資料庫進行分頁載入
2018-10-22
AndroidOOM資料庫
S/4HANA for Customer Management裡的搜尋分頁處理
2018-03-31
layui 資料表格重新載入資料分頁器回到第一頁
2020-09-24
UI
Vue 網站首頁載入優化
2020-10-10
Vue網站優化
網頁載入CAD圖紙的兩個方案
2021-05-18
網頁
js操作網頁中的元素
2019-01-06
JS網頁
iOS 中使用 protocol 來重構分頁載入
2018-06-05
iOSProtocol
分頁練習-網頁開發常用
2024-07-24
網頁
steam頁面載入錯誤怎麼辦 steam無法載入網頁118win10
2022-01-24
網頁Win10
列印網頁的時候，如何讓指定的元素另起一頁（列印分頁）？
2024-12-05
網頁
網頁特效,網頁模板,pdf下載 - IT書包
2019-05-11
網頁特效
用js修改網頁中的js檔案
2024-10-25
JS網頁
001.01 一般網頁爬蟲處理範例
2019-08-06
網頁爬蟲
windows商店無法載入頁面怎麼解決微軟應用商店無法載入處理方法
2020-09-03
Windows微軟

處理JS分頁載入的網頁_recv

相關文章