Python採集某網站內容, m3u8內容下載
import time
import requests # 資料請求模組
import re # 正規表示式模組
import json
import pprint
for page in range(3, 29):
print(f' 正在採集第 {page} 頁的資料 ')
time.sleep(1)
link = '
data = {
'quickViewId': 'ac-space-video-list',
'reqID': page+1,
'ajaxpipe': '1',
'type': 'video',
'order': 'newest',
'page': page,
'pageSize': '20',
't': '1653659024877',
}
headers = {
'referer': ',
'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.4951.54 Safari/537.36'
}
response = requests.get(url=link, params=data, headers=headers)
# pprint.pprint(response.text)
ac_id_list = re.findall('atomid.*?:.*?"(\d+).*?"', response.text)
print(ac_id_list)
for ac_id in ac_id_list:
url = f'{ac_id}'
headers = {
原始碼、解答、資料加 Q 裙: 261823976
'referer': f'{ac_id}',
'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.4951.54 Safari/537.36'
}
response = requests.get(url=url, headers=headers)
title = re.findall('<title >(.*?) - AcFun 彈幕影片網 - 認真你就輸啦 \(\? ω \?\) ノ - \( ゜ - ゜ \) つロ </title>', response.text)[0]
html_data = re.findall('window.pageInfo =跟單網gendan5.com window.videoInfo = (.*?);', response.text)[0]
json_data = json.loads(html_data)
m3u8_url = json.loads(json_data['currentVideoInfo']['ksPlayJson'])['adaptationSet'][0]['representation'][0]['backupUrl'][0]
m3u8_data = requests.get(url=m3u8_url, headers=headers).text
m3u8_data = re.sub('#E.*', '', m3u8_data).split()
print(title)
print(m3u8_url)
# for ts in m3u8_data:
# ts_url = ' + ts
# ts_content = requests.get(url=ts_url, headers=headers).content
# with open('video\\' + title + '.mp4', mode='ab') as f:
# f.write(ts_content)
# print(ts_url)
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69946337/viewspace-2898138/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 國內五大主流網站內容抓取工具/採集軟體大盤點網站
- 網站文章內容修改 如何修改網站文章內容網站
- Laravel 中使用 puppeteer 採集非同步載入的網頁內容Laravel非同步網頁
- 公司網站如何更改內容公司網站如何更改內容資訊網站
- Swift抓取某網站律師內容並做排名篩選Swift網站
- 怎樣修改公司網站內容,公司網站內容更新最佳實踐網站
- 爬取Elastic Stack採集的Nginx內容ASTNginx
- 網站iis怎麼修改網站內容網站
- dedecms網站模板內容修改?網站
- [譯] 如何使用 Python 和 BeautifulSoup 爬取網站內容Python網站
- 網站模板怎麼修改文字內容網站
- 怎麼修改網站內容原始碼網站原始碼
- go之國內下載網站Go網站
- 如何在網站後臺修改,輕鬆管理網站內容網站
- Wordpress網站修改,Wordpress網站內容和設定修改方法網站
- 網站模板的logo框架修改?後臺修改網站內容?網站Go框架
- 怎麼修改自己公司網站內容網站
- 公司網站怎樣替換內容呢網站
- 網站維護內容有哪些方面網站
- 怎麼修改公司的網站內容呢網站
- 網站內容監控工具:Website Watchman for Mac網站WebMac
- eyoucmsPHP企業網站內容管理系統PHP網站
- 如何使用ScrapySharp下載網頁內容網頁
- 網站模板文字內容修改,如何在網站後臺或程式碼編輯器中修改模板文字內容網站
- JS實現將文字或JSON內容下載到檔案中JSON
- python面試內容Python面試
- python基礎內容Python
- 請問公司網站怎樣替換內容網站
- 企業網站代運營服務內容網站
- 網站的原創內容為啥不收錄?網站
- 如何找到適合網站優化的內容?網站優化
- AspPhpCms v10 網站內容管理系統PHP網站
- 如何解決小網站內容管理問題網站
- 網站頁面內的內容結構怎樣佈局才合理?網站
- 網站模板文字內容修改,如何在網站後臺或程式碼編輯器中準確修改模板文字內容網站
- 網際網路內容產業報告:內容付費崛起,優質內容為王產業
- 靜態網站如何修改,輕鬆更新網頁內容網站網頁
- php 網站修改製作,全面更新PHP網站內容和設計PHP網站