python+requests爬取B站影片儲存到本地

隐忍沙丘發表於2024-04-30

原文網址 : https://www.cnblogs.com/sprouts/p/18168445

import os
import datetime

from django.test import TestCase

# Create your tests here.

import requests
import re
import json
import subprocess
from concurrent.futures import ThreadPoolExecutor


def download_video(url):
    # file_path = 'django3+drf+Vue3前後端分離/'
    headers = {
        "Cookie": "buvid3=C6ED37CC-DC0F-D1B0-BA82-231C0731E3C971724infoc; b_nut=1698137871; _uuid=xxxx-9398-E7CA-10B95-xxxx; buvid_fp=xxxx; buvid4=xxxx-93C3-xxxx-xxxx-0F1D34771D4274275-023102416-aL0NYo%xxxx%3D%3D; header_theme_version=CLOSE; DedeUserID=345707270; DedeUserID__ckMd5=7506c67cb7588c20; enable_web_push=ENABLE; iflogin_when_web_push=1; CURRENT_FNVAL=4048; rpdid=|(kYRk|Ruuk)0J'uYm)~JRmml; home_feed_column=5; PVID=1; FEED_LIVE_VERSION=V8; browser_resolution=1920-908; SESSDATA=0aff21e1%2C1729848907%2Ca2f88%2A42CjDHEfsdfE5mZ9GMKVTmTqG3aIO7dew8YUpjK9-z7OXOdBOYjXPi4FVQgJEVacJ0UQkSVk4xTGRnLTEzOHF3TDktYlhEa2JDS3ZFV0FfYjlHZ3ctdzhlWlVDZmhpUFZsMEJCSTZtQkxUU1FiRC1IV1pMenVFV1JxcVhCc2sxNEtCemgyY1dtQVZBIIEC; bili_jct=768662980741f061aedc30f722129d8b; sid=7tqiav60; bp_t_offset_345707270=925256601212813351; b_lsid=DBC104B55_18F27B3DA65; share_source_origin=COPY; bsource=share_source_copy_link; hit-dyn-v2=1; bili_ticket=eyJhbGciOiJIUzI1NiIsImtpZCI6InMwMyIsInR5cCI6IkpXVCJ9.eyJleHAiOjE3MTQ2MTczMzMsImlhdCI6MTcxNDM1ODA3MywicGx0IjotMX0.qfWz2oLOuJvDWHCM6Cgwl0SEVjpN6LkOreX8ApoYD4k; bili_ticket_expires=1714617273",
        "Origin": "https://www.bilibili.com",
        "Referer": "https://www.bilibili.com/video/BV1ZR4y1U7Qz?p=2",
        "User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/124.0.0.0 Safari/537.36"
    }

    response = requests.get(url, headers=headers)
    html = response.text
    # print(response.text)
　　# 獲取影片集的名稱作為存放影片的目錄
    file_path = re.findall(r'data-title="(.*?)" title', html)[0].replace(' ', '')
    print(file_path)
    # 檢查目錄是否存在
    if not os.path.exists(file_path):
        # 如果目錄不存在，建立目錄
        os.makedirs(file_path)
        print(f"Directory '{file_path}' created successfully.")
    else:
        print(f"Directory '{file_path}' already exists.")

    file_path = file_path + '/'
　　# 獲取每集影片的名稱作為檔名
    title = re.findall(r'<title data-vue-meta="true">(.*?)_嗶哩嗶哩_bilibili</title>', html)[0].replace(' ', '')
    print(title)
　　# 獲取影片資訊部分
    video_info = re.findall(r'<script>window.__playinfo__=(.*?)</script>', html)[0]
    print(video_info)
    json_data = json.loads(video_info)
　　# 從影片資訊部分提取出影片和音訊的地址(B站的影片和音訊是分開的)
    video_url = json_data['data']['dash']['video'][0]['baseUrl']
    audio_url = json_data['data']['dash']['audio'][0]['baseUrl']
    print(video_url)
    print(audio_url)
　　# 獲取影片和音訊的內容並儲存成avi和mp3檔案
    video_content = requests.get(video_url, headers=headers).content
    audio_content = requests.get(audio_url, headers=headers).content
    with open(file_path + title + '.avi', 'wb') as video:
        video.write(video_content)
    with open(file_path + title + '.mp3', 'wb') as audio:
        audio.write(audio_content)
　　# 使用ffmpeg工具將影片和音訊檔案合併成一個檔案
    cmd = f"ffmpeg -i {file_path}{title}.avi -i {file_path}{title}.mp3 -c:v copy -c:a aac -strict experimental {file_path}{title}.mp4"
    subprocess.run(cmd, shell=True)
    os.remove(f'{file_path}{title}.avi')
    os.remove(f'{file_path}{title}.mp3')


# 多執行緒的方式爬取(速度要快很多)
def main(bvid, start, end):
    urls = [f'https://www.bilibili.com/video/{bvid}/?p={i}' for i in range(start, end + 1)]
    print(urls)
    with ThreadPoolExecutor(max_workers=10) as executor:
        executor.map(download_video, urls)


if __name__ == '__main__':
    # 爬取不同的影片合集時,只需要修改bvid的值即可, bvid的值在影片地址中可以獲取https://www.bilibili.com/video/BV1Rs4y127j8/?spm_id_from=333.999.0.0&vd_source=6cdcd08f45ddc987f3f46f8ee8f80b9e
    bvid = 'BV1Sz4y1o7E8'
    starttime = datetime.datetime.now()
    print(starttime)
　　# start和end是開始和結束爬取的集數,如影片集有20集,start為1,end為20
    start = 1
    end = 56
    main(bvid, start, end)
    endtime = datetime.datetime.now()
    print(endtime)
    result_time = endtime - starttime
    print(result_time)

Python爬取B站影片抓包過程分享
2024-01-18
Python
python入門012～使用requests爬取網路圖片並儲存到本地
2021-09-09
Python
Python爬蟲——批次爬取douyin影片，下載到本地
2024-12-06
Python爬蟲
python爬取貓眼電影top100儲存到CSV
2018-08-25
Python
爬蟲搭建代理池、爬取某網站影片案例、爬取新聞案例
2023-03-16
爬蟲網站
多執行緒爬取B站視訊
2020-10-13
執行緒
Python爬蟲爬取B站up主所有動態內容
2024-05-08
Python爬蟲
使用Scrapy爬取圖片入庫,並儲存在本地
2019-06-27
使用 JDAudioCrawler 將下載的音訊儲存到本地儲存
2023-10-25
音訊
Typecho COS外掛實現網站靜態資源儲存到COS,降低本地儲存負載
2024-07-05
網站負載
用xpath、bs4、re爬取B站python資料
2018-08-07
Python
爬取微博圖片資料存到Mysql中遇到的各種坑mysql儲存圖片爬取微博圖片
2019-02-16
MySql
微信小程式（canvas）畫圖儲存到本地相簿（wepy）
2018-09-20
微信小程式Canvas
python 爬蟲 5i5j房屋資訊獲取並儲存到資料庫
2018-08-20
Python爬蟲資料庫
python爬取股票資料並存到資料庫
2021-03-29
Python資料庫
爬取B站視訊播放量及資料視覺化
2020-12-14
視覺化
Linux上如何掛載EMC DataDomain BoostFS儲存到本地目錄
2022-02-22
LinuxAI
如何自動儲存複製B站、皮皮搞笑別人的影片？
2020-10-16
微信小程式--通過canvas生成圖片並儲存到本地
2018-09-13
微信小程式Canvas
爬取網站新聞
2020-09-24
網站
爬蟲雙色球所有的歷史資料並儲存到SQLite
2020-10-28
爬蟲SQLite
Golang 爬蟲快速入門 | 獲取 B 站全站的視訊資料
2020-04-14
Golang爬蟲
前端錄屏並儲存影片到本地
2024-04-12
前端
win10系統下怎麼將鎖屏桌布儲存到本地
2019-05-20
Win10
Python爬蟲—爬取某網站圖片
2020-11-19
Python爬蟲網站
動態網站的爬取
2018-08-29
網站
原生JS實現base64圖片下載-圖片儲存到本地
2019-02-16
JS
安卓上傳圖片到伺服器並儲存到電腦本地
2020-09-28
安卓伺服器
scrapy爬取鏈家二手房存到mongo資料庫
2021-01-03
Go資料庫
html轉image 儲存到zip
2018-07-05
HTML
又拍相簿上的高畫質原圖儲存到本地電腦的方法
2020-09-17
小程式canvan畫布，現兩張圖片合成一張，並儲存到本地
2020-09-29
網路爬蟲---從千圖網爬取圖片到本地
2019-09-03
爬蟲
使用 Python 爬取網站資料
2024-07-27
Python網站
小心！這樣分享 B 站影片會暴露身份
2024-10-18
Bilidown(B站影片下載工具) v1.1.5
2024-07-26
BANG：B站影片影像分析與處理引擎
2022-11-09
下載b站影片並生成音訊字幕
2024-12-09
音訊

python+requests爬取B站影片儲存到本地

相關文章