py 爬取某網站直播集錦-抓取組裝得到詳情頁視訊集錦 url-現場敲程式碼

kuibatian發表於2020-03-31

原文網址 : https://learnku.com/articles/42689

py 爬取某網站直播集錦-抓取組裝得到詳情頁視訊集錦url-現場敲程式碼

這裡二級頁，開啟檢視元素。

py 爬取某網站直播集錦-抓取組裝得到詳情頁視訊集錦url-現場敲程式碼

如圖，找到li 中的 v-full，下的a 標籤。
附上程式碼



<a href="https://weibo.com/tv/v/IBaGL40Hu?fid=1034:4488591628501002" target="_blank">
  [微博視訊] 第一局 LGD錘石迅猛開團EDG泰坦沒能走掉被秒，雷克塞又一次被集火殺掉，LGD0換2拿下峽谷   </a>

附上程式碼


# 根據傳入的 錄影 集錦 來 執行爬蟲。
def getVideoList(matches):
    video_list = []
    for i in matches:
        doc = getLxml(i , lambda resp: BeautifulSoup(resp.text, 'lxml'))
        # print('resp: ', doc)
        if doc is None:
            continue
        for a in doc.select('.v-full a'):
            title, href = a.text.strip(), a.attrs['href']
            if next(filter(lambda v: v[1] == href, video_list), None) is None:
                video_list.append((title, href))

    print('video_list: ', video_list)

技術解析 BeautifulSoup

BeautifulSoup4簡介

BeautifulSoup4和 lxml 一樣，Beautiful Soup 也是一個HTML/XML的解析器，主要的功能也是如何解析和提取 HTML/XML 資料。

BeautifulSoup支援Python標準庫中的HTML解析器,還支援一些第三方的解析器，如果我們不安裝它，則 Python 會使用 Python預設的解析器，lxml 解析器更加強大，速度更快，推薦使用lxml 解析器。

Beautiful Soup自動將輸入文件轉換為Unicode編碼，輸出文件轉換為utf-8編碼。你不需要考慮編碼方式，除非文件沒有指定一個編碼方式，這時，Beautiful Soup就不能自動識別編碼方式了。然後，你僅僅需要說明一下原始編碼方式就可以了。

下一篇會介紹。請檢視。

同理

py 爬取某網站直播集錦-抓取組裝得到詳情頁視訊集錦url-現場敲程式碼

本作品採用《CC 協議》，轉載必須註明作者和本文連結

每天5分鐘，與你一起蛻變！上海php自學中心，目前專注於php，python，golang~撒花！
群 S3d25uqwht.png!large
公眾號 7Dn78VKKcW.jpg!large

PHP開發常用程式碼集錦
2019-02-16
PHP
CSS常用功能程式碼集錦
2018-03-23
CSS
android高階頁面效果集錦
2018-09-30
Android
某計算機視覺公眾號乾貨文章集錦
2019-11-12
計算機視覺
爬取某網站寫的python程式碼
2019-11-29
網站Python
知識集錦
2020-11-20
管理故事集錦
2020-04-06
三層登陸程式碼及錯誤集錦
2018-07-02
面試集錦（十五）網路安全
2018-08-22
面試
程式設計師幽默爆笑錦集
2022-07-08
程式設計師
Python例項集錦
2018-11-14
Python
前端知識集錦
2019-03-04
前端
kafka問題集錦
2018-07-10
Kafka
小問題集錦
2020-11-19
docker 踩坑集錦
2020-10-19
Docker
flutter問題集錦
2018-03-06
Flutter
ArchLinux 問題集錦
2024-07-26
Linux
Windows Mobile開發資源站點集錦
2020-04-07
Windows
Python專案開發案例集錦及配套程式碼
2019-11-27
Python
Android 知識點集錦
2019-03-08
Android
iOS 感測器集錦
2018-12-06
iOS
vue知識點集錦
2018-08-15
Vue
面試集錦（九）git
2018-08-22
面試Git
面試集錦（十二）hashMap
2018-08-22
面試HashMap
面試集錦（三）spring
2018-08-21
面試Spring
面試題集錦-SpringBoot
2020-11-14
面試題Spring Boot
SYBASE 使用技巧集錦(zt)
2019-07-02
PHP命令執行集錦
2022-03-21
PHP
JS工程化集錦
2021-08-24
JS
四月前端知識集錦（每月不可錯過的文章集錦）
2018-05-02
前端
六月前端知識集錦（每月不可錯過的文章集錦）
2018-06-27
前端
五月前端知識集錦（每月不可錯過的文章集錦）
2018-05-28
前端
面試集錦（二）程式與執行緒
2018-08-21
面試執行緒
Linux 問題處理集錦
2018-11-14
Linux
java8Stream操作集錦
2024-05-04
Java
資料競賽Tricks集錦
2019-09-18
Android開發錯誤集錦
2019-12-23
Android
線上問題集錦(1)
2020-11-17

py 爬取某網站直播集錦-抓取組裝得到詳情頁視訊集錦 url-現場敲程式碼

技術解析 BeautifulSoup

相關文章