實用爬蟲-03-爬取視訊教程課程名+連結+下載圖片

肖朋偉發表於2018-10-29

原文網址 : https://www.cnblogs.com/xpwi/p/9873468.html

爬蟲

實用爬蟲-03-爬取視訊教程課程名+連結+下載圖片

很長時間不寫爬蟲的學習筆記了，想到用爬蟲來動態的更新資料，簡單的搭一個頁面的框架，加上爬蟲獲取資料，豈不是省了自己建庫又有了優質的資料來源

當然我們寫爬蟲不能過分的爬取，有些涉及原創的東西，最好不好私自爬取，好，政治正確哈

一、爬蟲的目的：

實用爬蟲-03-爬取視訊教程課程名+連結+下載圖片

二、注意事項：

下載圖片，我是放在了 pic 目錄下，需要自己建立和 Python 檔案同級的目錄

三、不多說，在註釋上聊：

# coding:utf-8
'''
使用爬蟲獲取教程網站資訊：
1.獲取課程視訊連線
2.獲取課程名
3.獲取圖片連線，並下載圖片

作者：cnblogs.com/xpwi
'''

import re, requests

# 目標地址
url = "https://www.jikexueyuan.com/course/android/?pageNum=2"

if __name__ == '__main__':

    # 獲取頁面 html
    html = requests.get(url).text
    # print(html)

    # 獲取 title
    title = re.findall("<title>(.*?)</title>", html)
    print(title[0])

    # 獲取24門課程的連結
    h2 = re.findall('<h2 class="lesson-info-h2">(.*?)</h2>', html)
    h2_a = ""
    for i in h2:
        # 因為正則獲取到的是一個陣列，把每個元素合起來到一個長字串中
        h2_a = h2_a + i

    name = re.findall('">(.*?)</a>', h2_a)
    href = re.findall('href="//(.*?)" ',h2_a)

    # print("--------課程名稱-------------")
    # for i in name:
    #     print(i)

    # print("--------課程連結-------------")
    # for i in href:
    #     print(i)
    i = 0
    for i in range(0, len(name)):
        print('課程名：' + name[i] + '\n課程連線：' + href[i])


    # 獲取24張圖片的連結
    img_href = re.findall('<img src="(.*?)"',html)
    print("--------下載圖片-------------")

    i = 0
    for m in img_href:
        # 由於沒有精確匹配，並不是所有連線都是我們要的課程的連線，排出第一張圖片
        if m == '//e.jikexueyuan.com/headerandfooter/images/logo.png?t=1513326254000':
            continue
        print('正在下載：' + m)

        # 爬取每個網頁圖片的連線
        pic = requests.get(m)

        # 開啟 pic 同級目錄【必須手動建立好】
        fp = open('pic\\' + str(i) + '.jpg', 'wb')

        # 寫入本地檔案
        fp.write(pic.content)

        # 目前沒有想到更好的方式，暫時只能寫一次，關閉一次，如果有更好的歡迎討論
        fp.close()
        i += 1

四、執行結果：

實用爬蟲-03-爬取視訊教程課程名+連結+下載圖片

圖片截圖：

實用爬蟲-03-爬取視訊教程課程名+連結+下載圖片

爬蟲 Scrapy框架爬取圖蟲圖片並下載
2018-08-27
爬蟲框架
Java爬蟲批量爬取圖片
2021-09-24
Java爬蟲
Python爬蟲實戰一：爬取csdn學院所有課程名、價格和課時
2018-06-23
Python爬蟲
Python爬蟲新手教程：知乎文章圖片爬取器
2019-07-20
Python爬蟲
node：爬蟲爬取網頁圖片
2019-02-16
爬蟲網頁
爬蟲---xpath解析（爬取美女圖片）
2020-12-23
爬蟲
Python爬蟲實戰詳解：爬取圖片之家
2020-11-04
Python爬蟲
新手爬蟲教程：Python爬取知乎文章中的圖片
2019-01-17
爬蟲Python
python 爬蟲之requests爬取頁面圖片的url，並將圖片下載到本地
2019-06-12
Python爬蟲
Python爬蟲—爬取某網站圖片
2020-11-19
Python爬蟲網站
使用Python爬蟲實現自動下載圖片
2021-09-11
Python爬蟲
python爬蟲---網頁爬蟲，圖片爬蟲，文章爬蟲，Python爬蟲爬取新聞網站新聞
2019-01-04
Python爬蟲網頁網站
Python爬蟲入門【5】：27270圖片爬取
2019-07-30
Python爬蟲
Python爬蟲入門教程 50-100 Python3爬蟲爬取VIP視訊-Python爬蟲6操作
2019-02-14
Python爬蟲
Python爬蟲批次下載電影連結
2021-09-09
Python爬蟲
python 爬蟲下載百度美女圖片
2024-04-18
Python爬蟲
爬蟲Selenium+PhantomJS爬取動態網站圖片資訊（Python）
2018-03-24
爬蟲JS網站Python
蘇寧易購網址爬蟲爬取商品資訊及圖片
2021-10-12
爬蟲
python爬蟲實戰教程-Python爬蟲開發實戰教程（微課版）
2020-11-11
Python爬蟲
ReactPHP 爬蟲實戰：下載整個網站的圖片
2019-01-20
ReactPHP爬蟲網站
網路爬蟲---從千圖網爬取圖片到本地
2019-09-03
爬蟲
爬蟲教程——用Scrapy爬取豆瓣TOP250
2018-10-31
爬蟲
Python爬蟲遞迴呼叫爬取動漫美女圖片
2020-10-19
Python爬蟲遞迴
如何爬取視訊的爬蟲程式碼原始碼
2020-12-26
爬蟲原始碼
用雲函式快速實現圖片爬蟲
2018-11-02
函式爬蟲
Python爬蟲——批次爬取douyin影片，下載到本地
2024-12-06
Python爬蟲
Python爬蟲入門教程 4-100 美空網未登入圖片爬取
2018-12-17
Python爬蟲
【python--爬蟲】千圖網高清背景圖片爬蟲
2019-05-21
Python爬蟲
Python 爬蟲零基礎教程(1)：爬單個圖片
2024-03-13
Python爬蟲
自學python網路爬蟲，從小白快速成長，分別實現靜態網頁爬取，下載meiztu中圖片；動態網頁爬取，下載burberry官網所有當季新品圖片。
2020-02-06
Python爬蟲網頁
python愛奇藝VIP視訊爬蟲爬取下載
2018-04-20
Python爬蟲
最簡單的網路圖片的爬取 --Pyhon網路爬蟲與資訊獲取
2020-04-04
爬蟲
如何用Python爬蟲實現百度圖片自動下載？
2019-03-01
Python爬蟲
python網路爬蟲_Python爬蟲：30個小時搞定Python網路爬蟲視訊教程
2020-10-21
Python爬蟲
簡單的爬蟲：爬取網站內容正文與圖片
2021-09-09
爬蟲網站
Python爬蟲入門學習線路圖2019最新版（附Python爬蟲視訊教程）
2019-01-09
Python爬蟲
Java爬蟲-爬取疫苗批次資訊
2024-06-03
Java爬蟲
京東商品圖片自動下載抓取 c# 爬蟲
2020-09-30
C#爬蟲

實用爬蟲-03-爬取視訊教程課程名+連結+下載圖片

實用爬蟲-03-爬取視訊教程課程名+連結+下載圖片

相關文章