遞迴遍歷網站所有 url

lyyyyyyy發表於2020-12-31

原文網址 : https://testerhome.com/topics/27402

想寫一個指令碼，遍歷帶有域名的url，檢查狀態碼是否有異常。遇到一個問題，requests返回的內容裡面沒有a標籤。
網頁的內容都在這個div裡面，但是requests返回的資料裡面為空

import requests
from bs4 import BeautifulSoup

headers = {
    "user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.111 Safari/537.36",
}
resource_list = list()


def get_urls(url):
    r = requests.get(url)
    print(url)
    print(r.text)
    soup = BeautifulSoup(r.text, 'html.parser')
    urls = soup.find_all("a")
    if not urls:
        return
    if urls:
        for i in urls:
            try:
                if i['href'] not in resource_list:
                    status_code = requests.get(i['href']).status_code
                    if status_code not in (200, 0):  # code 不對則列印出來
                        print(i['href'], status_code)

                    if "https://www.mxc.ai/" in i['href']:  # 判斷是否含有域名
                        resource_list.append(i['href'])
                        get_urls(i['href'])
            except Exception:
                pass


get_urls("https://www.mxc.ai/")

Android遍歷所有控制元件的遞迴和非遞迴實現
2018-09-30
Android控制元件遞迴
二叉樹的所有遍歷非遞迴實現
2020-12-10
二叉樹遞迴
遍歷二叉樹-------遞迴&非遞迴
2018-04-10
二叉樹遞迴
js遞迴遍歷講解
2018-12-19
JS遞迴
非遞迴實現先序遍歷和中序遍歷
2020-12-20
遞迴
遞迴遍歷物件獲取value值
2018-03-06
遞迴物件
二叉樹的遍歷 → 不用遞迴，還能遍歷嗎
2021-12-27
二叉樹遞迴
二叉樹的四種遍歷（遞迴與非遞迴）
2021-10-06
二叉樹遞迴
什麼是遍歷二叉樹，JavaScript實現二叉樹的遍歷（遞迴，非遞迴）
2020-03-05
二叉樹JavaScript遞迴
[work] python巢狀字典的遞迴遍歷
2019-01-12
Python巢狀遞迴
迭代及用遞迴遍歷File檔案
2020-12-14
遞迴
遞迴遍歷當前目錄下所有的git倉庫，執行git pull操作
2024-06-06
遞迴Git
遍歷二叉樹的遞迴與非遞迴程式碼實現
2021-03-18
二叉樹遞迴
C++單連結串列遞迴遍歷操作
2018-04-07
C++遞迴
非遞迴先序遍歷二叉樹
2018-07-23
遞迴二叉樹
Day14 | 二叉樹遞迴遍歷
2024-06-05
二叉樹遞迴
二叉樹的前中後序遍歷（遞迴和非遞迴版本）
2018-11-03
二叉樹遞迴
python實現二叉樹及其七種遍歷方式（遞迴+非遞迴）
2019-03-13
Python二叉樹遞迴
二叉樹——後序遍歷的遞迴與非遞迴演算法
2018-04-18
二叉樹遞迴演算法
遞迴遍歷樹狀結構優雅實現
2024-08-07
遞迴
二叉樹的非遞迴遍歷寫法
2020-12-07
二叉樹遞迴
遍歷二叉樹的迭代和遞迴方法
2020-12-12
二叉樹遞迴
樹3-二叉樹非遞迴遍歷(棧)
2024-04-18
二叉樹遞迴
二叉樹的建立與遍歷（遞迴實現）
2020-06-19
二叉樹遞迴
Map迴圈遍歷
2018-08-13
【JavaScript實用技巧（一）】迴圈遍歷與跳出迴圈遍歷
2021-10-26
JavaScript
Python自學之路：遞迴、棧和佇列遍歷目錄
2018-09-22
Python遞迴佇列
資料結構-樹以及深度、廣度優先遍歷（遞迴和非遞迴，python實現）
2019-07-18
資料結構遞迴Python
程式碼隨想錄演算法訓練營，9月9日 | 二叉樹遞迴遍歷，迭代遍歷，層序遍歷
2024-09-10
演算法二叉樹遞迴
Linux迴圈遍歷所有檔案，刪除指定字尾名檔案
2019-01-04
Linux
Winform 遍歷 ListBox中的所有項
2019-02-18
ORM
【Java資料結構與演算法筆記（二）】樹的四種遍歷方式（遞迴&非遞迴）
2019-03-11
Java資料結構演算法筆記遞迴
Java遞迴遍歷資料夾及檔案過濾器使用（FileFilter）
2018-08-01
Java遞迴過濾器Filter
使用遞迴遍歷並轉換樹形資料（以 TypeScript 為例）
2021-09-09
遞迴TypeScript
Golang for迴圈遍歷小坑
2023-05-11
Golang
遍歷目錄下的所有檔案
2020-12-09
刷題系列 - Python用非遞迴實現二叉樹前序遍歷
2020-01-15
Python遞迴二叉樹
迴圈遍歷二叉樹
2018-11-05
二叉樹

遞迴遍歷網站所有 url

相關文章