遞迴遍歷網站所有 url
想寫一個指令碼,遍歷帶有域名的 url,檢查狀態碼是否有異常。遇到一個問題,requests 返回的內容裡面沒有 a 標籤。
網頁的內容都在這個 div 裡面,但是 requests 返回的資料裡面為空
import requests
from bs4 import BeautifulSoup
headers = {
"user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.111 Safari/537.36",
}
resource_list = list()
def get_urls(url):
r = requests.get(url)
print(url)
print(r.text)
soup = BeautifulSoup(r.text, 'html.parser')
urls = soup.find_all("a")
if not urls:
return
if urls:
for i in urls:
try:
if i['href'] not in resource_list:
status_code = requests.get(i['href']).status_code
if status_code not in (200, 0): # code 不對則列印出來
print(i['href'], status_code)
if "https://www.mxc.ai/" in i['href']: # 判斷是否含有域名
resource_list.append(i['href'])
get_urls(i['href'])
except Exception:
pass
相關文章
- Android遍歷所有控制元件的遞迴和非遞迴實現Android控制元件遞迴
- 二叉樹的所有遍歷非遞迴實現二叉樹遞迴
- 遍歷二叉樹-------遞迴&非遞迴二叉樹遞迴
- js遞迴遍歷講解JS遞迴
- 非遞迴實現先序遍歷和中序遍歷遞迴
- 遞迴遍歷物件獲取value值遞迴物件
- 二叉樹的遍歷 → 不用遞迴,還能遍歷嗎二叉樹遞迴
- 二叉樹的四種遍歷(遞迴與非遞迴)二叉樹遞迴
- 什麼是遍歷二叉樹,JavaScript實現二叉樹的遍歷(遞迴,非遞迴)二叉樹JavaScript遞迴
- 迭代及用遞迴遍歷File檔案遞迴
- [work] python巢狀字典的遞迴遍歷Python巢狀遞迴
- 遞迴遍歷當前目錄下所有的git倉庫,執行git pull操作遞迴Git
- 遍歷二叉樹的遞迴與非遞迴程式碼實現二叉樹遞迴
- Day14 | 二叉樹遞迴遍歷二叉樹遞迴
- C++單連結串列遞迴遍歷操作C++遞迴
- 非遞迴先序遍歷二叉樹遞迴二叉樹
- 二叉樹的前中後序遍歷(遞迴和非遞迴版本)二叉樹遞迴
- python實現二叉樹及其七種遍歷方式(遞迴+非遞迴)Python二叉樹遞迴
- 二叉樹——後序遍歷的遞迴與非遞迴演算法二叉樹遞迴演算法
- 遞迴遍歷樹狀結構優雅實現遞迴
- 遍歷二叉樹的迭代和遞迴方法二叉樹遞迴
- 二叉樹的非遞迴遍歷寫法二叉樹遞迴
- 樹3-二叉樹非遞迴遍歷(棧)二叉樹遞迴
- 二叉樹的建立與遍歷(遞迴實現)二叉樹遞迴
- Map迴圈遍歷
- 【JavaScript實用技巧(一)】迴圈遍歷與跳出迴圈遍歷JavaScript
- Python自學之路:遞迴、棧和佇列遍歷目錄Python遞迴佇列
- 資料結構-樹以及深度、廣度優先遍歷(遞迴和非遞迴,python實現)資料結構遞迴Python
- 程式碼隨想錄演算法訓練營,9月9日 | 二叉樹遞迴遍歷,迭代遍歷,層序遍歷演算法二叉樹遞迴
- Linux迴圈遍歷所有檔案,刪除指定字尾名檔案Linux
- Winform 遍歷 ListBox中的所有項ORM
- 【Java資料結構與演算法筆記(二)】樹的四種遍歷方式(遞迴&非遞迴)Java資料結構演算法筆記遞迴
- Golang for迴圈遍歷小坑Golang
- 使用遞迴遍歷並轉換樹形資料(以 TypeScript 為例)遞迴TypeScript
- Java遞迴遍歷資料夾及檔案過濾器使用(FileFilter)Java遞迴過濾器Filter
- 遍歷目錄下的所有檔案
- 刷題系列 - Python用非遞迴實現二叉樹前序遍歷Python遞迴二叉樹
- JS迴圈遍歷方法總結JS