遞迴遍歷網站所有 url
想寫一個指令碼,遍歷帶有域名的url,檢查狀態碼是否有異常。遇到一個問題,requests返回的內容裡面沒有a標籤。
網頁的內容都在這個div裡面,但是requests返回的資料裡面為空
import requests
from bs4 import BeautifulSoup
headers = {
"user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.111 Safari/537.36",
}
resource_list = list()
def get_urls(url):
r = requests.get(url)
print(url)
print(r.text)
soup = BeautifulSoup(r.text, 'html.parser')
urls = soup.find_all("a")
if not urls:
return
if urls:
for i in urls:
try:
if i['href'] not in resource_list:
status_code = requests.get(i['href']).status_code
if status_code not in (200, 0): # code 不對則列印出來
print(i['href'], status_code)
if "https://www.mxc.ai/" in i['href']: # 判斷是否含有域名
resource_list.append(i['href'])
get_urls(i['href'])
except Exception:
pass
get_urls("https://www.mxc.ai/")
相關文章
- Android遍歷所有控制元件的遞迴和非遞迴實現Android控制元件遞迴
- 二叉樹的所有遍歷非遞迴實現二叉樹遞迴
- 遍歷二叉樹-------遞迴&非遞迴二叉樹遞迴
- js遞迴遍歷講解JS遞迴
- Java 資料夾遞迴遍歷Java遞迴
- PHP遞迴遍歷資料夾PHP遞迴
- python 遞迴遍歷目錄Python遞迴
- 非遞迴實現先序遍歷和中序遍歷遞迴
- 遞迴遍歷物件獲取value值遞迴物件
- 二叉樹非遞迴遍歷二叉樹遞迴
- 二叉樹的遍歷 → 不用遞迴,還能遍歷嗎二叉樹遞迴
- 二叉樹的四種遍歷(遞迴與非遞迴)二叉樹遞迴
- 【資料結構】二叉樹遍歷(遞迴+非遞迴)資料結構二叉樹遞迴
- 什麼是遍歷二叉樹,JavaScript實現二叉樹的遍歷(遞迴,非遞迴)二叉樹JavaScript遞迴
- 迭代及用遞迴遍歷File檔案遞迴
- Java遍歷資料夾的兩種方法(非遞迴和遞迴)Java遞迴
- 遍歷某一個指定目錄下的所有子目錄和檔案(遞迴)遞迴
- 遍歷二叉樹的遞迴與非遞迴程式碼實現二叉樹遞迴
- 二叉樹建立及遍歷演算法(遞迴及非遞迴)二叉樹演算法遞迴
- [work] python巢狀字典的遞迴遍歷Python巢狀遞迴
- 非遞迴先序遍歷二叉樹遞迴二叉樹
- 【刷題】二叉樹非遞迴遍歷二叉樹遞迴
- C++單連結串列遞迴遍歷操作C++遞迴
- 遞迴遍歷當前目錄下所有的git倉庫,執行git pull操作遞迴Git
- 二叉樹的前中後序遍歷(遞迴和非遞迴版本)二叉樹遞迴
- 二叉樹——後序遍歷的遞迴與非遞迴演算法二叉樹遞迴演算法
- [java] 二叉樹的後序遍歷(遞迴與非遞迴實現)Java二叉樹遞迴
- 遍歷二叉樹的迭代和遞迴方法二叉樹遞迴
- 二叉樹的非遞迴遍歷寫法二叉樹遞迴
- java基礎:遞迴應用---遍歷檔案目錄Java遞迴
- Day14 | 二叉樹遞迴遍歷二叉樹遞迴
- 遞迴遍歷樹狀結構優雅實現遞迴
- python實現二叉樹及其七種遍歷方式(遞迴+非遞迴)Python二叉樹遞迴
- 二叉樹的建立與遍歷(遞迴實現)二叉樹遞迴
- 二叉樹的非遞迴遍歷——java實現二叉樹遞迴Java
- 樹3-二叉樹非遞迴遍歷(棧)二叉樹遞迴
- 【JavaScript實用技巧(一)】迴圈遍歷與跳出迴圈遍歷JavaScript
- Python自學之路:遞迴、棧和佇列遍歷目錄Python遞迴佇列