今天遇到問題批量連結怎麼識別?
直接上程式碼!
python 識別拼多多,天貓,淘寶,京東域名
import re
from urllib.parse import urlparse
# 獲取域名的url
def get_host( url):
url_dic = urlparse(url)
return url_dic.netloc
# 識別域名
def show(nu):
# 京東商品連結
num = nu
print(num)
hots = get_host(nu)
print(hots)
print('爬取成功')
if __name__ == "__main__":
tk = show('https://item.jd.com/29226209677.html')
執行結果
本作品採用《CC 協議》,轉載必須註明作者和本文連結