日誌11月4日
BeautifulSoup常用方式程式碼:
from urllib.request import urlopen
from urllib.error import HTTPError, URLError
from bs4 import BeautifulSoup
def getBSObj(url):
"""根據url獲取頁面的物件"""
try:
html = urlopen(url)
except (HTTPError, URLError) as e:
return None
try:
bsObj = BeautifulSoup(html.read(), features = "lxml")
except (AttributeError) as e:
return None
return bsObj
bsObj = getBSObj("http://pythonscraping.com/pages/warandpeace.html")
if bsObj == None:
print("BSObj could not be found")
else:
#使用find_all()函式抽取只包含在<span class="green"></span>標籤裡的文字
nameList = bsObj.find_all("span", {"class" : "green"})
for name in nameList:
#get_text()清楚所有標籤,返回一個只包含文字的字串
print(name.get_text())
相關文章
- 日誌分析-apache日誌分析Apache
- [日誌分析篇]-利用ELK分析jumpserver日誌-日誌拆分篇Server
- 日誌
- 【Spring】日誌列印sql,日誌配置列印sqlSpringSQL
- [Java/日誌] 日誌框架列印應用程式日誌程式碼的執行情況Java框架
- CMS日誌
- 日誌配置
- mybatis日誌MyBatis
- Weblogic日誌Web
- ros 日誌ROS
- Log日誌
- 日誌列印
- Loggiing日誌
- Mysql日誌MySql
- 日誌01
- 日誌管理
- ELK日誌
- [技術分享]日誌切割(按天切割日誌)
- 日誌篇:模組日誌總體介紹
- 【MySQL日誌】MySQL日誌檔案初級管理MySql
- 日誌11月18日
- 日誌11月24日
- 日誌12月16日
- 【REDO】Oracle 日誌挖掘,分析歸檔日誌線上日誌主要步驟Oracle
- Go中使用Zap日誌庫與Lumberjack日誌切割Go
- Kubernetes 叢集日誌 和 EFK 架構日誌方案架構
- lumen cli日誌和普通日誌分開儲存
- 日誌服務之使用Nginx模式採集日誌Nginx模式
- 【Oracle】歸檔日誌管理-設定歸檔日誌路徑以及歸檔日誌冗餘Oracle
- python日誌配置Python
- crash日誌分析
- Crash日誌解析
- 重做日誌管理
- 實訓日誌
- Python 日誌(Log)Python
- 日誌服務
- 專案日誌
- 日誌模組