Python爬取天氣資訊並語音播報
爬蟲是爬取網頁的相關內容,瞭解HTML能夠幫助你更好的理解網頁的結構、內容等。 TCP/IP協議,HTTP協議這些知識瞭解一下就可以,能夠讓你瞭解在網路請求和網路傳輸上的基本原理,這次的小案例用不到。 |
此案例實現功能:利用網路爬蟲,爬取某地的天氣,並列印和語音播報 。 要用到requests庫,lxml庫,pyttsx3庫,沒有的,可以先安裝一下,都可以透過pip安裝:
pip install requests pip install lxml pip install pyttsx3
Requests庫是個功能很強大的網路請求庫,可以實現跟瀏覽器一樣傳送各種HTTP請求來獲取網站的資料。
Lxml庫是處理XML和HTML功能最豐富,最易於使用的庫,通常用lxml庫中的etree使HTML轉化為文件。
Pyttsx3庫是一個很簡單的播放語音的庫,你給它什麼,它就讀什麼,當然別在意生硬的語氣。 基本用法如下:
import pyttsx3 word = pyttsx3.init() word.say('你好') # 關鍵一句,沒有這行程式碼,不會播放語音 word.runAndWait()
我們首先匯入requests庫,然後就用它來獲取目標的網頁,我們請求的是天氣網站中的北京天氣。
import requests # 向目標url地址傳送請求,返回一個response物件 req = requests.get(') # .text是response物件的網頁html print(req.text)
列印出的結果就是網站上顯示的內容,瀏覽器就是透過這些內容“解析”出來我們看到的結構如下:
我們請求後的獲得的資料
注意啦,小夥伴們有很大可能執行之後得不到網頁程式碼,而是顯示403,這是什麼意思呢?
403錯誤是一種在網站訪問過程中,常見的錯誤提示,表示資源不可用。伺服器理解客戶的請求,但拒絕處理它。
我們寫的爬蟲一般會預設告訴伺服器,自己傳送一個Python爬取請求,而很多的網站都會設定反爬蟲的機制,不允許被爬蟲訪問的。
所以,我們想讓目標伺服器響應,那就把我們的爬蟲進行一下偽裝。此小案例就用常用的更改User-Agent欄位進行偽裝。
改一下之前的程式碼,將爬蟲偽裝成瀏覽器請求,這樣就可以進行正常的訪問了。
User-Agent欄位怎麼來的呢?我們以Chrome瀏覽器為例子,先隨便開啟一個網頁,按鍵盤的F12或在空白處點選滑鼠右鍵選擇“檢查”;然後重新整理網頁,點選“Network”再點選“Doc”,點選Headers,在資訊欄檢視Request Headers的User-Agent欄位,直接複製,我們們就可以用啦。
我們從網頁請求獲得的資料繁雜,其中只有一部分是我們真正想得到的資料,例如我們從天氣的網站中檢視北京的天氣,只有下圖中使我們想要得到的,我們如如何提取呢?這就要用到lxml.etree。
整個程式碼中只有一小部分我們想要的資訊,我們發現想要的天氣、溫度啊都在“class='weather_info'”這一層級下,那這就好辦了。我們在請求的程式碼的後面加上:
html_obj = etree.HTML(html) html_data = html_obj.xpath("//d1[@class='weather_info']//text()")
我們print(html_data)一下看看提取是不是我們想要的資料。
發現連網頁中換行符啊什麼的也都提取出來了,還有,別忘了,提取出來的是列表哦。我們還要做一下處理。
word = "歡迎使用天氣播報助手" for data in html_data: word += data
處理完我們列印一下看看,嗯,我們想要的都有了。不過還多了一個[切換城市],我們精益求精,最後把這個最後再去掉。
我們想要的資料都在word變數裡啦,現在就讓他讀出來,用pyttsx3這個庫,
ptt = pyttsx3.init() ptt.say(word) ptt.runAndWait()
好的,現在都已完成。 我們一步一步都摸索過來,現在整合在一起,最後播放效果還是不錯的,這是一次很美好的爬蟲之旅,期待下次爬取!
原文地址:
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31559985/viewspace-2734842/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 利用Python爬蟲爬取天氣資料Python爬蟲
- Python 獲取當地未來五天天氣 天氣預報 獲取天氣Python
- python爬蟲抓取哈爾濱天氣資訊(靜態爬蟲)Python爬蟲
- 使用和風天氣介面獲取天氣資訊
- [python應用案例] 一.BeautifulSoup爬取天氣資訊併傳送至QQ郵箱Python
- python爬蟲獲取天氣網實時資料Python爬蟲
- Rust採集天氣預報資訊並實時更新資料Rust
- Python 爬蟲獲取網易雲音樂歌手資訊Python爬蟲
- 樹莓派3 打造定時播報電臺音樂鬧鐘、天氣等樹莓派
- PHPAjaxJavaScriptJson實現天氣資訊獲取PHPJavaScriptJSON
- [python爬蟲] 招聘資訊定時系統 (一).BeautifulSoup爬取資訊並儲存MySQLPython爬蟲MySql
- android 使用 SoundPool 語音播報Android
- Xamarin Essentials教程語音播報TextToSpeech
- python爬蟲——爬取大學排名資訊Python爬蟲
- Python爬取股票資訊,並實現視覺化資料Python視覺化
- iOS 收款推送訊息語音播報iOS
- python爬取北京租房資訊Python
- [Python Scrapy爬蟲] 二.翻頁爬取農產品資訊並儲存本地Python爬蟲
- python爬蟲--爬取鏈家租房資訊Python爬蟲
- python 爬蟲 1 爬取酷狗音樂Python爬蟲
- php,java獲取天氣預報程式碼PHPJava
- 【Python爬蟲實戰】使用Selenium爬取QQ音樂歌曲及評論資訊Python爬蟲
- 請利用SAX編寫程式解析Yahoo的XML格式的天氣預報,獲取天氣預報——python學習筆記XMLPython筆記
- 基於Python的簡單天氣爬蟲程式Python爬蟲
- python itchat 爬取微信好友資訊Python
- Python爬蟲爬取淘寶,京東商品資訊Python爬蟲
- 小白學 Python 爬蟲(25):爬取股票資訊Python爬蟲
- Python 爬取百度音樂Python
- Python爬蟲實踐--爬取網易雲音樂Python爬蟲
- win10關閉語音播報如何操作 win10電腦自動語音播報怎麼關Win10
- react頁面引導元件, 支援語音播報React元件
- Python爬蟲實戰:爬取淘寶的商品資訊Python爬蟲
- 天氣預報apiAPI
- 用Python爬取網易雲音樂歌曲Python
- 爬蟲實戰(二):Selenium 模擬登入並爬取資訊爬蟲
- Python爬蟲入門教程 53-100 Python3爬蟲獲取三亞天氣做旅遊參照Python爬蟲
- 中國天氣網免費天氣預報介面APIAPI
- Java實現網路爬蟲 案例程式碼3:使用webmagic框架獲取天氣預報Java爬蟲Web框架