python3中編碼如何獲取網頁?
學了python後,之前一些我們常用的方法,也可以換一種思路用python中的知識來解決。相信操作出來後,能收穫一大批小粉絲們。就像我們沒學習程式設計之前,看到那種大神都是可望而不可即。今天我們就之前簡單獲取網頁的這種操作用python中的編碼來解決,大家可以自行體會一下兩者的不同。
1. encoding和apparent_encoding
import scrapy url="" re=requests.get(url) #獲取響應頭Content-Type的charset值,有的網站沒有charset欄位,就可能使用預設的 ISO-8859-1 print(re.encoding) #apparent_encoding就是獲取網站真實的編碼 print(re.apparent_encoding)
2. 處理方案
直接用r.encoding = ‘xxx’
re.encoding='utf-8'
3. requests的text() 跟 content() 有什麼區別
re.text返回的是處理過的Unicode型的資料,
而使用re.content返回的是bytes型的原始資料。
4. 爬蟲拿到的HTML和瀏覽器中的原始碼不相同時
透過下載原始碼對比
import requests url = '' r = requests.get(url) r.encoding = r.apparent_encoding html = r.text with open('test.html','w',encoding='utf8') as f: f.write(html)
以上就是python3編碼獲取網頁的一些操作方法,小夥伴們學會沒?當然獲取網頁的方法比較多,這裡就不一一介紹,有機會的話小編會在後續的文章中更新一下。學習了python之後,程式設計應用於生活會越來越多,幫助我們簡化生活的繁瑣事情。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/2157/viewspace-2832243/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- QWebView獲取網頁原始碼WebView網頁原始碼
- 網頁地址編碼解碼(網頁地址明文密文轉換)url編碼解碼 Python3網頁Python
- JavaScript 獲取網頁尾本程式碼內容JavaScript網頁
- 想獲取JS載入網頁的源網頁的原始碼,不想獲取JS載入後的資料JS網頁原始碼
- python四種方式解析網頁獲取頁面中的連結Python網頁
- js/jq 獲取網頁寬高JS網頁
- 前端獲取視訊編碼格式前端
- CentOS 7 如何編碼安裝Python3?CentOSPython
- 從Google網頁中透過正規表示式獲取json如何轉換unicode物件Go網頁JSONUnicode物件
- Python3 - 獲取資料夾中的檔案列表Python
- Chrome 獲取網頁顏色(文字、圖片)Chrome網頁
- Python3編碼如何實現檔案操作?Python
- 直播帶貨小程式原始碼中,商品詳情頁是如何獲取html圖片的原始碼HTML
- 如何用jst獲取DOM元素在頁面中的絕對位置?JS
- JavaScript 獲取div在頁面中座標JavaScript
- python中獲取如何Series值Python
- php獲取網頁內容的三種方法PHP網頁
- python獲取頁面亂碼時的處理Python
- Postman模擬瀏覽器網頁請求並獲取網頁資料Postman瀏覽器網頁
- vue+element-ui中獲取頁面資料VueUI
- WKWebView 獲取網頁高度,圖片點選檢視,網頁連結點選WebView網頁
- 如何獲取 jenkins 中的憑證Jenkins
- Rust中如何獲取最大字串?Rust字串
- 怎樣修改網站主頁原始碼,如何編輯網站的HTML檔案網站原始碼HTML
- 127 PHP獲取網頁標題的3種實現方法程式碼例項PHP網頁
- 如何使用python進行網頁爬取?Python網頁
- 如何獲取網站的HTTPS證書?網站HTTP
- 夢想cad在網頁開發時如何獲取圖層操作的資訊網頁
- 反編譯獲取任何微信小程式原始碼編譯微信小程式原始碼
- 網站首頁修改標題描述,如何在網站後臺或程式碼編輯器中修改首頁標題和描述網站
- PHP中獲取當前頁面的各種URL格式PHP
- html網頁中如何實現居中效果(程式碼分享)HTML網頁
- 獲取當前頁面的topViewControllerViewController
- .NET微信網頁開發之網頁授權獲取使用者基本資訊網頁
- 使用selenium爬取網頁,如何在scrapy shell中除錯響應網頁除錯
- 如何獲取 Linux 中的目錄大小Linux
- 如何在 Janus 中獲取 WebRTC 的流Web
- SOLIDWORKS如何獲取模型中的引數Solid模型