python獲取頁面亂碼時的處理

doublefacekill發表於2021-11-11

原文網址 : https://learnku.com/articles/62479

用requests模組獲取網站資料時，網站的編碼是個很麻煩的問題。一般情況下，requests會自動識別網站的編碼,如果網頁沒有指定編碼，那就會預設為是ISO-8859-1編碼。這個時候可能就會出問題。

一般有幾種方式，最簡單的就是，人為的指定編碼 r.encoding = ‘utf-8’

但是採集資料時，可能訪問不同域名的網站，這時候就不好為每一個網站都人為的指定一個正確的編碼。以下是通用方法

        if r.encoding == 'ISO-8859-1':
            encodings = requests.utils.get_encodings_from_content(r.text)
            if encodings:
                encoding = encodings[0]
            else:
                encoding = r.apparent_encoding
            return r.content.decode(encoding, 'replace')
        else:
            return r.text

本作品採用《CC 協議》，轉載必須註明作者和本文連結

Python指令碼的常見引數獲取和處理方式
2020-12-27
Python指令碼
Python Cookie HTTP獲取cookie並處理
2021-09-14
PythonCookieHTTP
python四種方式解析網頁獲取頁面中的連結
2020-12-31
Python網頁
Python教程分享：Python Cookie HTTP獲取cookie並處理
2021-10-11
PythonCookieHTTP
python爬蟲爬取網頁中文亂碼問題的解決
2024-11-17
Python爬蟲網頁
Zabbix7 亂碼處理
2024-12-02
python3中編碼如何獲取網頁?
2021-09-11
Python網頁
獲取微信二維碼返回亂碼
2020-12-27
Python培訓技術分享：Python Cookie HTTP獲取cookie並處理
2021-09-15
PythonCookieHTTP
MySQL：亂碼問題處理流程
2021-02-16
MySql
[Python影象處理] 三.獲取影象屬性、興趣ROI區域及通道處理
2018-08-29
Python
PbootCMS後臺頁面顯示亂碼
2024-11-15
boot
Java Web後臺從request裡面獲取的資料是亂碼問題
2018-09-17
JavaWeb
【python012】Python根據頁碼處理PDF檔案的內容
2024-06-25
Python
QWebView獲取網頁原始碼
2018-11-01
WebView網頁原始碼
layui獲取頁面checkbox核取方塊值
2019-04-19
UI
python 獲取時間的datetime庫
2024-11-27
Python
laravel 使用maatwebsite/Excel 獲取的日期的處理
2021-02-06
LaravelWebExcel
xshell終端顯示亂碼的處理方法
2024-07-03
appium 獲取混合頁面元素失敗
2021-01-14
APP
JavaScript-滑鼠獲取頁面座標
2020-11-29
JavaScript
IIS設定404頁面返回200碼和404頁面亂碼解決方法
2021-03-30
Lavarel Ajax 分頁時獲取分頁資訊
2018-12-06
springboot下的純html頁面亂碼帶問號?
2024-07-06
Spring BootHTML
跟我學Python影像處理丨獲取影像屬性、興趣ROI區域及通道處理
2022-05-05
Python
jsp頁面通過url向後臺傳值時的中文亂碼問題
2018-05-10
JS
Mysql輸出中文顯示亂碼處理
2021-05-03
MySql
寫一個獲取頁面中所有checkbox的方法
2024-12-06
帝國cms自定義頁面動態程式碼獲取步驟
2024-08-05
JavaScript 獲取div在頁面中座標
2019-04-15
JavaScript
獲取微信小程式頁面路徑
2024-07-12
微信小程式
jsp頁面傳中文到資料庫亂碼
2020-03-11
JS資料庫
tomcat-windows環境頁面亂碼問題
2024-11-06
TomcatWindows
關於laravel的錯誤頁面處理大家都是如何優雅的處理的呢？
2021-03-01
Laravel
vue 獲取頁面詳情後切換頁面時如何監聽使用者是否修改過資訊
2018-07-06
Vue
微信小程式攜帶引數跳轉頁面/獲取頁面棧
2020-08-13
微信小程式
用 js 獲取頁面元素的位置圖文總結
2019-03-01
JS
getBoundingClientRect方法獲取元素在頁面中的相對位置
2018-04-25
GCclient

python獲取頁面亂碼時的處理

相關文章