Chardet: 通用字元編碼檢測器

suv789發表於2024-05-21

Chardet: 通用字元編碼檢測器
構建狀態

圖片

PyPI 上的最新版本

許可證

檢測
ASCII、UTF-8、UTF-16(2個變體)、UTF-32(4個變體)
Big5、GB2312、EUC-TW、HZ-GB-2312、ISO-2022-CN(繁體和簡體中文)
EUC-JP、SHIFT_JIS、CP932、ISO-2022-JP(日語)
EUC-KR、ISO-2022-KR、Johab(韓語)
KOI8-R、MacCyrillic、IBM855、IBM866、ISO-8859-5、windows-1251(西里爾語)
ISO-8859-5、windows-1251(保加利亞語)
ISO-8859-1、windows-1252、MacRoman(西歐語言)
ISO-8859-7、windows-1253(希臘語)
ISO-8859-8、windows-1255(視覺和邏輯希伯來語)
TIS-620(泰語)
注意

我們的 ISO-8859-2 和 windows-1250(匈牙利語)探測器已暫時禁用,直到我們重新訓練模型。

需要 Python 3.7+。

相關文章