difflib： Python 比較資料集

luckzack發表於2024-05-09

原文網址 : https://www.cnblogs.com/luckzack/p/18182172

difflib 是一個專注於比較資料集（尤其是字串）的 Python 模組。為了具體瞭解您可以使用此模組完成的幾件事，讓我們檢查一下它的一些最常見的函式。

SequenceMatcher

SequenceMatcher 是一個比較兩個字串並根據它們的相似性返回資料的函式。透過使用 ratio()，我們將能夠根據比率/百分比來量化這種相似性。

語法：

SequenceMatcher(None, string1, string2)

下面這個簡單的例子展示了該函式的作用：

from difflib import SequenceMatcher

phrase1 = "Tandrew loves Trees."
phrase2 = "Tandrew loves to mount Trees."
similarity = SequenceMatcher(None, phrase1, phrase2)
print(similarity.ratio())
# Output: 0.8163265306122449

get_close_matches

接下來是 get_close_matches，該函式返回與作為引數傳入的字串最接近的匹配項。
語法：

get_close_matches(word, possibilities, result_limit, min_similarity)

下面解釋一下這些可能有些混亂的引數：

word 是函式將要檢視的目標單詞。
possibilities 是一個陣列，其中包含函式將要查詢的匹配項並找到最接近的匹配項。
result_limit 是返回結果數量的限制（可選）。
min_similarity 是兩個單詞需要具有的最小相似度才能被函式視為返回值（可選）。

下面是它的一個使用示例：

from difflib import get_close_matches

word = 'Tandrew'
possibilities = ['Andrew', 'Teresa', 'Kairu', 'Janderson', 'Drew']

print(get_close_matches(word, possibilities))
# Output: ['Andrew']

除此之外還有幾個是您可以檢視的屬於 Difflib 的其他一些方法和類：unified_diff、Differ和 diff_bytes

主流資料庫比較
2024-03-29
資料庫
圖資料庫比較
2020-10-11
資料庫
HHDESK資料夾比較功能
2023-02-22
python字串比較大小
2020-12-07
Python字串
77種資料建模工具比較
2018-10-23
Go和Python比較的話，哪個比較好？
2019-04-03
GoPython
從全方位為你比較3種資料科學工具的比較：Python、R和SAS（附連結）
2019-04-28
資料科學Python
Python 解惑：整數比較
2019-01-17
Python
Python與Excel VBA比較
2024-04-30
PythonExcel
python 批量resize效能比較
2019-03-04
Python
字符集和比較規則
2020-03-11
淺談前端MOCK資料工具比較
2018-11-16
前端Mock
pathlib and difflib
2024-06-07
mysql資料庫中decimal資料型別比較大小
2024-08-15
MySql資料庫Decimal資料型別
Python2轉Python3比較
2018-11-05
Python
python比較json/dictionary的庫
2019-01-16
PythonJSON
3 個 Python 模板庫比較
2018-06-05
Python
Python的List vs Tuple比較
2021-12-12
Python
influxdb與傳統資料庫的比較
2018-10-10
UX資料庫
比較 Apache Hadoop 資料儲存格式 - techwell
2021-12-24
ApacheHadoop
mongodb資料遷移2種方式比較
2021-09-09
MongoDB
每天分享一個好用的Python庫-difflib
2021-06-22
Python
K8S資料保護工具比較
2020-04-23
K8S
如何比較版本號--Python實現
2018-08-17
Python
磁碟資料庫與記憶體資料庫的特點比較
2018-03-06
資料庫記憶體
HashMap，LinkedHashMap，TreeMap讀取大量資料效率的比較
2019-03-15
HashMap
資料庫系列：MySQL引擎MyISAM和InnoDB的比較
2023-10-31
資料庫MySql
開源向量資料庫比較：Chroma, Milvus, Faiss,Weaviate
2024-04-25
資料庫AI
java比較mysql兩個資料庫中差異
2024-07-19
JavaMySql資料庫
資料湖表格式比較（Iceberg、Hudi 和 Delta Lake）
2022-06-14
區塊鏈與分散式資料庫的比較
2022-03-04
區塊鏈分散式資料庫
資料湖倉比較：Apache Hudi、Delta Lake、Apache Iceberg
2022-08-22
Apache
Dapper, Ef core, Freesql 插入大量資料效能比較（二）
2021-04-13
APPSQL
PHP基礎-資料型別-string和int比較
2021-01-19
PHP資料型別
js 深比較和淺比較
2020-11-26
JS
python如何比較兩個字串是否相等
2021-09-11
Python字串
Python小知識之物件的比較
2021-10-12
Python物件
Web前端和Python學哪個比較好？Python教程！
2021-04-14
Web前端Python

difflib： Python 比較資料集

SequenceMatcher

get_close_matches

相關文章