PythonShowMeTheCode(0004): 檢查單詞個數
1. 題目
第 0004 題:任一個英文的純文字檔案,統計其中的單詞出現的個數。
2. 效果
#------1.txt-----------
There are moments in life when you miss only
one life and one chance to do
you want to do.is
isn't don't word_d common
#------輸出------------
do: 2
word_d: 1
want: 1
to: 2
is: 1
you: 2
isn't: 1
don't: 1
...
- 將所有單詞按照小寫處理
-
isn't
和word_d
這種應當作為一個單詞
3. 實現
# -*- coding:utf-8 -*-
import re
def get_word_dict(file_path=None):
if file_path is None:
print("Error")
return
word_dict = {}
with open(file_path, "r", encoding="utf-8") as file:
for line in file.readlines():
words = re.findall(r"[a-z\'_-]+\b", line.lower())
for word in words:
if word not in word_dict:
word_dict[word] = 1
else:
word_dict[word] += 1
for word, count in word_dict.items():
print("%s: %d\n" % (word, count))
return word_dict
if __name__ == "__main__":
get_word_dic("1.txt")
4. 解決問題
<i>I. 無法識別isn't
這樣的單詞</i>
在正則匹配時需要在加入一個\b
來作為單詞邊界。
<i>II. 讀取檔案出現編碼錯誤</i>
在open()
函式中加入encoding引數。
相關文章
- 用 Python 做單詞拼寫檢查Python
- 統計一個字串中的單詞的個數,並列印各個單詞字串
- python 統計文章單詞個數Python
- 統計檔案中單詞個數
- Linux獲取某個單詞的個數Linux
- python 統計文章單詞個數-1Python
- python 統計文章單詞個數 -2Python
- 基於海量詞庫的單詞拼寫檢查、推薦到底是咋做的?
- Linux驅動程式:統計單詞個數Linux
- 使用map:單詞計數程式
- C++ 統計單詞數C++
- 一個簡單資料庫健康檢查指令碼資料庫指令碼
- 【TUNE_ORACLE】Oracle檢查點(三)增量檢查點四個關鍵引數介紹Oracle
- js查詢字串中字元最多的單詞JS字串字元
- 分享一個簡單的 laravel 應用健康檢查命令Laravel
- 【附原始碼】小程式初窺之簡單查單詞原始碼
- 11-09字串中的單詞數字串
- 將數字轉換成單詞形式
- 字串處理:下劃線,多空格變單空格,統計單詞出現個數字串
- 正規表示式查詢相似單詞的方法
- 單詞
- 轉:用Perl實現單詞計數器
- 單詞小卡片 -- 從單詞、例句收集到命令式背單詞
- zzulioj:1133:單詞個數統計(python)我有點皮!!嘿嘿Python
- paip.語義分析--分詞--常見的單音節字詞 2_deDuli 單字詞 774個AI分詞
- 檢查特殊字元的簡單VCL (轉)字元
- webpack單詞Web
- 單詞拆分
- 單詞遊戲遊戲
- LeetCode-434-字串中的單詞數LeetCode字串
- 統計檔案中出現的單詞次數
- Hadoop--map/reduce實現單詞計數Hadoop
- 字串最後一個單詞的長度字串
- 一個簡單的英漢詞典小程式
- 利用Hadoop執行第一個程式,計算文章中不同單詞數量Hadoop
- js查詢包含字元最多的單詞的字元長度JS字元
- 資料結構與演算法——單詞查詢樹資料結構演算法
- python製作查詢單詞翻譯的指令碼Python指令碼