pyton 統計單詞並排序-ok
- lines_count = 0
- words_count = 0
- chars_count = 0
- words_dict = {}
- lines_list = []
- c1 = ['!', '?', ';', '.', ',']
- all_line = ''
- import collections
- with open('c:\invalid.txt', 'r') as f:
- for line in f:
- line = line.strip('\n')
- lines_count = lines_count + 1
- all_line=all_line+line.lower()
- # print line
- #print all_line
- for i in c1:
- all_line=all_line.replace(i,' ')
- # print all_line
- str1=all_line.split(' ')
- for i in str1:
- if i not in words_dict:
- words_dict[i] = 1
- else:
- words_dict[i] = words_dict[i] + 1
- c1=words_dict.items()
- c2=[]
- for i in c1:
- c2.append((i[1],i[0]))
- d2={}
- d2={}
- for i in c2:
- d2[i[0]]=i[1]
- def mySort(a):
- lo = len(a) - 1
- i = 0
- while i < lo + 1:
- j = lo
- while j >= i:
- if (a[j - 1] > a[j]):
- a[j], a[j - 1] = a[j - 1], a[j]
- j = j - 1
- i = i + 1
- if __name__ == '__main__':
- for i in sorted(d2.keys()):
- print d2[i], ':', i
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/20747382/viewspace-2135622/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 瓦爾登湖單詞統計+排序排序
- 統計一個字串中的單詞的個數,並列印各個單詞字串
- 對文字檔案中的單詞統計出現的次數(即詞頻)並按詞頻的從高到低排序排序
- 10:單詞排序排序
- Nginx統計訪問IP並排序Nginx排序
- 一個單詞統計的例項,怎樣通過MapReduce完成排序?排序
- C++ 統計單詞數C++
- spark下統計單詞頻次Spark
- PHP讀取文字並計算單詞所在行列PHP
- python 統計文章單詞個數Python
- 統計檔案中單詞個數
- 瓦爾登湖各單詞出現頻次,並按排次由高到低排序排序
- python 統計文章單詞個數-1Python
- python 統計文章單詞個數 -2Python
- 統計檔案中出現的單詞次數
- 個人專案----詞頻統計----單元測試
- Java簡單實現漢語詞頻統計Java
- Linux驅動程式:統計單詞個數Linux
- OK Log設計思路
- 詞頻統計
- python TK庫 統計word文件單詞詞頻程式 UI選擇文件PythonUI
- Spark入門(三)--Spark經典的單詞統計Spark
- Javafx-【直方圖】文字頻次統計工具 中文/英文單詞統計Java直方圖
- 熱詞統計分析
- 詞頻統計mapreduce
- 使用map:單詞計數程式
- 詞頻統計-------------web版本Web
- python統計英文文字中的迴文單詞數Python
- hadoop之旅6-windows本地MapReducer離線單詞統計HadoopWindows
- jieba 詞性標註 & 並行分詞Jieba詞性標註並行分詞
- 單詞
- 期末大作業關於利用hadoop來統計單詞數目Hadoop
- 單詞小卡片 -- 從單詞、例句收集到命令式背單詞
- python如何統計詞頻Python
- 【python技能】詞頻統計Python
- 字串處理:下劃線,多空格變單空格,統計單詞出現個數字串
- 文字挖掘之語料庫、分詞、詞頻統計分詞
- 呼叫MapReduce對檔案中單詞出現次數進行統計