題目
給定列表,列表內的資料全是str型別,對列表內的資料進行統計元素出現的次數,並排序。
例:["a", "b", "g", "g", "b", "g", "l", "k", "k"]
返回:{'g': 3, 'b': 2, 'k': 2, 'a': 1, 'l': 1}
解1
不使用任何內建函式:
def count_list_1(data:list):
res = {}
for item in data:
if item not in res.keys():
res[item] = 1
else:
res[item] += 1
return dict(sorted(res.items(), key=lambda i:i[1], reverse=True))
測試:
print(count_list_1(["a", "b", "g", "g", "b", "g", "l", "k", "k"]))
# 返回
{'g': 3, 'b': 2, 'k': 2, 'a': 1, 'l': 1}
解2
使用列表的count
函式。
def count_list_2(data:list):
res = {}
for item in data:
res[item] = data.count(item)
return dict(sorted(res.items(), key=lambda i:i[1], reverse=True))
測試:
print(count_list_2(["a", "b", "g", "g", "b", "g", "l", "k", "k"]))
# 返回
{'g': 3, 'b': 2, 'k': 2, 'a': 1, 'l': 1}
解3
使用collections.Counter
import collections
def count_list_3(data:list):
return dict(sorted(collections.Counter(data).items(), key=lambda i: i[1], reverse=True))
測試:
print(count_list_3(["a", "b", "g", "g", "b", "g", "l", "k", "k"]))
# 返回
{'g': 3, 'b': 2, 'k': 2, 'a': 1, 'l': 1}
消耗時間對比
對程式碼進行改造,隨機生成一個字串列表。然後使用cProfile
進行測試。
# 統計列表中的重複的元素的個數, 並對結果進行排序
# ["a", "b", "g", "g", "b", "g"] => {"a": 1, "b":2, "g": 3}
import collections
import random
import string
def count_list_1(data: list):
res = {}
for item in data:
if item not in res.keys():
res[item] = 1
else:
res[item] += 1
return dict(sorted(res.items(), key=lambda i: i[1], reverse=True))
def count_list_2(data: list):
res = {}
for item in data:
if item not in res.keys():
res[item] = data.count(item)
return dict(sorted(res.items(), key=lambda i: i[1], reverse=True))
def count_list_3(data: list):
return dict(sorted(collections.Counter(data).items(), key=lambda i: i[1], reverse=True))
if __name__ == "__main__":
data = [random.choice(string.ascii_letters) for i in range(10000)]
count_list_1(data)
count_list_2(data)
count_list_3(data)
測試命令: python -m cProfile -s tottime test.py |grep count_list
列表長度為10000,測試結果:
ncalls tottime percall cumtime percall filename:lineno(function)
1 0.002 0.002 0.003 0.003 test.py:9(count_list_1)
1 0.001 0.001 0.010 0.010 test.py:19(count_list_2)
1 0.000 0.000 0.000 0.000 test.py:27(count_list_3)
列表長度為50000,測試結果:
ncalls tottime percall cumtime percall filename:lineno(function)
1 0.010 0.010 0.013 0.013 test.py:9(count_list_1)
1 0.006 0.006 0.044 0.044 test.py:19(count_list_2)
1 0.000 0.000 0.002 0.002 test.py:27(count_list_3)
列表長度為100000,測試結果:
ncalls tottime percall cumtime percall filename:lineno(function)
1 0.020 0.020 0.026 0.026 test.py:9(count_list_1)
1 0.012 0.012 0.090 0.090 test.py:19(count_list_2)
1 0.000 0.000 0.004 0.004 test.py:27(count_list_3)
由此可見,collections.Counter
效能是最好的, 列表中的count
函式次之。
有興趣的童鞋可以研究下Counter
的原始碼是怎麼寫的。
Enjoy your code, good luck.