Python排序演算法[二]:測試資料的迷霧散去
演算法試驗中不僅僅要嘗試使用不同的寫法,更要注意測試所用資料的規律性,它們都會直接影響測試結果。
閱讀本文大概需要 5 分鐘。
在上一篇文章《Python 排序演算法[一]:令你茅塞頓開,卻又匪夷所思》中我們學習了排序演算法中比較費時間的三種:氣泡排序、選擇排序、插入排序。並且在測試過程中發現了匪夷所思的問題,但是這都難不倒諸位 Coder。回顧一下上次測試的結果(3 萬零 1 的資料排序):
氣泡排序 - 41
選擇排序(兩層 for) - 47
選擇排序(max mix) - 14
插入排序 - 0.007398
相對而言,氣泡排序和選擇排序連插入排序的尾燈都看不到。
大家都認為造成插入排序速度與其他兩種排序速度巨大差異的原因是資料量和規律的值(當時的值非常規律,data=[i for i in range(3000)])。
所以這一次我將使用隨機值來再次測試,看一看排序速度是否跟排序值的規律程度有關:
隨機值
這一次的測試資料與上一次的不同,上一次確實是太規律了,所以這一次採用隨機值:
from random import randint
data = [randint(6, 20000) for i in range(30000)]
data.insert(500, 5)
data.insert(700, 7)
data.insert(900, 9)
並且還在生成的隨機值列表中不同位置插入 3 個值,有了不規律的隨機值,接下來就可以開始測試了。
氣泡排序
def bubble(data):
for i in range(len(data)-1): # 排序次數
for s in range(len(data)-i-1): # s為列表下標
if data[s] > data[s+1]:
data[s], data[s+1] = data[s+1], data[s]
return data
start_time = datetime.now()
res = bubble(data)
print(datetime.now() - start_time)
print(len(res), res[:5], res[700:705], res[10000:10005])
得到的輸出結果為:
0:01:20.273247
30003 [5, 6, 7, 7, 7] [492, 492, 492, 493, 495] [6665, 6665, 6666, 6668, 6668]
80 秒!氣泡排序的測試結果證明,隨機元素的列表排序比規律元素的列表排序費時更久。
選擇排序(兩層 for)
def selections(nums):
for i in range(len(nums)):
min_index = min(nums) # 最小值
for j in range(len(nums) - i):
if nums[min_index] < nums[j]:
min_index = j
nums[min_index], nums[len(nums) - i - 1] = nums[len(nums) - i - 1], nums[min_index]
return nums
start_time = datetime.now()
res = selections(data)
print(datetime.now() - start_time)
print(len(res), res[:5], res[700:705], res[10000:10005])
得到的結果為:
0:01:07.171114
30003 [6, 6, 7, 7, 8] [444, 445, 445, 446, 447] [6652, 6654, 6654, 6654, 6654]
本次耗時 67 秒,而之前使用規律的值排序時耗時約 47 秒。選擇排序(兩層 for)的測試結果同樣證明了隨機元素的列表排序比規律元素的列表排序費時更久。
選擇排序(min max)
start_time = datetime.now()
res = []
for i in range(0, len(data)):
aps = min(data)
data.remove(aps)
res.append(aps)
print(datetime.now() - start_time)
print(len(res), res[:5], res[700:705], res[10000:10005])
執行後得到的輸出結果為:
0:00:10.102158
30003 [5, 6, 6, 7, 7] [443, 443, 443, 444, 444] [6645, 6646, 6649, 6650, 6650]
這一次耗時 10 秒,甚至比之前規律元素排序耗費的 14 秒更省時間。
插入排序
def direct_insert(nums):
# 崔慶才丨靜覓、韋世東丨奎因 邀請你關注微信公眾號【進擊的Coder】
for i in range(1, len(nums)):
temp = nums[i] # temp變數指向尚未排好序元素(從第二個開始)
j = i-1 # j指向前一個元素的下標
while j >= 0 and temp < nums[j]:
# temp與前一個元素比較,若temp較小則前一元素後移,j自減,繼續比較
nums[j+1] = nums[j]
j = j-1
nums[j+1] = temp # temp所指向元素的最終位置
return nums
start_time = datetime.now()
res = direct_insert(data)
print(datetime.now() - start_time)
print(len(res), res[:5], res[700:705], res[10000:10005])
執行後得到的輸出結果為:
0:00:57.681174
30003 [5, 6, 6, 7, 7] [455, 456, 459, 459, 460] [6647, 6649, 6649, 6649, 6649]
這一次插入排序的速度再不是快的離譜了,在猜想範圍之內。
迷霧散去
相比上一次使用非常規律的 [ i for i in range(3000)],這一次使用 randint 生成的列表肯定是非常不規律的:
print(data[:20])
列印列表前 20 的元素,得到結果為:
[13698, 19871, 8468, 8735, 3473, 510, 788, 5070, 14585, 13324, 11743, 4310, 16460, 7102, 1900, 16608, 12342, 9724, 1482, 19609]
這些元素的值有百位、千位、萬位,證明了它們確是是不規律的。
多次測試得到的結果都相差無幾,在以上幾種排序的測試中,3 萬左右的資料量排序最快的是選擇排序(min max),它的排序速度保持在 10 秒內。
選擇排序的時間複雜度還是 O(n*n) 麼?
為什麼同樣是找到最大(小)值,使用 max/min + pop 的速度會快很多,真的是因為 pop 後,n 就變成了 k,複雜度變成了 O(n+k) 了呢???
一次的實驗,告訴我們在測試中應該採用隨機值的列表,而不是像上一次那樣使用非常規律的 [i for i in range(3000)]
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31557738/viewspace-2286548/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 撥開JS事件的迷霧(一)JS事件
- 《迷霧偵探》評測: 賽博朋克版的《清明上河圖》
- 複習資料結構:排序演算法(二)——氣泡排序資料結構排序演算法
- Java資料結構與排序演算法 (二)Java資料結構排序演算法
- 迷霧探險10 | 踩坑Gym
- TestComplete資料驅動測試教程(二)——記錄測試資料
- 硬核技術宅偵探和他的007黑貓——《迷霧偵探》評測
- 撥開SAP與Hadoop整合的迷霧LLHadoop
- AI演算法測評(二)--演算法測試流程AI演算法
- 資料結構與演算法:二叉排序樹資料結構演算法排序
- 揭開迷霧,尋找真相《迷霧之夏》PC版現已在Steam平臺發售!線上活動盤點
- python連線資料庫測試Python資料庫
- python演算法與資料結構-希爾排序(35)Python演算法資料結構排序
- python演算法與資料結構-快速排序(36)Python演算法資料結構排序
- 新潮測試平臺--慎用 PRC 返回的資料 (二)
- 排序演算法(二)排序演算法
- 陣列排序的測試陣列排序
- 軟體測試之資料庫系列二資料庫
- 試題集—— 演算法提高 學霸的迷宮演算法
- 《迷霧偵探》國產賽博朋克偵探遊戲遊戲
- Python factory_boy 生成測試資料Python
- python演算法與資料結構-氣泡排序(32)Python演算法資料結構排序
- python演算法與資料結構-插入排序(34)Python演算法資料結構排序
- 資料排序_麥克機試排序
- 簡單介紹Python迷宮生成和迷宮破解演算法Python演算法
- 雲裡霧裡的資料庫資料庫
- 資料結構與演算法——排序演算法-氣泡排序資料結構演算法排序
- 資料結構與演算法——排序演算法-選擇排序資料結構演算法排序
- 資料結構與演算法——排序演算法-歸併排序資料結構演算法排序
- 資料結構與演算法——排序演算法-基數排序資料結構演算法排序
- python排序演算法的實現-快速排序Python排序演算法
- 測試資料
- 資料結構(python) —— 【18排序: 桶排序】資料結構Python排序
- 關於大資料測試,你一定要試試python的fake庫大資料Python
- 大資料測試與 傳統資料庫測試大資料資料庫
- python介面測試—post請求(二)Python
- python 常用的排序演算法Python排序演算法
- Python自動化測試-使用Pandas來高效處理測試資料Python