簡介
之前的文章我們講了count排序,但是count排序有個限制,因為count陣列是有限的,如果陣列中的元素範圍過大,使用count排序是不現實的,其時間複雜度會膨脹。
而解決大範圍的元素排序的辦法就是基數排序。
基數排序的例子
什麼是基數排序呢?
考慮一下,雖然我們不能直接將所有範圍內的數字都使用count陣列進行排序,但是我們可以考慮按數字的位數來進行n輪count排序,每一輪都只對數字的某一位進行排序。
最終仍然可以得到結果,並且還可以擺脫count陣列大小的限制,這就是基數排序。
假如我們現在陣列的元素是:1221, 15, 20, 3681, 277, 5420, 71, 1522, 4793。
先看動畫,看下最直觀的基數排序的過程:
在上面的例子中,我們先對個位進行count排序,然後對十位進行count排序,然後是百位和千位。
最後生成最終的排序結果。
基數排序的java程式碼實現
因為基數排序實際上是分別按位數的count排序。所以我們可以重用之前寫的count排序的程式碼,只是需要進行一些改造。
doCountingSort方法除了傳入陣列外,還需要傳入排序的位數digit,我們用1,10,100,1000來表示。
看一下改造過後的doCountingSort方法:
public void doRadixSort(int[] array, int digit){
int n = array.length;
// 儲存排序過後的陣列
int output[] = new int[n];
// count陣列,用來儲存統計各個元素出現的次數
int count[] = new int[10];
Arrays.fill(count,0);
log.info("初始化count值:{}",count);
// 將原始陣列中資料出現次數存入count陣列
for (int i=0; i<n; ++i) {
count[(array[i]/digit)%10]++;
}
log.info("count之後count值:{}",count);
// 這裡是一個小技巧,我們根據count中元素出現的次數計算對應元素第一次應該出現在output中的下標。
//這裡的下標是從右往左數的
for (int i=1; i<10; i++) {
count[i] += count[i - 1];
}
log.info("整理count對應的output下標:{}",count);
// 根據count中的下標,構建排序後的陣列
//插入一個之後,相應的count下標要減一
for (int i = n-1; i>=0; i--)
{
output[count[(array[i]/digit)%10]-1] = array[i];
count[(array[i]/digit)%10]--;
}
log.info("構建output之後的output值:{}",output);
//將排序後的陣列寫回原陣列
for (int i = 0; i<n; ++i)
array[i] = output[i];
}
跟count排序變化不大,區別就是這裡我們需要使用count[(array[i]/digit)%10],來對每一位進行排序。
另外,為了計算出位數digit的值,我們還需要拿到陣列中最大元素的值:
public int getMax(int[] array)
{
int mx = array[0];
for (int i = 1; i < array.length; i++)
if (array[i] > mx){
mx = array[i];
}
return mx;
}
看下怎麼呼叫:
public static void main(String[] args) {
int[] array= {1221, 15, 20, 3681, 277, 5420, 71, 1522, 4793};
RadixSort radixSort=new RadixSort();
log.info("radixSort之前的陣列為:{}",array);
//拿到陣列的最大值,用於計算digit
int max = radixSort.getMax(array);
//根據位數,遍歷進行count排序
for (int digit = 1; max/digit > 0; digit *= 10){
radixSort.doRadixSort(array,digit);
}
}
看下輸出結果:
很好,結果都排序了。
基數排序的時間複雜度
從計算過程我們可以看出,基數排序的時間複雜度是O(d*(n+b)) ,其中b是數字的進位制數,比如上面我們使用的是10進位制,那麼b=10。
d是需要迴圈的輪數,也就是陣列中最大數的位數。假如陣列中最大的數字用K表示,那麼d=logb(k)。
綜上,基數排序的時間複雜度是O((n+b) * logb(k))。
當k <= nc,其中c是常量時,上面的時間複雜度可以近似等於O(nLogb(n))。
考慮下當b=n的情況下,基數排序的時間複雜度可以近似等於線性時間複雜度O(n)。
本文的程式碼地址:
本文已收錄於 http://www.flydean.com/algorithm-radix-sort/
最通俗的解讀,最深刻的乾貨,最簡潔的教程,眾多你不知道的小技巧等你來發現!
歡迎關注我的公眾號:「程式那些事」,懂技術,更懂你!