資料結構學習(C++)續——排序【2】插入排序 (轉)

worldblog發表於2007-08-16
資料結構學習(C++)續——排序【2】插入排序 (轉)[@more@]

基本思想是,每步將一個待排序的記錄,按其關鍵碼大小,插入到前面已經排好序的記錄的適當位置,從頭做到尾就可以了。

直接插入排序

template

void InsertSort(T a[], int N, int& KCN, int& RMN)

{

  KCN = 0; RMN = 0;

  for (int i = 1; i < N; i++)

  {

  T temp = a[i]; RMN++;

  for (int j = i; j > 0 && ++KCN && temp < a[j - 1]; j--) { a[j] = a[j - 1]; RMN++; }

  a[j] = temp; RMN++;

  }

}

精簡之後就是這樣:

template void InsertSort(T a[], int N)

{

  for (int i = 1; i < N; i++)

  {

  T temp = a[i];

  for (int j = i; j > 0 && temp < a[j - 1]; j--) a[j] = a[j - 1];

  a[j] = temp;

  }

}

測試結果:

Sort ascending  N=10000 TimeSpared: 0ms

KCN=9999  KCN/N=0.9999  KCN/N^2=9.999e-005 KCN/NlogN=0.07525

RMN=19998  RMN/N=1.9998  RMN/N^2=0.00019998 RMN/NlogN=0.1505

Sort ranness N=10000 TimeSpared: 330ms

KCN=24293730  KCN/N=2429.37  KCN/N^2=0.242937  KCN/NlogN=182.829

RMN=24303739  RMN/N=2430.37  RMN/N^2=0.243037  RMN/NlogN=182.904

Sort descending N=10000 TimeSpared: 711ms

KCN=49995000  KCN/N=4999.5  KCN/N^2=0.49995  KCN/NlogN=376.25

RMN=50014998  RMN/N=5001.5  RMN/N^2=0.50015  RMN/NlogN=376.4

可以看出,平均近似為n2/4,書上沒有騙人(廢話,多少人做過多少試驗才得出的結論)。

折半插入排序

將直插排序中的搜尋策略由順序搜尋變為折半搜尋,便能得到此種排序方法。顯而易見,只能減少KCN,不能減少RMN,所能帶來的效能提升也不會太大。

template

void BinaryInsertSort(T a[], int N, int& KCN, int& RMN)

{

  KCN = 0; RMN = 0;

  for (int i = 1; i < N; i++)

  {

  T temp = a[i]; RMN++; int low = 0, high = i - 1;

  while (low <= high)//折半查詢

  {

    int mid = (low + high) / 2;

  if (++KCN && temp < a[mid]) high = mid - 1; else low = mid + 1;

  }

  for (int j = i - 1; j >= low; j--) { a[j + 1] = a[j]; RMN++; }//記錄後移

  a[low] = temp; RMN++;//插入

  }

}

測試結果:

Sort ascending  N=10000 TimeSpared: 0ms

KCN=123617  KCN/N=12.3617  KCN/N^2=0.00123617 KCN/NlogN=0.930311

RMN=19998  RMN/N=1.9998  RMN/N^2=0.00019998 RMN/NlogN=0.1505

Sort randomness N=10000 TimeSpared: 320ms

KCN=118987  KCN/N=11.8987  KCN/N^2=0.00118987 KCN/NlogN=0.895466

RMN=24303739  RMN/N=2430.37  RMN/N^2=0.243037  RMN/NlogN=182.904

Sort descending N=10000 TimeSpared: 631ms

KCN=113631  KCN/N=11.3631  KCN/N^2=0.00113631 KCN/NlogN=0.855158

RMN=50014998  RMN/N=5001.5  RMN/N^2=0.50015  RMN/NlogN=376.4

可以看到KCN近似為nlog2n,有一定的效能提升。

表插入排序

如果用“指標”來表示記錄間的順序,就可以避免大量的記錄移動,當然,最後還是要根據“指標”重排一下。自然的,折半查詢在這裡用不上了。

template

void TableInsertSort(T a[], int N, int& KCN, int& RMN)

{

  KCN = 0; RMN = 0;

  int* link = new int[N]; int head = 0, pre, cur, i; link[0] = -1;

  for (i = 1; i < N; i++)

  {

  if (a[head] > a[i]) { link[i] = head; head = i; KCN++;}//沒設表頭,因此需要此判斷,失敗時此次判斷沒記入KCN

  else

  {

    for (cur = head; cur != -1&& ++KCN && a[cur] <= a[i]; cur = link[cur]) pre = cur;

    link[pre] = i; link[i] = cur;

  }

  }

  cur = head;//重排序列

  for (i = 0; i < N; i++)

  {

  while (cur < i) cur = link[cur];

  pre = link[cur];

  if (cur != i)

  {

    s(a[i], a[cur]); RMN += 3;

    link[cur] = link[i]; link[i] = cur;

  }

  cur = pre;

  }

  delete []link;

}

測試結果:

Sort ascending  N=10000 TimeSpared: 751ms

KCN=49995000  KCN/N=4999.5  KCN/N^2=0.49995  KCN/NlogN=376.25

RMN=0  RMN/N=0  RMN/N^2=0  RMN/NlogN=0

Sort randomness N=10000 TimeSpared: 621ms

KCN=25721250  KCN/N=2572.13  KCN/N^2=0.257213  KCN/NlogN=193.572

RMN=29955  RMN/N=2.9955  RMN/N^2=0.00029955 RMN/NlogN=0.225434

Sort descending N=10000 TimeSpared: 0ms

KCN=9999  KCN/N=0.9999  KCN/N^2=9.999e-005 KCN/NlogN=0.07525

RMN=15000  RMN/N=1.5  RMN/N^2=0.00015  RMN/NlogN=0.112886

可以看到,確實減少了RMN,理論上RMNmax=3(n-1)。然而,就平均情況而言,效能還不如簡單的直插——這是由於測試是整數的緣故。對於連結串列來說,這種方法就不需要最後的重排了。關於重排的演算法在嚴蔚敏的《資料結構(C語言版)》上有詳細的說明。

希爾排序

前面的演算法的平均都不怎麼好,但我們注意到直插排序在關鍵碼基本有序的情況下,效率是最好的,並且,在關鍵碼的數量很少的時候,n和n2的差距也不是那麼的明顯。基於以上的事實,D.L.在1959年(老古董了)提出了縮小增量排序,基本思想是:取一個間隔(gap),將序列分成若干的子序列,對每個子序列進行直插排序;然後逐漸縮小間隔,重複以上過程,直到間隔為1。在開始的時候,每個子序列裡關鍵碼很少,直插的效率很高;隨著間隔的縮小,子序列的關鍵碼越來越多,但是在前面的排序基礎上,關鍵碼已經基本有序,直插的效率依然很高。

希爾排序的時間複雜度不好估量,gap的選取也沒有定論,gap=[gap/2]的是最好寫的,至於為什麼,寫寫就知道了。

template

void ShellSort(T a[], int N, int& KCN, int& RMN)

{

  KCN = 0; RMN = 0;

  for (int gap = N/2; gap; gap = gap/2):namespace prefix = o ns = "urn:schemas--com::office" />

  for (int i = gap; i < N; i++)

  {

  T temp = a[i]; RMN++;

    for (int j = i; j >= gap && ++KCN && temp < a[j - gap]; j -= gap)

    { a[j] = a[j - gap]; RMN++; }

    a[j] = temp; RMN++;

    }

}

測試結果:

Sort ascending  N=10000 TimeSpared: 0ms

KCN=120005  KCN/N=12.0005  KCN/N^2=0.00120005 KCN/NlogN=0.903128

RMN=240010  RMN/N=24.001  RMN/N^2=0.0024001  RMN/NlogN=1.80626

Sort randomness N=10000 TimeSpared: 10ms

KCN=258935  KCN/N=25.8935   KCN/N^2=0.00258935 KCN/NlogN=1.94868

RMN=383849  RMN/N=38.3849  RMN/N^2=0.00383849 RMN/NlogN=2.88875

Sort descending N=10000 TimeSpared: 10ms

KCN=172578  KCN/N=17.2578  KCN/N^2=0.00172578 KCN/NlogN=1.29878

RMN=302570  RMN/N=30.257  RMN/N^2=0.0030257  RMN/NlogN=2.27707

注意到這時的測試結果很不準確了,10000個整數的排序已經測試不出什麼來了(估計新機器都是0ms,我這裡也有個別的時候全是0)。因此,下面用100000個整數的排序重新測試了一次:

Sort ascending  N=100000  TimeSpared: 140ms

KCN=1500006  KCN/N=15.0001  KCN/N^2=0.000150001KCN/NlogN=0.903094

RMN=3000012  RMN/N=30.0001  RMN/N^2=0.000300001RMN/NlogN=1.80619

Sort randomness N=100000  TimeSpared: 230ms

KCN=4041917  KCN/N=40.4192  KCN/N^2=0.000404192KCN/NlogN=2.43348

RMN=5598883  RMN/N=55.9888  RMN/N^2=0.000559888RMN/NlogN=3.37086

Sort descending N=100000  TimeSpared: 151ms

KCN=2244585  KCN/N=22.4459  KCN/N^2=0.000224459KCN/NlogN=1.35137

RMN=3844572  RMN/N=38.4457  RMN/N^2=0.000384457RMN/NlogN=2.31466

這個結果表明,希爾排序幾乎沒有最壞情況,無論是正序、逆序、亂序,所用時間都不是很多,附加儲存是O(1),的確非常不錯。在沒搞清楚排序、堆排序之前,它的確是個很好的選擇,我當年一直用它。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/10752043/viewspace-962492/,如需轉載,請註明出處,否則將追究法律責任。

相關文章