計算機程式的思維邏輯 (31) - 剖析Arrays

swiftma發表於2016-10-17

原文網址 : https://juejin.im/post/58043a6da0bb9f00588bcab1

本系列文章經補充和完善，已修訂整理成書《Java程式設計的邏輯》（馬俊昌著），由機械工業出版社華章分社出版，於2018年1月上市熱銷，讀者好評如潮！各大網店和書店有售，歡迎購買：京東自營連結

陣列是儲存多個同型別元素的基本資料結構，陣列中的元素在記憶體連續存放，可以通過陣列下標直接定位任意元素，相比我們在後續章節介紹的其他容器，效率非常高。

陣列操作是計算機程式中的常見基本操作，Java中有一個類Arrays，包含一些對陣列操作的靜態方法，本節主要就來討論這些方法，我們先來看怎麼用，然後再來看它們的實現原理。學習Arrays的用法，我們就可以避免重新發明輪子，直接使用，學習它的實現原理，我們就可以在需要的時候，自己實現它不具備的功能。

用法

toString

Arrays的toString方法可以方便的輸出一個陣列的字串形式，方便檢視，它有九個過載的方法，包括八種基本型別陣列和一個物件型別陣列，這裡列舉兩個：

public static String toString(int[] a)
public static String toString(Object[] a) 
複製程式碼

例如：

int[] arr = {9,8,3,4};
System.out.println(Arrays.toString(arr));

String[] strArr = {"hello", "world"};
System.out.println(Arrays.toString(strArr));
複製程式碼

輸出為：

[9, 8, 3, 4]
[hello, world]
複製程式碼

如果不使用Arrays.toString，直接輸出陣列自身，即程式碼改為：

int[] arr = {9,8,3,4};
System.out.println(arr);

String[] strArr = {"hello", "world"};
System.out.println(strArr);
複製程式碼

則輸出會變為如下所示：

[I@1224b90
[Ljava.lang.String;@728edb84
複製程式碼

這個輸出就難以閱讀了，@後面的數字表示的是記憶體的地址。

陣列排序 - 基本型別

排序是一個非常常見的操作，同toString一樣，對每種基本型別的陣列，Arrays都有sort方法(boolean除外)，如：

public static void sort(int[] a)
public static void sort(double[] a)
複製程式碼

排序按照從小到大升序排，看個例子：

int[] arr = {4, 9, 3, 6, 10};
Arrays.sort(arr);
System.out.println(Arrays.toString(arr));
複製程式碼

輸出為：

[3, 4, 6, 9, 10]
複製程式碼

陣列已經排好序了。

sort還可以接受兩個引數，對指定範圍內的元素進行排序，如：

public static void sort(int[] a, int fromIndex, int toIndex)
複製程式碼

包括fromIndex位置的元素，不包括toIndex位置的元素，如：

int[] arr = {4, 9, 3, 6, 10};
Arrays.sort(arr,0,3);
System.out.println(Arrays.toString(arr));
複製程式碼

輸出為：

[3, 4, 9, 6, 10]
複製程式碼

只對前三個元素排序。

陣列排序 - 物件型別

除了基本型別，sort還可以直接接受物件型別，但物件需要實現Comparable介面。

public static void sort(Object[] a)
public static void sort(Object[] a, int fromIndex, int toIndex) 
複製程式碼

我們看個String陣列的例子：

String[] arr = {"hello","world", "Break","abc"};
Arrays.sort(arr);
System.out.println(Arrays.toString(arr));
複製程式碼

輸出為：

[Break, abc, hello, world]
複製程式碼

"Break"之所以排在最前面，是因為大寫字母比小寫字母都小。那如果排序的時候希望忽略大小寫呢？

陣列排序 - 自定義比較器

sort還有另外兩個過載方法，可以接受一個比較器作為引數：(如果用掘金app看，可能會有亂碼，是掘金bug，可以通過掘金PC版檢視，或者關注我的微信公眾號"老馬說程式設計"回覆31檢視)

public static <T> void sort(T[] a, Comparator<? super T> c)
public static <T> void sort(T[] a, int fromIndex, int toIndex,
                                Comparator<? super T> c)
複製程式碼

方法宣告中的T表示泛型，泛型我們在後續章節再介紹，這裡表示的是，這個方法可以支援所有物件型別，只要傳遞這個型別對應的比較器就可以了。Comparator就是比較器，它是一個介面，定義是：

public interface Comparator<T> {
    int compare(T o1, T o2);
    boolean equals(Object obj);
}
複製程式碼

最主要的是compare這個方法，它比較兩個物件，返回一個表示比較結果的值，-1表示o1小於o2，0表示相等，1表示o1大於o2。

排序是通過比較來實現的，sort方法在排序的過程中，需要對物件進行比較的時候，就呼叫比較器的compare方法。

String類有一個public靜態成員，表示忽略大小寫的比較器：

public static final Comparator<String> CASE_INSENSITIVE_ORDER
                                     = new CaseInsensitiveComparator();
複製程式碼

我們通過這個比較器再來對上面的String陣列排序：

String[] arr = {"hello","world", "Break","abc"};
Arrays.sort(arr, String.CASE_INSENSITIVE_ORDER);
System.out.println(Arrays.toString(arr));
複製程式碼

這樣，大小寫就忽略了，輸出變為了：

[abc, Break, hello, world]
複製程式碼

為進一步理解Comparator，我們來看下String的這個比較器的主要實現程式碼：

private static class CaseInsensitiveComparator
        implements Comparator<String> {
    public int compare(String s1, String s2) {
        int n1 = s1.length();
        int n2 = s2.length();
        int min = Math.min(n1, n2);
        for (int i = 0; i < min; i++) {
            char c1 = s1.charAt(i);
            char c2 = s2.charAt(i);
            if (c1 != c2) {
                c1 = Character.toUpperCase(c1);
                c2 = Character.toUpperCase(c2);
                if (c1 != c2) {
                    c1 = Character.toLowerCase(c1);
                    c2 = Character.toLowerCase(c2);
                    if (c1 != c2) {
                        // No overflow because of numeric promotion
                        return c1 - c2;
                    }
                }
            }
        }
        return n1 - n2;
    }
}
複製程式碼

程式碼比較直接，就不解釋了。

sort預設都是從小到大排序，如果希望按照從大到小排呢？對於物件型別，可以指定一個不同的Comparator，可以用匿名內部類來實現Comparator，比如可以這樣：

String[] arr = {"hello","world", "Break","abc"};
Arrays.sort(arr, new Comparator<String>() {
    @Override
    public int compare(String o1, String o2) {
        return o2.compareToIgnoreCase(o1);
    }
});
System.out.println(Arrays.toString(arr));
複製程式碼

程式輸出為：

[world, hello, Break, abc]
複製程式碼

以上程式碼使用一個匿名內部類實現Comparator介面，返回o2與o1進行忽略大小寫比較的結果，這樣就能實現，忽略大小寫，且按從大到小排序。為什麼o2與o1比就逆序了呢？因為預設情況下，是o1與o2比。

Collections類中有兩個靜態方法，可以返回逆序的Comparator，如

public static <T> Comparator<T> reverseOrder()
public static <T> Comparator<T> reverseOrder(Comparator<T> cmp)
複製程式碼

關於Collections類，我們在後續章節再詳細介紹。

這樣，上面字串忽略大小寫逆序排序的程式碼可以改為：

String[] arr = {"hello","world", "Break","abc"};
Arrays.sort(arr, Collections.reverseOrder(String.CASE_INSENSITIVE_ORDER));
System.out.println(Arrays.toString(arr));
複製程式碼

傳遞比較器Comparator給sort方法，體現了程式設計中一種重要的思維方式，將不變和變化相分離，排序的基本步驟和演算法是不變的，但按什麼排序是變化的，sort方法將不變的演算法設計為主體邏輯，而將變化的排序方式設計為引數，允許呼叫者動態指定，這也是一種常見的設計模式，它有一個名字，叫策略模式，不同的排序方式就是不同的策略。

二分查詢

Arrays包含很多與sort對應的查詢方法，可以在已排序的陣列中進行二分查詢，所謂二分查詢就是從中間開始找，如果小於中間元素，則在前半部分找，否則在後半部分找，每比較一次，要麼找到，要麼將查詢範圍縮小一半，所以查詢效率非常高。

二分查詢既可以針對基本型別陣列，也可以針對物件陣列，對物件陣列，也可以傳遞Comparator，也都可以指定查詢範圍，如下所示：

針對int陣列

public static int binarySearch(int[] a, int key)
public static int binarySearch(int[] a, int fromIndex, int toIndex,
                                       int key)
複製程式碼

針對物件陣列

public static int binarySearch(Object[] a, Object key)
複製程式碼

自定義比較器

public static <T> int binarySearch(T[] a, T key, Comparator<? super T> c) 
複製程式碼

如果能找到，binarySearch返回找到的元素索引，比如說：

int[] arr = {3,5,7,13,21};
System.out.println(Arrays.binarySearch(arr, 13));
複製程式碼

輸出為3。如果沒找到，返回一個負數，這個負數等於：-(插入點+1)，插入點表示，如果在這個位置插入沒找到的元素，可以保持原陣列有序，比如說：

int[] arr = {3,5,7,13,21};
System.out.println(Arrays.binarySearch(arr, 11));
複製程式碼

輸出為-4，表示插入點為3，如果在3這個索引位置處插入11，可以保持陣列有序，即陣列會變為：{3,5,7,11,13,21}

需要注意的是，binarySearch針對的必須是已排序陣列，如果指定了Comparator，需要和排序時指定的Comparator保持一致，另外，如果陣列中有多個匹配的元素，則返回哪一個是不確定的。

陣列拷貝

與toString一樣，也有多種過載形式，如：

public static long[] copyOf(long[] original, int newLength)
public static <T> T[] copyOf(T[] original, int newLength)
複製程式碼

後面那個是泛型用法，這裡表示的是，這個方法可以支援所有物件型別，引數是什麼陣列型別，返回結果就是什麼陣列型別。

newLength表示新陣列的長度，如果大於原陣列，則後面的元素值設為預設值。回顧一下預設值，對於數值型別，值為0，對於boolean，值為false，對於char，值為'\0'，對於物件，值為null。

來看個例子：

String[] arr = {"hello", "world"};
String[] newArr = Arrays.copyOf(arr, 3);
System.out.println(Arrays.toString(newArr));
複製程式碼

輸出為：

[hello, world, null]
複製程式碼

除了copyOf方法，Arrays中還有copyOfRange方法，以支援拷貝指定範圍的元素，如：

public static int[] copyOfRange(int[] original, int from, int to)
複製程式碼

from表示要拷貝的第一個元素的索引，新陣列的長度為to-from，to可以大於原陣列的長度，如果大於，與copyOf類似，多出的位置設為預設值。

來看個例子：

int[] arr = {0,1,3,5,7,13,19};
int[] subArr1 = Arrays.copyOfRange(arr,2,5);
int[] subArr2 = Arrays.copyOfRange(arr,5,10);
System.out.println(Arrays.toString(subArr1));
System.out.println(Arrays.toString(subArr2));
複製程式碼

輸出為：

[3, 5, 7]
[13, 19, 0, 0, 0]
複製程式碼

subArr1是正常的子陣列，subArr2拷貝時to大於原陣列長度，後面的值設為了0。

陣列比較

支援基本型別和物件型別，如下所示：

public static boolean equals(boolean[] a, boolean[] a2)
public static boolean equals(double[] a, double[] a2)
public static boolean equals(Object[] a, Object[] a2)
複製程式碼

只有陣列長度相同，且每個元素都相同，才返回true，否則返回false。對於物件，相同是指equals返回true。

填充值

Arrays包含很多fill方法，可以給陣列中的每個元素設定一個相同的值：

public static void fill(int[] a, int val)
複製程式碼

也可以給陣列中一個給定範圍的每個元素設定一個相同的值：

public static void fill(int[] a, int fromIndex, int toIndex, int val)
複製程式碼

比如說：

int[] arr = {3,5,7,13,21};
Arrays.fill(arr,2,4,0);
System.out.println(Arrays.toString(arr));
複製程式碼

將索引從2(含2)到4(不含4)的元素設定為0，輸出為：

[3, 5, 0, 0, 21]
複製程式碼

雜湊值

針對陣列，計算一個陣列的雜湊值：

public static int hashCode(int a[]) 
複製程式碼

計算hashCode的演算法和String是類似的，我們看下程式碼：

public static int hashCode(int a[]) {
    if (a == null)
        return 0;

    int result = 1;
    for (int element : a)
        result = 31 * result + element;

    return result;
}
複製程式碼

回顧一下，String計算hashCode的演算法也是類似的，陣列中的每個元素都影響hash值，位置不同，影響也不同，使用31一方面產生的雜湊值更分散，另一方面計算效率也比較高。

多維陣列

之前我們介紹的陣列都是一維的，陣列還可以是多維的，先來看二維陣列，比如：

int[][] arr = new int[2][3];
for(int i=0;i<arr.length;i++){
    for(int j=0;j<arr[i].length;j++){
        arr[i][j] = i+j;
    }
}

複製程式碼

arr就是一個二維陣列，第一維長度為2，第二維長度為3，類似於一個長方形矩陣，或者類似於一個表格，第一維表示行，第二維表示列。arr[i]表示第i行，它本身還是一個陣列，arr[i][j]表示第i行中的第j個元素。

除了二維，陣列還可以是三維、四維等，但一般而言，很少用到三維以上的陣列，有幾維，就有幾個[]，比如說，一個三維陣列的宣告為：

int[][][] arr = new int[10][10][10];
複製程式碼

在建立陣列時，除了第一維的長度需要指定外，其他維的長度不需要指定，甚至，第一維中，每個元素的第二維的長度可以不一樣，看個例子：

int[][] arr = new int[2][];
arr[0] = new int[3];
arr[1] = new int[5];
複製程式碼

arr是一個二維陣列，第一維的長度為2，第一個元素的第二維長度為3，而第二個為5。

多維陣列到底是什麼呢？其實，可以認為，多維陣列只是一個假象，只有一維陣列，只是陣列中的每個元素還可以是一個陣列，這樣就形成二維陣列，如果其中每個元素還都是一個陣列，那就是三維陣列。

多維陣列的操作

Arrays中的toString，equals，hashCode都有對應的針對多維陣列的方法：

public static String deepToString(Object[] a)
public static boolean deepEquals(Object[] a1, Object[] a2)
public static int deepHashCode(Object a[])
複製程式碼

這些deepXXX方法，都會判斷引數中的元素是否也為陣列，如果是，會遞迴進行操作。

看個例子：

int[][] arr = new int[][]{
        {0,1},
        {2,3,4},
        {5,6,7,8}
};
System.out.println(Arrays.deepToString(arr));
複製程式碼

輸出為：

[[0, 1], [2, 3, 4], [5, 6, 7, 8]]
複製程式碼

實現原理

下面，我們來看以上方法的實現原理。

hashCode的實現我們已經介紹了，fill和equals的實現都很簡單，迴圈操作而已，就不贅述了。

toString

toString的實現也很簡單，利用了StringBuilder，我們列下程式碼，但不做解釋了。

public static String toString(int[] a) {
    if (a == null)
        return "null";
    int iMax = a.length - 1;
    if (iMax == -1)
        return "[]";

    StringBuilder b = new StringBuilder();
    b.append('[');
    for (int i = 0; ; i++) {
        b.append(a[i]);
        if (i == iMax)
            return b.append(']').toString();
        b.append(", ");
    }
}
複製程式碼

拷貝

copyOf和copyOfRange利用了 System.arraycopy，邏輯也很簡單，我們也只是簡單列下程式碼：

public static int[] copyOfRange(int[] original, int from, int to) {
    int newLength = to - from;
    if (newLength < 0)
        throw new IllegalArgumentException(from + " > " + to);
    int[] copy = new int[newLength];
    System.arraycopy(original, from, copy, 0,
                     Math.min(original.length - from, newLength));
    return copy;
} 
複製程式碼

二分查詢

二分查詢binarySearch的程式碼也比較直接，主要程式碼如下：

private static <T> int binarySearch0(T[] a, int fromIndex, int toIndex,
                                     T key, Comparator<? super T> c) {
    int low = fromIndex;
    int high = toIndex - 1;

    while (low <= high) {
        int mid = (low + high) >>> 1;
        T midVal = a[mid];
        int cmp = c.compare(midVal, key);
        if (cmp < 0)
            low = mid + 1;
        else if (cmp > 0)
            high = mid - 1;
        else
            return mid; // key found
    }
    return -(low + 1);  // key not found.
}
複製程式碼

有兩個標誌low和high，表示查詢範圍，在while迴圈中，與中間值進行對比，大於則在後半部分找(提高low)，否則在前半部分找(降低high)。

排序

最後，我們來看排序方法sort，與前面這些簡單直接的方法相比，sort要複雜的多，排序是計算機程式中一個非常重要的方面，幾十年來，電腦科學家和工程師們對此進行了大量的研究，設計實現了各種各樣的演算法和實現，進行了大量的優化。一般而言，沒有一個所謂最好的演算法，不同演算法往往有不同的適用場合。

那Arrays的sort是如何實現的呢？

對於基本型別的陣列，Java採用的演算法是雙樞軸快速排序(Dual-Pivot Quicksort)，這個演算法是Java 1.7引入的，在此之前，Java採用的演算法是普通的快速排序，雙樞軸快速排序是對快速排序的優化，新演算法的實現程式碼位於類java.util.DualPivotQuicksort中。

對於物件型別，Java採用的演算法是TimSort， TimSort也是在Java 1.7引入的，在此之前，Java採用的是歸併排序，TimSort實際上是對歸併排序的一系列優化，TimSort的實現程式碼位於類java.util.TimSort中。

在這些排序演算法中，如果陣列長度比較小，它們還會採用效率更高的插入排序。

為什麼基本型別和物件型別的演算法不一樣呢？排序演算法有一個穩定性的概念，所謂穩定性就是對值相同的元素，如果排序前和排序後，演算法可以保證它們的相對順序不變，那演算法就是穩定的，否則就是不穩定的。

快速排序更快，但不穩定，而歸併排序是穩定的。對於基本型別，值相同就是完全相同，所以穩定不穩定沒有關係。但對於物件型別，相同只是比較結果一樣，它們還是不同的物件，其他例項變數也不見得一樣，穩定不穩定可能就很有關係了，所以採用歸併排序。

這些演算法的實現是比較複雜的，所幸的是，Java給我們提供了很好的實現，絕大多數情況下，我們會用就可以了。

小結

本節我們分析了Arrays類，介紹了其用法，以及基本實現原理，同時，我們介紹了多維陣列以及Apache中的ArrayUtils類。對於帶Comparator引數的排序方法，我們提到，這是一種思維和設計模式，值得學習。

陣列是計算機程式中的基本資料結構，Arrays類以及ArrayUtils類封裝了關於陣列的常見操作，使用這些方法吧！

下一節，我們來看計算機程式中，另一種常見的操作，就是對日期的操作。

未完待續，檢視最新文章，敬請關注微信公眾號“老馬說程式設計”(掃描下方二維碼)，深入淺出，老馬和你一起探索Java程式設計及計算機技術的本質。用心原創，保留所有版權。

計算機程式的思維邏輯 (50) – 剖析EnumMap
2019-03-01
計算機
計算機程式的思維邏輯 (41) – 剖析HashSet
2019-03-03
計算機
計算機程式的思維邏輯 (29) – 剖析String
2019-02-25
計算機
計算機程式的思維邏輯 (30) – 剖析StringBuilder
2019-02-25
計算機UI
計算機程式的思維邏輯 (43) – 剖析TreeMap
2019-03-04
計算機
計算機程式的思維邏輯 (44) – 剖析TreeSet
2019-02-19
計算機
計算機程式的思維邏輯 (84) – 反射
2019-03-01
計算機反射
計算機程式的思維邏輯 (34) – 隨機
2019-03-01
計算機隨機
計算機程式的思維邏輯 (82) – 理解ThreadLocal
2019-02-28
計算機thread
計算機程式的思維邏輯 (71) – 顯式鎖
2019-02-25
計算機
計算機程式的思維邏輯 (56) – 檔案概述
2019-02-18
計算機
計算機程式的思維邏輯 (14) – 類的組合
2019-03-03
計算機
計算機程式的思維邏輯 (83) – 併發總結
2019-03-03
計算機
計算機程式的思維邏輯 (72) – 顯式條件
2019-02-25
計算機
計算機程式的思維邏輯 (55) – 容器類總結
2019-03-02
計算機
計算機程式的思維邏輯 (23) – 列舉的本質
2019-02-28
計算機
計算機程式的思維邏輯 (94) – 組合式非同步程式設計
2019-02-27
計算機非同步程式設計
計算機程式的思維邏輯 (88) – 正規表示式 (上)
2019-03-02
計算機
計算機程式的思維邏輯 (70) – 原子變數和CAS
2019-03-04
計算機變數
計算機程式的思維邏輯 (47) – 堆和PriorityQueue的應用
2019-02-19
計算機
計算機程式的思維邏輯 (20) – 為什麼要有抽象類？
2019-03-02
計算機抽象
計算機程式的思維邏輯 (28) – 剖析包裝類 (下) – 理解Java Unicode處理的基礎
2019-01-03
計算機JavaUnicode
計算機程式的思維邏輯 (15) – 初識繼承和多型
2019-03-03
計算機繼承多型
計算機程式的思維邏輯 (12) – 函式呼叫的基本原理
2019-03-04
計算機函式
計算機程式的思維邏輯 (68) – 執行緒的基本協作機制 (下)
2019-03-04
計算機執行緒
計算機程式的思維邏輯 (63) – 實用序列化: JSON/XML/MessagePack
2019-02-22
計算機JSONXML
計算機程式的思維邏輯 (93) – 函式式資料處理 (下)
2019-01-20
計算機函式
計算機程式的思維邏輯 (18) – 為什麼說繼承是把雙刃劍
2019-03-04
計算機繼承
程式設計師，你的邏輯思維有多強？
2021-11-25
程式設計師
軍事思維者的思考邏輯
2018-05-31
提升思維邏輯—SimpleMind Pro（思維導圖） for Mac/win
2024-01-09
Mac
如何建立強大的邏輯思維能力？
2022-12-30
測試筆試邏輯思維題
2018-05-27
筆試
計算機程式的思維邏輯 (64) – 常見檔案型別處理: 屬性檔案/CSV/EXCEL/HTML/壓縮檔案
2019-01-02
計算機型別ExcelHTML
計算思維
2024-07-13
做一個有產品思維的研發：邏輯設計
2019-04-19
計算機程式的思維邏輯 (61) – 記憶體對映檔案及其應用 – 實現一個簡單的訊息佇列
2019-02-25
計算機記憶體佇列
利用 Python 引導孩子的計算機思維
2019-07-17
Python計算機
計算機最基礎的部分：運算邏輯電路（ALU）
2019-03-26
計算機

計算機程式的思維邏輯 (31) - 剖析Arrays

用法

toString

陣列排序 - 基本型別

陣列排序 - 物件型別

陣列排序 - 自定義比較器

二分查詢

陣列拷貝

陣列比較

填充值

雜湊值

多維陣列

多維陣列的操作

實現原理

toString

拷貝

二分查詢

排序

更多方法

翻轉陣列元素

查詢元素

刪除元素

新增元素

小結

相關文章