本文介紹基於R語言中的GD
包,依據柵格影像資料,實現自變數最優離散化方法選取與執行,並進行地理探測器(Geodetector)操作的方法。
首先,在R語言中進行地理探測器操作,可透過geodetector
包、GD
包等2
個包實現。其中,geodetector
包是地理探測器模型的原作者團隊開發的,其需要保證輸入的自變數資料已經全部為類別資料;其具體操作方法大家可以參考地理探測器R語言實現:geodetector。而GD
包則是另一位學者開發的,其可自動實現自變數資料的最優離散化方法選取與執行;本文介紹的就是基於GD
包實現地理探測器的具體操作。此外,如果希望基於Excel實現地理探測器,大家可以參考地理探測器Geodetector下載、使用、結果分析方法。
1 包的安裝與匯入
首先,我們可以先到GD
包在R語言中的官方網站,大致瞭解一下該包的簡要介紹、開發團隊等基本資訊。
隨後,我們開始GD
包的下載與安裝。輸入如下所示的程式碼,即可開始包的下載與安裝過程。
install.packages("GD")
輸入程式碼後,按下回車
鍵,執行程式碼;如下圖所示。在安裝GD
包時,會自動將其所需依賴的其他包(如果在此之前沒有配置過)都一併配置好,非常方便。
接下來,輸入如下的程式碼,將GD
包匯入。
library("GD")
輸入程式碼後,按下回車
鍵,執行程式碼;如下圖所示。
2 資料讀取與預處理
接下來,我們需要讀取柵格影像資料,並將其轉為GD
包可以識別的資料框(Data Frames
)格式。
其中,讀取柵格資料的方法,大家參考基於R語言的raster包讀取遙感影像即可;關於資料格式的轉換,大家參考地理探測器R語言實現:geodetector即可。這一部分的內容本文就不再贅述。
3 地理探測器執行
接下來,我們就可以開始地理探測器的具體分析;強烈建議大家基於GD
包中的gdm()
函式,實現一步到位的地理探測器分析操作。
首先,如果大家輸入資料中的自變數資料具有連續變數,需要將其轉換為類別變數;gdm()
函式可以實現連續變數的離散化方式尋優與自動執行。其中,我們可以選擇的離散化方式包括相等間隔法、自然間斷點法、分位數分類法、幾何間隔法與標準差法等5
種不同的方法,分別對應以下第一句程式碼中的"equal"
、"natural"
、"quantile"
、"geometric"
與"sd"
等5
個選項。此外,我們還可以依據資料的特徵,對自變數離散化的類別數量加以限定,具體程式碼如下所示。
discmethod <- c("equal", "natural", "quantile", "geometric", "sd")
discitv <- c(4:10)
其中,上述第一句程式碼表示,我們後續將從相等間隔法、自然間斷點法、分位數分類法、幾何間隔法與標準差法等5
種不同的方法中,找到每一個連續變數對應的最優離散化方法;第二句程式碼則表示,在後續尋找最優離散化方法的同時,還需要對每一個變數的分類數量加以尋優——c(4:10)
就表示我們分別將每一個連續變數分為4
類、5
類、6
類,以此類推,一直到10
類,從其中找到最優結果對應的類別數量。
接下來,我們即可呼叫gdm()
函式,執行地理探測器分析的具體操作;其中,my_gd
為儲存地理探測器結果的變數;函式的第一個引數,表示因變數與自變數的關係,~
前的變數即為因變數,~
後的變數即為自變數,多個自變數之間透過+
相連線;第二個參數列示自變數中的連續變數,程式將自動對這些連續變數加以離散化方法尋優與執行;第三個參數列示儲存自變數與因變數資料的資料框(Data Frames
)格式的變數;最後兩個變數,即為前面我們選擇的離散化方法與類別數量。
my_gd <- gdm(A_LCCS0 ~ C_SlopeS0 + D_AspectS0 + DEM_Reclass + F_LCS0,
continuous_variable = c("C_SlopeS0", "D_AspectS0"),
data = tif_frame,
discmethod = discmethod,
discitv = discitv)
這裡需要注意,如果大家不是透過指令碼執行的R語言,而是每次寫一句程式碼然後按下回車
鍵執行一下,那麼上述程式碼中的換行就需要透過同時按下Shift
鍵與回車
鍵實現。輸入上述程式碼後,如下圖所示。
隨後,即可執行程式碼。稍等片刻(具體時長與資料量有關),即可得到地理探測器的結果my_gd
。這一變數的具體結構、內容如下圖所示。
我們可以輸入如下的程式碼,將變數my_gd
列印出來。
my_gd
所得結果如下圖所示。
可以看到,my_gd
變數包含了每一個連續變數在離散化後,對應的最優離散化方法與類別數量,以及地理探測器的各個分析結果。具體結果的含義與研讀方法,大家參考地理探測器Geodetector下載、使用、結果分析方法,以及地理探測器R語言實現:geodetector這兩篇文章即可,這裡就不再贅述。
此外,我們可以透過如下的程式碼,將上述結果加以視覺化。
plot(my_gd)
執行上述程式碼,結果如下圖所示。
此時,在RStudio軟體的右下方“Plots”中,即可看到視覺化結果,如下圖所示。其中,我們可以透過下圖中紅色方框內的箭頭,實現不同圖片的切換顯示。
上述結果包含7
張影像,其分別與上上圖中的7
項輸出內容對應——第一張圖是最優離散化方法的選取過程,第二張圖則是所選出的最優離散化方法對應的分類情況;後5
張圖就是地理探測器的分析結果圖,即上上圖中最後5
個plot
分別對應的結果。
至此,我們就完成了基於R語言中的GD
包,依據多張柵格影像資料,實現類別變數的自動離散化,並進行地理探測器(Geodetector)操作的完整流程。