基於R語言的GD庫實現地理探測器並自動將連續變數轉為類別變數

疯狂学习GIS發表於2024-03-25

  本文介紹基於R語言中的GD包,依據柵格影像資料,實現自變數最優離散化方法選取與執行,並進行地理探測器Geodetector)操作的方法。

  首先,在R語言中進行地理探測器操作,可透過geodetector包、GD包等2個包實現。其中,geodetector包是地理探測器模型的原作者團隊開發的,其需要保證輸入的自變數資料已經全部為類別資料;其具體操作方法大家可以參考地理探測器R語言實現:geodetector。而GD包則是另一位學者開發的,其可自動實現自變數資料最優離散化方法選取與執行;本文介紹的就是基於GD包實現地理探測器的具體操作。此外,如果希望基於Excel實現地理探測器,大家可以參考地理探測器Geodetector下載、使用、結果分析方法

1 包的安裝與匯入

  首先,我們可以先到GD包在R語言中的官方網站,大致瞭解一下該包的簡要介紹、開發團隊等基本資訊。

  隨後,我們開始GD包的下載與安裝。輸入如下所示的程式碼,即可開始包的下載與安裝過程。

install.packages("GD")

  輸入程式碼後,按下回車鍵,執行程式碼;如下圖所示。在安裝GD包時,會自動將其所需依賴的其他包(如果在此之前沒有配置過)都一併配置好,非常方便。

image

  接下來,輸入如下的程式碼,將GD包匯入。

library("GD")

  輸入程式碼後,按下回車鍵,執行程式碼;如下圖所示。

2 資料讀取與預處理

  接下來,我們需要讀取柵格影像資料,並將其轉為GD包可以識別的資料框Data Frames)格式。

  其中,讀取柵格資料的方法,大家參考基於R語言的raster包讀取遙感影像即可;關於資料格式的轉換,大家參考地理探測器R語言實現:geodetector即可。這一部分的內容本文就不再贅述。

3 地理探測器執行

  接下來,我們就可以開始地理探測器的具體分析;強烈建議大家基於GD包中的gdm()函式,實現一步到位的地理探測器分析操作。

  首先,如果大家輸入資料中的自變數資料具有連續變數,需要將其轉換為類別變數gdm()函式可以實現連續變數離散化方式尋優自動執行。其中,我們可以選擇的離散化方式包括相等間隔法自然間斷點法分位數分類法幾何間隔法標準差法5種不同的方法,分別對應以下第一句程式碼中的"equal""natural""quantile""geometric""sd"5個選項。此外,我們還可以依據資料的特徵,對自變數離散化的類別數量加以限定,具體程式碼如下所示。

discmethod <- c("equal", "natural", "quantile", "geometric", "sd")
discitv <- c(4:10)

  其中,上述第一句程式碼表示,我們後續將從相等間隔法自然間斷點法分位數分類法幾何間隔法標準差法5種不同的方法中,找到每一個連續變數對應的最優離散化方法;第二句程式碼則表示,在後續尋找最優離散化方法的同時,還需要對每一個變數的分類數量加以尋優——c(4:10)就表示我們分別將每一個連續變數分為4類、5類、6類,以此類推,一直到10類,從其中找到最優結果對應的類別數量

  接下來,我們即可呼叫gdm()函式,執行地理探測器分析的具體操作;其中,my_gd為儲存地理探測器結果的變數;函式的第一個引數,表示因變數與自變數的關係,~前的變數即為因變數~後的變數即為自變數,多個自變數之間透過+相連線;第二個參數列示自變數中的連續變數,程式將自動對這些連續變數加以離散化方法尋優與執行;第三個參數列示儲存自變數與因變數資料的資料框Data Frames)格式的變數;最後兩個變數,即為前面我們選擇的離散化方法類別數量

my_gd <- gdm(A_LCCS0 ~ C_SlopeS0 + D_AspectS0 + DEM_Reclass + F_LCS0,
                        continuous_variable = c("C_SlopeS0", "D_AspectS0"),
                        data = tif_frame,
                        discmethod = discmethod,
                        discitv = discitv)

  這裡需要注意,如果大家不是透過指令碼執行的R語言,而是每次寫一句程式碼然後按下回車鍵執行一下,那麼上述程式碼中的換行就需要透過同時按下Shift鍵與回車鍵實現。輸入上述程式碼後,如下圖所示。

  隨後,即可執行程式碼。稍等片刻(具體時長與資料量有關),即可得到地理探測器的結果my_gd。這一變數的具體結構、內容如下圖所示。

  我們可以輸入如下的程式碼,將變數my_gd列印出來。

my_gd

  所得結果如下圖所示。

  可以看到,my_gd變數包含了每一個連續變數在離散化後,對應的最優離散化方法類別數量,以及地理探測器的各個分析結果。具體結果的含義與研讀方法,大家參考地理探測器Geodetector下載、使用、結果分析方法,以及地理探測器R語言實現:geodetector這兩篇文章即可,這裡就不再贅述。

  此外,我們可以透過如下的程式碼,將上述結果加以視覺化。

plot(my_gd)

  執行上述程式碼,結果如下圖所示。

  此時,在RStudio軟體的右下方“Plots”中,即可看到視覺化結果,如下圖所示。其中,我們可以透過下圖中紅色方框內的箭頭,實現不同圖片的切換顯示。

  上述結果包含7張影像,其分別與上上圖中的7項輸出內容對應——第一張圖是最優離散化方法的選取過程,第二張圖則是所選出的最優離散化方法對應的分類情況;後5張圖就是地理探測器的分析結果圖,即上上圖中最後5plot分別對應的結果。

  至此,我們就完成了基於R語言中的GD包,依據多張柵格影像資料,實現類別變數的自動離散化,並進行地理探測器Geodetector)操作的完整流程。

相關文章