空間統計(二)分析模式 A

kikita發表於2020-04-05

有時對於資料量較大的地理資料,我們希望通過一定的統計方法將空間模式量化,從而獲知這些地理資料在空間上是聚合的、還是離散的、還是隨機的等。

分析模式工具集

在瞭解如上工具之前,有一些空間統計學的基本知識還是要先搞明白,磨刀不誤砍柴工,那就開始吧。





零假設、P值、Z得分、置信度


分析模式工具集中的工具都採用“推論統計學”,先確定一個零假設,也就是假設要素或與要素相關的值都表現為空間隨機模式—— Complete Spatial Randomness (CSR);然後再計算一個 p值,用來表示零假設的正確概率。分析模式工具集中的工具都會返回 P值(P-Value)Z得分(Z-Score),這是我們拒絕前面的零假設的依據,也就是我們觀測的要素表現出顯著性聚類或離散模式,而不是隨機模式。

什麼是 P 值? 什麼是 Z 得分?

P值 就是概率值,它表示觀測到的空間模式是由某隨機過程建立而成的概率,或者我們簡單的理解成是觀測到的空間模式是隨機空間模式的概率。P 值越小,也就是觀測到的空間模式是隨機空間模式的可能性越小,也就是我們越可以拒絕開始的零假設。

Z得分 表示標準差的倍數。例如,如果工具返回的 z 得分為 +2.5,我們就會說,結果是 2.5 倍標準差。如下所示,z 得分和 p 值都與標準正態分佈相關聯。

正態分佈

z 得分和 p 值結果是統計顯著性的量度,用來判斷是否拒絕零假設。在正態分佈的兩端出現非常高(正值)或非常低(負值)的 z 得分,這些得分與非常小的 p 值關聯。當執行要素模式分析工具得到很小的 p 值以及絕對值很大的 z 得分時,就表明觀測到的空間模式不太可能反映零假設中假定的隨機模式。

那麼,P值需要多小?或者說要小到什麼程度,才能拒絕零假設呢?這時就需要我們自己主觀選擇一個 置信度(Confidence Level),典型的置信度有 90%、95%、99%。其中顯見,99%的置信度是最保守的。





空間關係的概念化

空間統計分析和傳統(非空間)統計分析的一個重要區別是空間統計分析將空間關係整合到演算法中。在我們執行各種各樣的空間統計工具時,需要選擇一項“空間關係概念化”,如何選擇就主要取決於要測量的物件。如下是常見的選項:



反距離、反距離平方(阻抗)

這裡寫圖片描述
使用“反距離”選項時,空間關係的概念模型是一種阻抗或距離衰減。距離越遠,影響越小。
INVERSE_DISTANCE:表示與遠處的要素相比,附近的鄰近要素對目標要素的計算的影響要大一些;INVERSE_DISTANCE_SQUARED:與 INVERSE_DISTANCE 類似,但它的坡度更明顯,因此影響下降得更快,並且只有目標要素的最近鄰域會對要素的計算產生重大影響。

例如:反歐氏距離適用於對連續資料(如溫度變化)進行建模。再比如測量某種種子植物的聚集程度,使用反距離可能最合適。



距離範圍(影響的範圍)

這裡寫圖片描述
FIXED_DISTANCE_BAND:將對鄰近要素環境中的每個要素進行分析。在指定臨界距離內的鄰近要素將分配值為 1 的權重,並對目標要素的計算產生重大影響。在指定臨界距離外的鄰近要素將分配值為零的權重,並且不會對目標要素的計算產生任何影響。

例如:要研究通勤模式並且已知平均上下班路程為 15 英里,則最好使用 15 英里的固定距離進行分析。



無差別的區域

這裡寫圖片描述
ZONE_OF_INDIFFERENCE:將“反距離”模型和“固定距離範圍”模型合併為一體,在目標要素的指定臨界距離內的要素將分配值為 1 的權重,並且會影響目標要素的計算。一旦超出該臨界距離,權重就會隨距離的增加而減小。

舉個常見的例子,工作日的午飯我們通常會在公司附近解決,選餐館的時候,可能在500米以內哪家都行,超過500米就可能太過佔用時間從而影響中午的休息、娛樂等等,當餐館距離公司超過500米,隨著距離的增加,權重就不斷減小。



面鄰接(一階)

對於面要素類,可選擇 CONTIGUITY_EDGES_ONLY或 CONTIGUITY_EDGES_CORNERS。其中,CONTIGUITY_EDGES_ONLY:只有共用邊界的相鄰面要素會影響目標面要素的計算,不共享邊的面被排除在目標要素計算之外。CONTIGUITY_EDGES_CORNERS:共享邊界、結點的面要素會影響目標面要素的計算。如果兩個面存在重疊的部分,則將視為相鄰要素幷包含在彼此的計算中。

例如,研究某些傳染病的傳染區域時,可以考慮此空間關係概念化。



K最近鄰域

K表示最近鄰域數目。如果 K(鄰域數)為 8,則距目標要素最近的 8 個鄰域都會包含在該要素的計算中。在要素密度高的位置處,分析的空間範圍會比較小。與此類似,要素密度稀的位置,分析的空間範圍會比較大。使用生成空間權重矩陣工具時該方法可用。



通過檔案獲取空間權重(使用者定義的空間關係)

GET_SPATIAL_WEIGHTS_FROM_FILE:將在空間權重檔案(.SWM) 中定義空間關係,檔案可以使用空間統計工具箱中其他相關的工具建立,這裡先不展開,後面再說。



有了這些先驗知識,我們就來看看ArcGIS Desktop 中提供的這些工具,有點長了,再另起一篇看工具吧。

相關文章