空間統計(二)分析模式 B

kikita發表於2020-04-05

這一篇具體看分析模式工具集中的具體工具,整理這一篇的目的,不是要讀者瞭解每個工具的背後使用了多麼高階的演算法,運用了多麼龐大的公式,而是一起了解這些工具究竟可以為我們研究什麼樣的空間資料分佈模式,當需要探索資料的空間性質時,知道應該如何去應用這些分析工具。

這裡寫圖片描述




Average Nearest Neighbor

平均最近鄰工具通過計算每個要素與其最鄰近要素之間的距離來計算最近鄰比率。如果最近鄰比率小於 1,則表現的模式為聚類。如果指數大於 1,則表現的模式趨向於擴散。

這裡寫圖片描述

“平均最近鄰”工具將返回五個值:觀測的平均距離、期望的平均距離、最近鄰指數、z 得分和 p 值。

在HTML報告檔案中可以更顯見的瞭解資料的趨勢:

這裡寫圖片描述

可能的應用:
- 評估競爭或領地:量化並比較固定研究區域中的多種植物種類或動物種類的空間分佈;比較城市中不同型別的企業的平均最近鄰距離。
- 監視隨時間變化的更改:評估固定研究區域中一種型別的企業的空間聚類中隨時間變化的更改。
- 將觀測分佈與控制分佈進行比較:在木材分析中,如果給定全部可收穫木材的分佈,則您最好將已收穫面積圖案與可收穫面積圖案進行比較,以確定砍伐面積是否比期望面積更為聚類。





Spatial Autocorrelation

空間自相關 (Global Moran’s I) 工具同時根據要素位置和要素的屬性值來度量空間自相關。在給定一組要素及相關屬性的情況下,評估所表達的模式是聚類模式、離散模式還是隨機模式。

與平均最近鄰工具類似,此工具將返回五個值:Moran’s I 指數、預期指數、方差、z 得分和 p 值。

這裡寫圖片描述

在使用這個工具的時候,注意以下幾點:

  • 輸入要素的記錄數至少30個,少於30結果不可靠。
  • 選擇的適當的概念化空間關係,具體根據自己的資料參考前一篇。

可能的應用
- 通過查詢距離(即空間自相關最強的位置對應的距離),可為各種空間分析方法確定合適的鄰近距離。
- 度量種族或民族分離隨時間推移的總體趨勢 - 分離程度是逐漸增強還是逐漸減弱?
- 總結某種觀點、疾病或趨勢隨空間和時間變化的傳播情況 - 觀點、疾病或趨勢是保持隔離和集中,還是傳播開並變得更加分散?





Incremental Spatial Autocorrelation

增量自相關工具會去測量一系列的空間自相關,並且可以建立 Z 得分折線圖。Z 得分反映空間聚類的程度,峰值 Z 得分表示聚類最明顯的距離。
這些峰值能做什麼呢?我們可以將這些峰值作為其他工具(例如熱點分析,將來會說到)的必要引數,例如距離範圍,距離半徑等等。

這裡寫圖片描述

以下面的資料為例:

我欲研究下面幾個城市的人口分佈情況:

這裡寫圖片描述

這裡寫圖片描述

這裡寫圖片描述

第一個峰值位於大約 250000 處。當顯示多個具有統計顯著性的峰值時(例如,本示例資料中有兩個峰值),聚類在這些距離處均很明顯。選擇與感興趣的分析比例對應的峰值距離,我們通常選擇第一個具有統計顯著性的峰值。





High/Low Clustering (Getis-Ord General G)

高/低聚類 (General G) 統計的零假設規定被研究的要素值不存在空間聚類。當返回的 p 值較小且在統計學上顯著,則可以拒絕零假設。如果零假設被拒絕,則 z 得分的符號將變得十分重要。如果 z 得分值為正數,則觀測的 General G 指數會比期望的 General G 指數要大一些,表明屬性的高值將在研究區域中聚類。如果 z 得分值為負數,則觀測的 General G 指數會比期望的 General G 指數要小一些,表明屬性的低值將在研究區域中聚類。

當存在完全均勻分佈的值並且要查詢高值的異常空間峰值時,首選高/低聚類(Getis-Ord General G)工具。遺憾的是,高值和低值同時聚類時,它們傾向於彼此相互抵消。如果在高值和低值同時聚類時測量空間聚類,則使用空間自相關工具。

這裡寫圖片描述

“高/低聚類”工具可返回五個值:General G 觀測值、General G 期望值、方差、z 得分以及 p 值。

這裡寫圖片描述

可能的應用:
- 在訪問急症室的次數中查詢出現的異常峰值,可能表明在區域性或區域的健康問題的爆發。
- 比較在城市中不同種類零售業的空間模式,利用比較購物的方式來了解哪類行業充滿競爭性(如汽車經銷商)以及哪類行業拒絕競爭(如健康中心/健身房)。
- 彙總空間現象聚類的程度以檢查不同時期或不同位置的變化。例如,眾所周知的城市及其人口聚類。使用高/低聚類分析時,可以隨時間來比較某個城市的人口聚類的程度(城鎮發展以及密集度的分析)。





Multi-Distance Spatial Cluster Analysis (Ripley’s K Function)

基於 Ripley’s K 函式的多距離空間聚類分析工具是另外一種分析事件點資料的空間模式的方法。Ripley’s K 函式可表明要素質心的空間聚集或空間擴散在鄰域大小發生變化時是如何變化的。

如果有興趣研究要素的聚類/擴散如何相對於不同距離(不同的分析規模)進行變化,可以使用此工具。

這裡寫圖片描述

相關文章