空間統計(一)度量地理分佈

kikita發表於2020-04-05

     ArcGIS Desktop 中有一個包含了一系列用於研究空間分佈(spatial distribution)、空間模式(spatial pattern)、空間關係(spatial relationship)的統計的工具箱 —— Spatial Statistics Toolbox。這與普通的統計方法不同,空間統計將許多地理空間的概念融入到統計演算法邏輯中,例如:鄰域(proximity),面積(area),連通性(connectivity)等。

     

     本篇總結一下有關 度量地理分佈( Measuring Geographic Distributions)工具集中提供的功能。這些工具用於研究要素的空間分佈特徵,下面一個一個來看:





Central Feature


中心要素(Central Feature)這個工具可用於尋找一組要素中處於最中心位置的要素,這一組要素可以是點、線、面。

可解決的問題例如:某個區域的倉庫中最中心位置的是哪個? 在幾個區塊中,哪一個具有最中心的位置?


   


工具的演算法是將每個要素質心與其他各要素質心之間的距離計算並求和,取最小值。那麼問題來了……

距離測量方法是什麼?

有歐式距離與曼哈頓距離可選,區別點這裡。並且需牢記,投影座標系下才有準確的測量值,如果資料是經緯度座標系,需要投影變換。

要素的質心如何確定?

對於線和麵要素,距離計算中會使用要素的質心。對於多點、折線或由多部件組成的面,將會使用所有要素部件的加權平均中心來計算質心。點要素的加權項是 1,線要素的加權項是長度,而面要素的加權項是面積。

如何求多組要素的各自的中心要素?

設定分組欄位,可以對多個分組的要素分別計算中心要素。



Mean Center


平均中心(Mean Center)用於計算輸入的要素的質心的平均中心,因此這個工具會計算出一個新的點。

如果輸入資料包含 Z 值,那麼在平均中心也會計算 Z 值,也就是得到3D點。


這個工具在現實中有什麼應用呢?我從幫助中引用幾個有意思的應用:

★  犯罪分析師在對白天事件點與夜間事件點進行對比評估時,可能希望檢視盜竊行為的平均中心是否會有所變化。這有助於公安部門更好地分配資源。

★  野生生物學家可以計算某個公園若干年內的麋鹿觀測值的平均中心,以瞭解夏季和冬季麋鹿會在何處聚集,從而為公園遊客提供更好的資訊。

★  GIS 分析師可以通過將 911 緊急電話的平均中心與緊急響應站的位置進行比較來評估服務水平。此外,該分析師還可以對由超過 65 歲的個人加權所得的平均中心進行評估,從而確定提供老人服務的理想位置。


舉個例子:


2012年西非的馬裡暴動的位置資訊採集後,求取平均中心大致可以瞭解事件的分佈情況。

所有事件:


各類事件的平均中心:





Median Center


中位數中心(Median Center)工具使用迭代演算法來查詢可使所有要素間的歐氏距離達到最小的點。

平均中心和中位數中心均是中心趨勢度量。但是,比較而言,中位數中心工具的演算法受資料異常值的影響較小。

例如,對緊湊性群集點的平均中心進行計算的結果是該群集中心處的某個位置點。如果隨後新增一個遠離該群集的新點並重新進行計算平均中心,會注意到結果會向新的異常值靠近。而如果要使用中位數中心工具執行相同的測試,會發現新的異常值對結果位置的影響明顯減小。


如下圖中,向資料中增加兩個相隔較遠的點, Median Center 看起來要比 Mean Center 偏移的更小。



PS: 儘管中位數中心工具只返回一個點,但實際上,距所有要素的距離最小的位置點可能有多個。




Directional Distribution (Standard Deviational Ellipse)


方向分佈(標準差橢圓)工具可以檢視要素的分佈是否是狹長的,是否具有方向性,從而使我們直觀的感受資料的趨向。該方法是由平均中心作為起點對 x 座標和 y 座標的標準差進行計算,從而定義橢圓的軸,因此該橢圓被稱為標準差橢圓。


在工具生成的橢圓面中會包含:

    平均中心的 X 和 Y 座標、兩個標準距離(長軸和短軸)及橢圓的方向,這五個值。

    如果要素的基礎空間模式是中心處集中而朝向外圍的要素較少(一種空間正態分佈),則一個標準差橢圓面會包含聚類中約 68% 的要素,兩個標準差橢圓面會包含聚類中約 95% 的要素,三個標準差橢圓面則可包含聚類中約 99% 的要素。


這個工具可能的應有哪些呢?從幫助文件中摘錄過來:

★ 在地圖上標示一組犯罪行為的分佈趨勢可以確定該行為與特定要素(一系列酒吧或餐館、某條特定街道等)的關係。

★ 在地圖上標示地下水井樣本的特定汙染可以指示毒素的擴散方式,這在部署減災策略時非常有用。

★ 對各個種族或民族所在區域的橢圓的大小、形狀和重疊部分進行比較可以提供與種族隔離或民族隔離相關的深入資訊。

★ 繪製一段時間內疾病爆發情況的橢圓可建立疾病傳播的模型。


我還使用上面馬裡的例子,瞭解各種事件的分佈情況:


且不說分佈方向,我們可以看出,無論是哪種暴動事件,與之併發導致的無家可歸的難民是分佈最廣的。




Standard Distance


標準距離工具可通過繪製一個半徑等於標準距離值的圓在地圖上體現一組要素的緊密度。


可能的應用:

★ 利用兩種或多種分佈的值對分佈進行比較。例如,犯罪分析家可以對襲擊行為和汽車偷竊行為的緊密度進行比較。瞭解不同犯罪型別的分佈情況可能有助於警察制定出應對犯罪行為的策略。如果特定區域內的犯罪行為分佈很緊湊,那麼在該區域中心附近配置一輛警車也許就足夠了。但如果分佈較分散,則可能需要幾輛警車同時巡查該區域,才能更有效地對犯罪行為做出響應。

★ 可以對同一型別要素在不同時間段內的分佈情況進行比較。例如,犯罪分析家可以對白天盜竊行為和夜間盜竊行為進行比較,以瞭解白天與夜間相比,盜竊行為是更加分散還是更加緊湊。

★ 可將要素分佈與靜態要素進行比較。例如,可以針對某個區域內各響應消防站在幾個月內接到的緊急電話的分佈情況進行度量和比較,以瞭解哪些消防站響應的區域較廣。



Linear Directional Mean

線性方向平均值工具可以計算一組線要素的趨勢的平均角度。

許多具有一個起點和一個終點的線要素,例如颶風路徑,我們就可以使用這個工具計算颶風的平均方向。再比如斷層線,這種線要素我們一般認為它們有方位(orientation),但是沒有方向(direction),我們也可以使用這個工具計算平均方位。

所以,如果要計算平均方向,請確保所有線的方向都是正確的。如果要計算平均方位,則會忽略線的方向。

請牢記,儘管大多數線在起點和終點之間具有多個折點,此工具將只使用起點和終點來確定方向。

 

輸出線要素的為位於要素平均中心,長度為輸入要素的平均長度。包含了羅盤角(以正北為基準方向按順時針旋轉)、方向平均值(以正東為基準方向按逆時針旋轉)、圓方差(指示方向/方位偏離方向平均值的程度)、平均中心 X 和 Y 座標及平均長度。



可能的應用:

★ 比較兩組或多組線。例如,研究河谷中麋鹿和駝鹿遷移狀況的野生生物學家可計算這兩個物種遷徙路徑的方向趨勢。

★ 比較不同時期的要素。例如,鳥類學家可逐月計算獵鷹遷徙的趨勢。方向平均值可彙總多個個體的飛行路徑並對每日的遷移進行平滑處理。這樣便可很容易地瞭解鳥類在哪個月進得最快,以及遷徙在何時結束。

★ 評估森林中的伐木狀況以瞭解風型和風向。

★ 分析可以指示冰川移動方式的冰擦痕。

★ 標識汽車失竊及被盜車輛追回的大體方向。



再舉個例子:

如下圖中綠色的線段表示歷年不同日期採集的風向資料,現在根據不同的年份計算每年的平均風向,結果如圖,圖形總是比表格資料直觀的很:












相關文章