高爾夫球場,長期以來的高階社交地,但其存在的背後,卻是對資源環境的侵襲。不僅大量佔用土地資源、耗費水資源,而且在維護草坪的時候大量使用化肥農藥,會造成嚴重汙染。
有多嚴重呢?
曾任江蘇省副省長的徐鳴此前接受《中國經濟週刊》專訪給出了一個對比:
“一個高爾夫球場的汙染比一座普通工廠的汙染還要嚴重。”
從2004年開始,有關部門就開始出臺一系列政策限制球場建設,並在2017年前後開展了專項清理整治。
但整治效果該如何核查?
球場相對分散,且佔地面積比較大, 通過遙感影象來檢測,是較優方案,高解析度光學遙感影像的普及也為場檢測提供了有力資料支援。
哪怕這些資料都有,檢測起來卻不容易。
下面就是一張遙感影象,忽略綠框,你能發現其中的高爾夫球場有多少,都在哪嗎?
一個熟練解譯人員從這樣的遙感影象中檢測出來所有的高爾夫球場,需要15分鐘左右。
而現在,深度學習技術改變了這項工作的面貌。
只需10秒,就能夠在這樣的圖中,自動檢測出高爾夫球場。
相比之下,效率提高90倍。識別的準確度也達到了84%。
這並不是個案特例,而是整個應用方向的集體提升,正切切實實發生在中科院遙感地球所。
這一躍遷是怎麼發生的?又是一個怎樣的過程?
AI在影象識別領域中已經頗有建樹許多年,為什麼到現在能力才體現出來?
想要回答這些問題,需要先回答——
為什麼原來處理遙感影象很慢?
利用遙感影象監測地表,是一個持續的過程。中科院遙感地球所研究人員說,其中最大的難點就在於,同一個地方的環境和氣候,每年都會發生變化。這會對理解遙感影象的演算法造成極大的影響。
最直接的體現就是,原本針對這些地方構建的演算法,過了一年之後,就要有針對性地調優,適應這些變化,不然就會“罷工”。而且, 這些演算法都與人的經驗有很強的關聯性,如果設計演算法的人離職,整個演算法就難以為繼了。
需要注意的是,這些演算法並不是自動化的,仍舊需要人工去配合。中國960萬平方公里,想要完成一遍,至少需要千餘人集中工作2到3個月。
怎麼辦?可以用深度學習。現在, 遙感所是這樣做的:
- 針對一個地方構建樣本庫,然後基於樣本庫中的影象訓練深度學習模型。
第二年,這一地方的環境和氣候發生變化,只需要把新的影象加進樣本庫,然後重新把模型訓練一遍就可以了。
同時,這樣也能夠減少對人的依賴,模型的調整不再受限於專家經驗,而是依靠資料的變化。
而且,資料越來越多,也不再是累贅,而是提高模型精度的“養料”。
雖然現在看來,這一切都很高效且非常簡單。但在從傳統的人工+演算法模式到現在深度學習的模式切換中,還經歷了不少困難。
用AI理解遙感影象,有什麼難的?
影象識別,可以說是當前AI領域比較成熟的技術了,各種用於影象理解的深度學習模型層出不窮,而且在特定領域已達到了人類同等水準。
但問題在於,這些深度模型,主要是針對自然影象的,如果直接用於理解遙感影象效果就會大打折扣。因為這兩類影象之間有很大的差別。
首先,遙感影象波段比較多,除了自然影象的RGB三個波段之外,遙感影象至少還要多出一個近紅外波段,一些衛星獲取的遙感影像有8個波段,高光譜影象甚至有多達200多個波段。
其次,影象的尺度差異也非常大,與自然影象中利用尺度金字塔進行多尺度的識別相比,遙感影象的尺度差異甚至要達到1:30 以上,才能較好地識別各個目標地物。
第三,有區域性空間特徵失真的問題。自然影象的失真,主要是因為感測器的邊緣失真和鏡頭失真,整體是可控的。但遙感影象成像的失真,是由於在影象獲取中的誤差產生的,相對來說是不可控的。
這些問題的存在,讓現有的深度學習演算法很難直接應用到遙感影象理解任務中。不僅模型需要進一步優化,還需要框架提供支援:不僅要在遙感影像讀入方面提供多波段的支援,還需要新增針對遙感影像的影象增強演算法,考慮到多波段的顏色增強,以及區域性空間特徵變形增強等等方面。
這些,正是百度在其深度學習框架PaddlePaddle中所做的事情,藉助這一框架,中科院遙感地球所,也正在完成一輪新的技術迭代。
應用正越來越廣泛。
具體到我們一開始提到的高爾夫球場識別問題,中科院遙感所的研究人員藉助PaddlePaddle框架的支援,使用了Faster R-CNN目標檢測模型。
在專業、標準的高爾夫球場遙感資料集中,只需要10秒,就能夠檢測出遙感影象中的所有球場。
用人工+演算法來識別,則需要15分鐘。
深度學習新方法讓工作效率提高了90倍,檢出準確率也能夠達到84%。
而且,深度學習並不僅僅只是用於自動化檢測高爾夫球場,還正在被用於理解遙感影象中的機場,建設在山區中的風力和光伏發電站。
藉助深度學習技術,研究人員能夠根據遙感影象快速識別出一個地區有多少太陽能皮膚,就有可能對這一地區能夠發多少電有清晰的預估,併為電網建設提供決策支援,避免“有電沒網”或者“有網沒電”的窘境。
根據國家能源局給出的資料,僅2018年,光伏發電就浪費了54.9億度,相當於200多萬家庭一年的用電量(按一家庭每月用電200度來計算)。
這背後的社會價值可見一斑。而且,理解遙感影象,只是PaddlePaddle解決實際問題的一個範例。
在計算機視覺領域,這個框架已經能夠支援模型完成影象分類、目標檢測、影象語義分割、場景文字識別、影象生成、人體關鍵點檢測、視訊分類、度量學習等任務。