採用演演算法對農用地衛星影像的分析前後情況對比
(圖片來源:Orbital Insight公司衛星影像/空客集團防務與航天公司以及DigitalGlobe公司)

衛星資料使用方法和機器學習方法能夠很好地洞悉大資料和新的分析方法今後將如何改變我們度量貧困的方式。我本人並非貧困問題專家,不過我在尋思,這些資料和方法能否幫助我們測算就業增長情況。

研究人員採用機器學習方法(即採用演演算法從資料中獲得啟示)和衛星影像對貧困人口分佈情況進行預測。 組合使用衛星影像的時間序列資料和學習辨認建築物、道路、車輛以及經濟活動痕跡的計算機,可帶來更準確、成本更低以及更便於推廣的方法,用於測算消費支出、資產及財富。圖說收入增長情況。

要在沒有衛星和計算機情況下取得相同結果,就需要大量調查人員攜帶掛紙板和鉛筆,深入實地,對人們進行訪談,瞭解其財富變化情況,也要耗費大量資金。此類調查工作程式不僅緩慢,而且冗長乏味。最終,調查很容易遺漏掉諸如貧困人口等我們真正關注且遠離道路和供電設施等基礎設施的人群。

在測算就業增長情況過程中,我們會面臨同一類問題:勞動力調查讓我們瞭解就業市場(供給側)狀況,但其成本高昂,也很耗時。企業(需求側)方面的情況又如何呢?企業普查或調查即便存在的話,也比阿塔卡瑪沙漠的降雨更為零星稀少,因此我們也不能依靠它們來跟蹤就業增長情況。人們會自然而然地思考,為測算貧困人口數量而開發出的相同方法經部分調整後可否用於測算創造的就業崗位數量。

為測算就業增長情況而需對新出現的機器學習方法作出“調整”是一種委婉說法,其含義是相關挑戰巨大,但可以戰勝。如目標是測算貧困人口數量,則由計算機來辨識地形特徵,如城市、道路、水體以及農業區等等。例如,用茅草或鋅板鋪設的屋頂也是可以分辨的特徵,機器可學習對其進行識別;它們可能與諸如貧困等經濟發展結果存在互聯關係——從茅草屋頂可看出住戶較為貧困,而鋅板屋頂則意味著住戶可能較為富有。總之,機器可學習哪些特徵有助於測算經濟發展結果。

正在開發的模型在預測家庭資產和消費支出方面的表現將越來越好。從就業崗位角度看,這兩個變數是生產性經濟活動(正規或非正規工作)的結果。因此,我們的希望是從這些資料中也能夠推算出就業崗位數量。目前,從(資產)測算結果中推算出(就業)測算結果,可能會錯上加錯。因此,我們希望能夠直接從衛星圖片上獲得就業測算結果,這就像機器測算家庭資產和消費支出一樣。不過,這樣做的難度可能更大,因為對於建築物、道路、交通狀況和農業景觀,機器必須能夠分辨出正在發生的經濟活動的潛在規模,然後推算出多少人在從從事這些活動。在10米X10米大的建築中,勞動密集型或資本密集型生產活動有可能正在進行,僱用的勞動者有數百人或僅有10人。真實情況難以知曉,但請不要低估機器的學習能力。從交通角度看,對於進出建築物車輛的大小、產品目的地以及其它更多動態特徵,此類學習型機器可能很快就能夠猜出產品的型別和數量。根據此類組合資訊測算就業崗位數量可能更為直接。

其它難題還有很多,但前景可能會更好。如果我們能夠做好這項工作,則我們就能夠近乎實時地評估干預措施對衝突地區、非正規行業和偏遠地區就業的影響。如把這些測算結果與貧困人口分佈圖或某類主流企業和行業的分佈圖結合起來,則我們就可以說,就業崗位創造之浪潮正在急需就業的地區和僱用很多勞動者的行業掀起。最後,在經濟下行之時,我們也許能夠發現一些人正感受到對其就業的影響,另一些人即將會遭受此類影響。

由於這些工具前景良好,因此我們打算同捐贈機構、其它多邊機構以及發展界開展合作,請它們幫助我們開發出這些工具。舉例說,可持續發展目標就要求我們這麼做。

來自:世界銀行.心聲