京都大學利用 CNN 預測糧食產量,豐收不問天,問 AI 就夠了

發表於2023-09-22
聯合國預測,2050 年世界人口預計達到 91 億,全球對糧食的需求量將增加 70%。然而,由於世界農業發展不均衡,很多地區的糧食產量尚無法被準確統計,因此無法對這些區域的農業發展做出合理規劃。現有的糧食產量統計方法則難以推廣或是需要較高的科技水平。為此,京都大學的研究者透過卷積神經網路 (CNN) 對農田照片進行分析,高效準確地對當地的糧食產量進行了統計,為促進全球農業發展提供了新方法。

作者 | 雪菜

編輯 | 三羊

本文首發於 HyperAI 超神經微信公眾平臺~

受人口增長、收入增加以及生物燃料廣泛使用的影響,2050 年全球對糧食的需求量將增加 70%。

然而,由於全球氣候變暖和生物多樣性下降,世界各地糧食產量極易受環境變化影響,且區域間發展不均衡。
在這裡插入圖片描述

圖 1:2020 年全球穀物產量地圖

可以看到,中國、美國、印度和巴西是主要的產糧地,而南半球的糧食產量相對較低。而且,由於南半球的農業生產力較低,其糧食產量很難被準確統計。 因此,我們很難對當地的農業生產力進行有效評估,更無法提供有效的增產手段。

目前有 3 種常用的糧食產量統計方法,包括自我彙報、實割實測和遙感統計。前兩種方法很難大規模推廣,而遙感技術的使用則會受到當地科技水平的制約。

為此,京都大學的研究者利用卷積神經網路 (CNN),對實地拍攝的農田照片進行分析,進而對當地的糧食產量進行統計。結果顯示,CNN 模型可以對不同光照條件下的收割期和成熟後期的水稻產量進行迅速、準確的統計。 這一成果已發表於《Plant Phenomics》。
在這裡插入圖片描述

論文連結:

https://spj.science.org/doi/10.34133/plantphenomics.0073

實驗過程

1. 建立資料庫:水稻冠層照片 + 糧食產量

研究人員在 7 個國家的 20 塊農田中採集了水稻照片和糧食產量。水稻成熟後,用數位相機在水稻冠層上 0.8 至 0.9 米的高度,垂直向下拍攝,得到面積 1 m2 水稻的 RGB 照片。

注:水稻的冠層是水稻枝葉稠密的頂層,是植物進行光合作用的主要部位。

隨後,他們改變了拍攝角度、時間和時期,並在部分實驗中逐次摘掉了水稻的花序,以探究 CNN 模型預測產量的機制。最終他們從 4,820 個拍攝地點得到了 462 種水稻的 22,067 張 RGB 照片。

實驗中糧食產量為粗粒產量,包括水稻實粒和空粒的總重。統計得到的糧食產量在 0.1 t/ha (噸每公頃)和 16.1 t/ha 之間,呈現正態分佈,平均產量約 5.8 t/ha。
在這裡插入圖片描述

圖 2:水稻冠層影像及糧食產量分佈

A:7 個國家的粗粒產量分佈;

B:不同國家平均粗粒產量餅狀圖;

C:粗粒產量最高的水稻影像;

D:粗粒產量最低的水稻影像。

2. 產量預測:冠層照片 + CNN → 糧食產量

CNN 模型、丟失函式和最佳化器使用 Python 語言和 PyTorch 框架進行部署。隨後,研究人員透過組合不同的 Batch Size 和 Learning Rate,計算模型訓練完成時的驗證損失和相對均方根誤差 (rRMSE),得到了模型的最佳 Batch Size (32) 和 Learning Rate (0.0001)。

CNN 模型在 Main Stream (MS) 中有 5 個卷積層,Branching Stream (BS)中有 4 個卷積層。模型的池化層包括平均池化層 (AveragePooling) 和最大池化層 (MaxPooling)。啟用函式主要為整流線性單元 (ReLU),在某些部分使用指數線性單元 (ELU)。最後 MS 和 BS 匯合,透過 ReLU 層輸出預估的糧食產量。
在這裡插入圖片描述

圖 3:CNN 模型示意圖

CNN 模型對影像有著較強的分辨能力。 當地面取樣間隔 (GSD,照片中每個畫素點對應的現實距離,與解析度相反)為 0.2 cm/pixel 時,CNN 模型預測結果和實際結果的相關係數 R2 在 0.65 以上。即使 GSD 增大到 3.2 cm/pixel,模型的 R2 也能保持在 0.55 以上。
在這裡插入圖片描述

圖 4:CNN 模型預測結果與 GSD 的關係

A:CNN 模型的 R2 與驗證集、測試集照片 GSD 的關係;

B:CNN 模型預測產量與實際產量的散點圖;

C & D:GSD 為 0.2 cm/pixel 和 3.2 cm/pixel 的示意照片。

進一步的,研究人員用預測集的資料對 CNN 模型進行了測試。CNN 模型可以分辨出在東京的高成 (Takanari) 水稻和越光 (Koshihikari) 水稻產量的差異,且預測資料接近實際資料。
在這裡插入圖片描述

圖 5:高成水稻和越光水稻的實際產量 (A) 和預測產量 (B)

隨後,團隊對圖片進行了遮擋,以探究 CNN 模型分析圖片並預測糧食產量的機制。他們用灰色塊遮擋了照片的特定區域,並計算了遮擋前後 CNN 模型預測產量的差值。
在這裡插入圖片描述

圖 6:遮擋實驗示意圖

A:遮擋前的照片;

B:遮擋後的照片;

C:照片不同區域對預測產量的權重。

結果顯示,糧食產量與水稻花序的數量正相關,而與莖、葉、地面等元素在圖片中的佔比負相關。

於是,研究人員透過花序移除實驗,驗證了花序在產量預測中的作用。他們從每株水稻上摘下兩個花序,拍照並統計粗粒產量,直到花序被全部摘下。
在這裡插入圖片描述

圖 7:花序移除實驗及結果

A:花序移除實驗示意圖;

B:花序移除後的照片;

C:預計產量和實際產量折線圖;

D:花序移除過程中預計產量和實際產量之間的關係。

隨著花序數量減少,CNN 模型的產量預測結果不斷降低,最後降至 1.6 t/ha。這一實驗說明,CNN 模型主要是基於照片內花序的數量對糧食產量進行判斷的。

3. 魯棒性:拍照角度、時間及時期

驗證了 CNN 模型對糧食產量的預測能力後,研究人員改變了拍攝角度、時間和時期,以探究 CNN 模型在不同條件下的魯棒性。

照片的拍攝角度在 20°-90° 之間,測試間隔為 10°。結果顯示,CNN 模型的預測精度隨拍照角度的增大而提高。 當拍攝誤差為 20° 時,CNN 模型的預測結果為 -3.7-2.4 t/ha。拍攝角度為 60° 時,預測誤差在 -0.45-2.44 t/ha 之間,與 90° 時的預測結果接近。
在這裡插入圖片描述

圖 8:拍攝角度測試及結果

A:拍攝角度實驗示意圖;

B:不同拍攝角度得到的照片;

C:不同拍攝角度照片預測產量與實際產量的差距。

隨後,相機被放置在一個固定位置,每 30 分鐘拍攝一張農田照片,以探究拍攝時間對 CNN 模型的影響。結果顯示,雖然光照環境發生了變化,但 CNN 模型對全天照片的預測結果基本穩定。
在這裡插入圖片描述

圖 9:拍攝時間測試及結果

A:拍攝時間實驗示意圖;

B:不同拍攝時間得到的照片;

C:CNN 模型對不同拍攝時間照片的預測產量。

最後,研究人員探究了拍攝時期對 CNN 模型預測結果的影響。 在水稻 50% 抽穗之後,他們每週去農田收集照片,並用 CNN 模型進行分析。在水稻成熟初期,CNN 模型的預測產量低於收穫期的實際產量,因為此時花序尚未完全成熟。

隨著時間推移,CNN 模型的預測結果逐漸接近實際產量。50% 抽穗後 4 周,CNN 模型的預測結果基本穩定,與實際產量接近。
在這裡插入圖片描述

圖 10:拍攝時期測試及結果

A:不同拍攝時期得到的照片,DAH 代表抽穗後天數,DBH 代表收割前天數;

B:CNN 模型對不同時期拍攝照片的預測結果。

上述結果共同說明,CNN 模型可以對不同拍攝角度、時間和時期下得到的農田照片準確分析,得到穩定的產量預測結果。CNN 模型具有魯棒性。

智慧農業:AI 助力農業規劃

據聯合國預測,2050 年全球人口將達到約 91 億。隨著全球人口增長和收入提高,人們對於糧食的需求量也在不斷增加。

同時,農業生產的集約化、數字化和智慧化使糧食畝產量不斷提高。 2000 年至 2019 年,全球農業用地面積降低了 3%,而主要作物的產量增加了 52%,水果蔬菜產量也增加了 20% 左右。

大型收割機、無人機等專業裝置投入使用,使農戶可以精準便捷地對自己的農田進行規劃。大資料、物聯網等技術幫助農戶對農田狀況實時感知,還能夠對大棚內的環境進行自動調整。深度學習和大模型對天氣的提前預測能夠防範極端天氣於未然,緩解傳統農業「靠天吃飯」的難題。
在這裡插入圖片描述

圖 11:智慧農業系統示意圖

然而,截至 2021 年,全球受飢餓影響的人數較前一年增加約 4600 萬人,達到 8.28 億。 農業生產不均衡、體系不健全的問題依然存在,甚至更加突出。

在 AI 的幫助下,我們可以對當地的農業發展做出更好的規劃,推動世界農業生產均衡發展,為解決全球飢餓問題交出一份滿意的答卷。

參考連結:

[1] https://www.fao.org/documents/card/en/c/cc2211en

[2] https://www.deccanherald.com/opinion/smart-farming-tech-new-a...

本文首發於 HyperAI 超神經微信公眾平臺~