人工智慧浪潮中的「蟲蟲特工隊」

PaddlePaddle發表於2018-10-22

一年前,孫鈺站在內蒙古黑裡河自然保護區的一大片林場前極目遠眺時,無論如何也想不到,他和他的團隊會在一年後完成中國林業研究領域的一項從0到1的“創舉”。

AI技術,正讓一些普遍認知中的“冷門”領域變成大熱門。

以前,林業專家們需要花費大量的時間在全國各地的林場進行週期性巡查,而因為有了AI技術的加持,現在只需要坐在北京的辦公室就可以掌握最新的情況。

這一切都源於一個叫做AI識蟲的智慧蟲情監測專案。

作為北京林業大學智慧感知實驗室主任的孫鈺堅信,把通用技術應用到專業領域大有可為,比如地質、林業等等。直到一年前參與了森林病蟲害的實地監測工作後,他覺得是時候行動起來了——用AI來拯救中國的森林。

AI真的能夠拯救森林嗎?

用AI拯救森林,實現起來還真不是一件容易的事兒。

這得先從一隻小蟲子說起。

人工智慧浪潮中的「蟲蟲特工隊」

別看這隻小蟲子不起眼,它叫紅脂大小蠹,是一種入侵我國並且危害超過35種松科植物的蛀幹害蟲。自從20年前在中國首次發現以來,它的危害面積不斷擴大,枯死的松樹達600多萬株。

人工智慧浪潮中的「蟲蟲特工隊」

而要想監測、預防這種殺傷力如此大的害蟲,在傳統林業中,就得依靠林業專家們定期翻山越嶺地去巡查那些事先在林區分佈好的昆蟲誘捕器。一旦發現不及時,就會導致蟲災蔓延。

要說這有多苦,孫鈺和他的團隊深有感觸。

“當時,我跟著我們學校林學院的一支調研隊伍去實地考察,為了掌握林區的情況,大部分時間都花在了路上。”孫鈺說。

“一個暑假一般也只能把一個林區跑上一遍。”林學院研二的學生李嘉樂說。

但所有的困難並不是僅靠吃苦就能解決。由於鑑別誘捕器中的昆蟲需要非常高的專業知識水平,基層的林場都面臨人才缺乏的窘境。

如何能解決這些問題?

從內蒙古回來,孫鈺和他的團隊開始籌劃一盤大棋,希望能將人工智慧賦能林業,為蟲害防治提供不間斷的監測和預報,減少病蟲害造成的損失。

一年後,基於百度PaddlePaddle深度學習框架的AI識蟲專案原型機研發完成,開創了中國林業研究領域的先河。

這個專案最大的優勢,就是可以實現遠端控制,專業人員無需深入林場就可定期收回資料,甚至可以將資料傳回的頻率提升到半小時一次。這不僅大大提升了工作效率,資料的收集和分析研究也更加地精準。

明年,AI識蟲專案就將從實驗室走向林場,開始試用。

艱難試錯:AI落地沒那麼容易

時間再回撥到一年前。當時,用AI來解決一隻小蟲子的問題,聽上去很容易,但真正實施起來,孫鈺才發現沒有那麼簡單。

他們需要解決的問題實在不少:一是蟲子太小,辨別難度大。必須依靠具有較高專業水平的老師和研究生來完成鑑別;二是林區面積大、地形複雜,不到十個人的團隊,一個暑假也只能跑一個林區,想要監測整片樹林實在太難了。

“要想實現AI識蟲,最大的難點就是人工智慧模型的輕量化。”孫鈺說。

由於地處偏僻,山區較多,所有的林區都面臨傳輸訊號非常差的問題。

“一般的識別方式,都是將圖片拍下後上傳到雲端伺服器,識別出結果後再返回到本地,但林區的訊號強度,基本不具備能傳送圖片的能力。”

所以孫鈺決定,要在誘捕器的嵌入式裝置上完成離線識別,再將識別結果以文字的形式發回後方統一的監控平臺。

這意味著這個模型不僅要足夠輕量,而且還要足夠精確。

人工智慧浪潮中的「蟲蟲特工隊」

孫鈺(右一)在實驗室指導學生進行模型除錯

為了解決這個問題,孫鈺進行了多次的嘗試,也接觸了國內外的多個AI開放平臺,最終,他選擇了百度的深度學習開源平臺PaddlePaddle。

說起與百度的合作,源於一個“餐桌上的約定”:在一個百度校企合作交流晚宴上,孫鈺隨口提到了他們正在做的AI識蟲專案。百度相關負責人馬上興奮地說:“可以用我們的深度學習框架試一試呀!”孫鈺立刻在餐桌上開啟手機,把專案的小視訊發給了百度的工程師。這個創意當時就吸引了百度工程師的興趣。無心插柳,合作就在餐桌上確定下來了。

對孫鈺來說,這頓飯吃得很開心。“事實證明,PaddlePaddle很好地實現了我們的創意。”

易學,好用——這是孫鈺對PaddlePaddle的評價。

作為百度旗下深度學習開源平臺,PaddlePaddle可以提供Neural Machine Translation、推薦、影像分類、情感分析、Semantic Role Labelling等任務,大部分任務可直接套用。

“中國的學生在學習PaddlePaddle時是有很大的語言優勢的。另外,我們利用PaddlePaddle提供的一些經典模型框架,在此基礎上進行了輕量級的優化,從而尋求一個時間和精度的平衡。這大大縮短了研發的週期。”

孫鈺團隊的專案對林業發展來說,頗有些里程碑的意味。AI識蟲,將林業病蟲害的監測、調查工作,從外業基本變成了內業。

以前,林業專家們需要花費大量的時間在全國各地的林場進行週期性巡查,而現在只需要坐在北京的辦公室就可以掌握最新的情況。

“最重要的是有鑑別水平的專家的需求量下來了。專家可以遠端操作,在北京就可以把防治措施告訴各地的基層人員。再也不是苦力活了。”孫鈺很自豪。

技術的力量:AI是如何成為“識蟲大師”的?

與AI人臉識別一樣,AI識蟲的本領同樣高強。

但越強的AI能力,需要基於越充分的前期資料收集。孫鈺的實驗室用了大量的時間來進行這一任務。

在這個不到10人的團隊裡,既有計算機的專業人才,也有林學的專業研究人員。

人工智慧浪潮中的「蟲蟲特工隊」

周焱(右一)和團隊成員在實驗室

資訊學院研二的學生周焱就參與了採集資料的工作。“由於蟲子的體型非常小,所以我們需要不斷地改進機器學習模型,提高對蟲子的識別率。另外,誘捕器裡除了害蟲之外,還會有其他飛蟲、樹葉等等,所以我們必須解決這種複雜背景下的蟲子識別問題。”

為了完成周焱所說的“提高識別率”,這個團隊裡還吸納了專業的林學研究的學生,以便能提供足夠的專業知識支撐。

李嘉樂就是其中之一。誘捕器在林區的密度該如何設定,不同蟲子間有哪些細微的差別,誘捕器裡不同種類的蟲子該如何鑑別……這些任務都需要交給像她一樣的專業人士來完成。

除此之外,還少不了工業界的力量加持:百度PaddlePaddle工程師也針對模型的建立和完善,進行了不少工作。

那麼,這個“識蟲大師”的工作原理是什麼呢?

人工智慧浪潮中的「蟲蟲特工隊」

AI識蟲智慧蟲情監測專案原理及簡介

通俗來說,這個系統是利用深度學習演算法來建立蠹蟲檢測模型,再將模型部署到誘捕器內的嵌入式裝置上,之後通過誘捕器內的高清攝像頭定時拍攝捕捉到的蟲子的影像,然後使用PaddlePaddle C-API來離線檢測這些蟲子是否為蠹蟲,有多少隻蠹蟲等等,最後將檢測結果通過MQTT協議上報至監測伺服器。

監測伺服器接收到訊息後,將檢測到的蟲口數寫入MySQL資料庫;並利用Django API啟動服務,讀取資料庫中的蠹蟲檢測結果,最後在百度地圖上顯示相應地點的蟲口數。

而這些最終的檢測結果,就會被坐在操作檯前的專業人員獲知,從而再進行下一步的部署工作。

通過分佈在整個林區的智慧監測終端,監控人員每半小時就能得到整個林區的規律性資料,而這曾經是李嘉樂和她的同學們一週的工作量。

可以說,AI識蟲系統在學術界和工業界的“雙劍合璧”下,最終成為了集大成者。

AI+林業:是劍走偏鋒還是特色之路?

相比當下大熱的無人駕駛、AI金融、AI醫療等等領域,“AI+林業”似乎顯得有些劍走偏鋒。但孫鈺並不這麼看。

他所在的林業大學,是中國林業研究領域的領頭羊。那麼林業大學裡的資訊學院,該如何尋找自己的特色之路?這是資訊學院院長陳志泊和他都在關心的事情。

人工智慧浪潮中的「蟲蟲特工隊」

北京林業大學資訊學院院長陳志泊在在2018北京智慧園林高峰論壇會議上作專題報告

“我們不是清華的資訊學院,也不是北大的資訊學院。在林大的土壤和環境下,我們必須有自己特色的東西。”敏銳地意識到了AI技術對未來世界的影響力後,陳院長對於學院的發展有著自己的規劃

這些年來,陳志泊和孫鈺做的,就是在尋找資訊科技和林學的交叉融合。林業資訊化、智慧林業……在這些細分領域裡,他們做出了特色,也找到了自己的優勢。

在陳志泊的牽頭推廣下,北林資訊學院正在進行的林業資訊化專案大大小小有二三十項,AI識蟲專案正是其中的佼佼者。

“如果讓我們林大去跟清華甚至MIT、史丹佛去拼人臉識別,那肯定是拼不過的。我們要做的,就是讓林業、園林規劃等等可能不學程式設計的專業,也能用上AI。”有了陳院長的支援,孫鈺更是充滿了信心。

北京林業大學的這一嘗試,讓AI的落地場景有了更廣泛的領域,也為AI技術戴上了一絲溫情的味道:在AI時代,即使是與日常生活相距較遠的傳統領域,也能找到獨特的前景。

這與百度CEO李彥宏在今年百度AI開發者大會上提到的觀點——“今天,無論你在哪裡,無論你是誰,都能夠通過百度平等便捷地獲得AI能力”不謀而合。也許,這也是林大和百度能一拍即合的根本原因。

林大資訊學院和百度的交流,最早始於教育部搭建的校企協同育人專案平臺。在這個平臺上,資訊學院和百度開設了產學研合作的試點,之後便開始了深度的交流合作。在百度AI技術生態部高階運營經理謝夢看來,人工智慧應用要想落地,和產業的緊密結合必不可少。

人工智慧浪潮中的「蟲蟲特工隊」

10月13日,在2018北京智慧園林高峰論壇會議上,謝夢詳細闡述了AI蟲情監測專案。

“目前,政府機構以及一些行業領頭的研究機構擁有大量的資料,但是對資料的收集和處理是非常困難的。就像在林區,想要收集全部的資料需要漫長的週期,但通過AI的幫助,整個林區的資料就可以實時掌控。百度在其中的作用,就是提供先進的演算法和深入的研究。”

林大想要推出這個專案的迫切之情非常容易理解,那為什麼百度會選擇做這件事情?

其實,雖然現在人臉識別等AI應用的方向非常火熱,但實際上,這種通用性的人工智慧應用對於很多產業來說只是一個附加功能,並沒有真正觸及產業發展的根本。

“我們最需要的就是產業中的人,因為他比任何人都更加了解產業的需求是什麼。所以,我們期待有更多產業方向的學校、工作者和我們一起來推進產業著實往前發展。”謝夢說。

AI時代,誰在掌握未來?

雖然無法準確預測人工智慧發展的未來,但有一點是明確的:我們都已經身處於由AI引領的工業革命4.0的浪潮中。誰能找到實際的AI落地場景,誰就能夠最終脫穎而出。

之所以在智慧園林高峰論壇上大力推薦AI識蟲專案,謝夢有著充分的理由:在過去很長一段時間,百度一直把技術作為信仰,追求著技術的先進性。但是,在人工智慧的浪潮中,一切都在向前發展,未來觸手可及。如何將技術與產業結合在一起,是人工智慧時代需要去探索和發展的事情。AI識蟲專案為什麼能做成?就是因為它真的找到了行業的痛點,也真的滿足了行業的需求。

同樣對AI識蟲專案的發展提供了大力支援的陳志泊院長,則有著另外一種角度的解讀:大學究竟要培養什麼樣的人才?自然是對社會真正有用,也真正具有競爭力的人才。而能夠真正瞭解業界前沿知識的人才,才是有競爭力的人才。

從這個角度來講,百度所採取的AI開放生態策略頗有“心機”也充滿了前瞻性——它既與可以將AI應用於實際場景的學術界、產業界進行了零距離接觸,又通過開源平臺吸引了大量的優秀人才。

百度AI技術生態部總經理喻友平曾經表示,深度學習對整個AI領域有著重要的影響力,在國外巨頭搶佔深度學習技術開源先機的情況下,中國必須要有自己的深度學習平臺,才能鞏固自身人工智慧技術的核心競爭力。而PaddlePaddle成為了一架重要的橋樑,既推動了學界研究者的研發工作,也促進了中國深度學習專門人才的培養。

這樣的提前佈局,無疑掌握了未來的人才,自然也取得了掌握未來的先機。 

轉載來源:讀芯君

相關文章