自從谷歌(微博)用於機器學習的Tensorflow工具去年底宣佈開源以來,全世界各地的開發者運用Tensorflow進行人工智慧方面的應用開發。儘管人工智慧這一概念聽上去十分高大上,但實際上運用人工智慧的方案,能夠幫助解決生活中一些看似最尋常的事情。
例如,在日本,一位名叫Makoto Koike的汽車行業工程師,便運用深度學習的方法,為種植黃瓜的父母搭建了一套自動分揀黃瓜的系統。
Makoto的父母從事黃瓜種植業,自家有著規模不小的黃瓜種植農場。但在享受到黃瓜收成的喜悅的同時,一樁煩惱也同期而至。由於黃瓜的長短、厚度、形狀、顏色、質地各不相同,需要人工將黃瓜的質量進行分類,根據質量的高低,售價也各不相同。
Makoto與其父母在黃瓜園內
這是一項及其繁瑣、細碎又耗時、費力的工作,在黃瓜收穫的旺季裡,Makoto的母親平均每天要花費超過8小時來進行黃瓜的分揀工作。
有著多年汽車行業經驗,見慣了汽車生產流水線上各種自動化工序的Makoto由此想到,何不建立一套黃瓜自動分揀系統來省去人工的麻煩。
但黃瓜的分揀並不是一樁容易的工作,即便從人的角度來說,要熟練這一技術,也需要花費相當長的培訓期,更何況是機器。在日本,對蔬菜品類並沒有統一的行業標準,而是由各個農場自主決定所產出的農作物優劣標準,Makoto父母的農場將自己產出的黃瓜的質量總共分成9個檔次,Makoto說,自己也是最近才跟母親學會如何精確分揀黃瓜的技術。
按照長度、形狀、質地、顏色等要素被分為9個檔次的黃瓜
考慮到分揀黃瓜的複雜度和精確度的要求,Makoto決定運用深度學習的方法來進行這一套自動系統的搭建,他說自己的這一靈感來自於谷歌前一段時間名聲大噪的AlphaGo,Makoto認為,正是AlphaGo取得的成功啟發了他透過深度學習技術來進行黃瓜分揀自動系統的搭建。
具體來看,Makoto的這一套系統運用了谷歌的開源系統Tensorflow,透過影像識別,並與硬體控制器相結合,最終實現分揀的過程。
黃瓜分揀自動系統深度學習系統流程
從影像識別這一過程來看,透過對訓練資料集的學習,電腦能夠知道影像中最重要的“元素”是哪些,然後根據重要性排序,從而實現分類。
完成後的黃瓜自動分揀系統
但這一套方法在實際運用中仍面臨很多挑戰。首先系統要求訓練資料量足夠多,為了訓練這一系統,Makoto花費了3個月的時間輸入了7000個已經被他母親分類好的黃瓜的影像,但是這一資料量還遠遠不夠,帶來的問題是在實際運用中,分揀的準確度不夠高。Makoto說,實際使用中的準確度僅為70%。
第二方面的挑戰在於受到計算資源的限制,難以進行復雜度更高的實時運算。儘管Makoto的這套系統已經將黃瓜的圖片訓練資料轉換成80*80的低解析度影像,但依然花費了一臺普通的Windows個人電腦2至3天的時間完成7000幅圖片的模型訓練。
基於上述限制,Makoto的自動分揀系統目前只能對黃瓜的形狀、長度和曲度三個引數進行分揀識別,顏色、質地、表面皺褶等引數還無法納入進來。
要突破這些障礙進行更大規模、更大深度的深度學習就需要用到更多的計算資源,這時對於普通開發者來說,就只能藉助於雲端伺服器的幫助了。