甜過初戀!浙大博士用200個西瓜130頁論文,教你用機器學習科學挑瓜

大資料文摘發表於2020-04-06

甜過初戀!浙大博士用200個西瓜130頁論文,教你用機器學習科學挑瓜

大資料文摘出品

作者:易琬玉

剛剛送走了最熱七月,轉眼就迎來了最熱八月。

2019年是人類有氣象紀錄以來最熱的幾個年份之一,雖然這個夏天還沒結束,但氣象學家們已經有十足把握做出這個判斷。

為了應付熱,人們想出了很多辦法。在炎熱面前,空調是安全感的來源,而西瓜,是幸福感的來源。

根據Worldatlas世界地圖網2018年的資料,中國人一年要吃掉近800億斤西瓜。中國的西瓜產量佔全世界的70%,約為第二名的20倍,但這依舊無法滿足廣大吃瓜群眾,幾乎每年都要依賴進口。

甜過初戀!浙大博士用200個西瓜130頁論文,教你用機器學習科學挑瓜

為了提高瓜農收入,擴大西瓜的對外出口,也順便造福一下我們廣大吃瓜群眾。三年前,有位浙江大學的博士毛建華,用近200個西瓜,寫了篇近130頁的博士論文,系統闡釋了如何透過機器學習聽聲音辨別西瓜的成熟度

甜過初戀!浙大博士用200個西瓜130頁論文,教你用機器學習科學挑瓜

古往今來傳統挑瓜大法

古往今來,有一個全球通用的挑瓜竅門——敲它!

一般來說,未熟西瓜聲音較清脆,敲打時會發出「咚咚咚」的聲音,成熟瓜聲音比較低濁,發聲為「嘭嘭嘭」,而過熟西瓜則會發出「撲撲撲」的聲音。

雖然在挑選西瓜時,“敲西瓜”是廣為採用的方法。但是這種方法完全依靠經驗且費時費力,無法用於大量檢測。

作者在文中提到,西瓜是否適時採收對西瓜品質影響極大,過熟或者不熟採摘都會影響西瓜的品質與口感。在我國,採收時機主要還是依賴於瓜農的主觀經驗,他們往往透過生長週期、氣候(主要是氣溫)以及觀察瓜皮顏色、紋理來判斷西瓜成熟情況。

我國西瓜產量和種植面積居世界第一,但是出口量卻不到產量的1%。不僅是因為我們自己吃得多,還因為西瓜產後檢測和處理手段落後,導致質量良莠不齊,商品化程度低。

科學挑瓜:聲學無損檢測技術

論文寫道,水果內部品質無損檢測是實現水果產後商業化處理的重要一環。隨著現代計算機技術、影像處理技術、感測器技術和測量技術的飛速發展,無損檢測技術以其非侵入、省時快捷的特點逐漸取代傳統的有損檢測技術,被廣泛的用於農產品品質檢測。

相較於其他的無損檢測技術,聲學檢測具有速度快、準確度高、成本低的特點。

聲學無損檢測方法主要透過檢測水果的質地來判定其成熟度或缺陷。西瓜的成熟度與內部結構和成分有關,而這些變化會反應在聲音變化上。這個方法的原理和我們拍西瓜聽聲響是一個意思,只不過更加準確高效。甜過初戀!浙大博士用200個西瓜130頁論文,教你用機器學習科學挑瓜

透過論文圖示可以看到,裝置包括敲擊裝置、托盤、麥克風、控制電路和上位機等。透過敲擊裝置撞擊西瓜瓜皮發出聲音,在控制電路作用下完成敲擊訊號採集,並傳送給聲學引數分析軟體。

為了獲得更準確的資料,作者對結構和材料都進行了最佳化處理。

首先是聲音訊號的預處理,包括敲擊聲音訊號的端點檢測和去噪。透過線性預測殘差法結合切比雪夫I型低通濾波器進一步去除了原訊號中的噪聲與毛刺,在提高訊雜比的同時,確保原有聲學特徵的準確提取。

一切準備就緒後,作者進行了兩種試驗,分別為成熟度分類試驗和空心判定試驗。

試驗中選用的麒麟西瓜樣本於2015年5月底至6月初從杭州市餘杭區倉前鎮吳山前村五組化農呂天歡處的溫室瓜棚分四批次採摘,共計200個西瓜。這四挑樣本分別作為未成熟樣本、成熟樣本、過熟樣本和空心樣本。

剔除在運輸和搬運過程中損壞的樣本後,剩餘190個西瓜樣本(49個未熟化+49個成熟瓜+49個過熟化+43個空心瓜)。將剔除空心瓜之後的147個西瓜隨機分為校正集(75個)和驗證集(72個),用於西瓜堅實度的定量預測的研究。

成熟度分類試驗中,選用 147 個非空心瓜,隨機分為兩組:建模集 75 個,預測集 72 個。

空心判定試驗中,選取 190 個樣本(包含有空心瓜),隨機分為兩組,建模集 97 個,預測集 93 個。

甜過初戀!浙大博士用200個西瓜130頁論文,教你用機器學習科學挑瓜

建模集用來建立樣本的分類或空心判定模型,預測集用來測試模型的效能。

試驗採用了四種常見有監督機器學習演算法和模式識別演算法,分別是線性判別分析法(LDA)、K-最小近鄰法(KNN)、BP 神經網路技術(ANN)和最小二乘-支援向量機法(LS-SVM),以聲學特徵對未熟、成熟和過熟三種西瓜進行了分類,此外還對空心瓜進行鑑別。其中,LS-SVM法分類效果最佳。

商品化處理關鍵環節,造福廣大吃瓜群眾

水果內部品質檢測是實現商品化處理的關鍵環節之一,提高果農和銷售商利潤,滿足消費者對水果品質不斷提高的需求,擴大出口。

作者成功設計了一套行動式西瓜成熟度分類和空洞判定的聲學檢測試驗裝置。目前僅有少數已開發國家研製出了商用化的西瓜品質無損線上檢測裝置,國內尚無同類產品。

之前陝西師範大學博士孫靈霞的八萬字論文《八角茴香對滷雞肉揮發性風味的影響極其作用機制》引發網友熱議。

論文主要講了加入八角茴香和沒有加入八角茴香的滷雞肉到底有什麼區別,透過這種對比來了解風味在滷煮過程中有什麼影響,風味是如何形成的。瞭解滷煮的溫度、火力、加熱時間,讓風味達到可控,對於後面的風味的調控和控制才能起到指導作用。

儘管大家都在調侃用掉了多少雞肉,是否需要幫忙如何處理實驗材料,但是孫靈霞博士及其團隊的部分研究成果已經被推向市場了。正如她所表示的——研究目的是想要克服傳統工藝的弊端,保證品質的一致和穩定,把中國的滷煮推向世界。

這和本文關於西瓜檢測的論文作者毛建華的目的不謀而合——提高中國西瓜的商品化、擴大出口。這些題目看起來不那麼學術科研工作,背後其實都是科研工作者滿滿的努力和情懷。

用機器學習科學吃瓜,你學會了嗎?

參考資料:

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31562039/viewspace-2652867/,如需轉載,請註明出處,否則將追究法律責任。

相關文章