甜過初戀!浙大博士用200個西瓜130頁論文,教你用機器學習科學挑瓜
大資料文摘出品
作者:易琬玉
剛剛送走了最熱七月,轉眼就迎來了最熱八月。
2019年是人類有氣象紀錄以來最熱的幾個年份之一,雖然這個夏天還沒結束,但氣象學家們已經有十足把握做出這個判斷。
為了應付熱,人們想出了很多辦法。在炎熱面前,空調是安全感的來源,而西瓜,是幸福感的來源。
為了提高瓜農收入,擴大西瓜的對外出口,也順便造福一下我們廣大吃瓜群眾。三年前,有位浙江大學的博士毛建華,用近200個西瓜,寫了篇近130頁的博士論文,系統闡釋了如何透過機器學習聽聲音辨別西瓜的成熟度。
古往今來傳統挑瓜大法
古往今來傳統挑瓜大法
古往今來,有一個全球通用的挑瓜竅門——敲它!
一般來說,未熟西瓜聲音較清脆,敲打時會發出「咚咚咚」的聲音,成熟瓜聲音比較低濁,發聲為「嘭嘭嘭」,而過熟西瓜則會發出「撲撲撲」的聲音。
雖然在挑選西瓜時,“敲西瓜”是廣為採用的方法。但是這種方法完全依靠經驗且費時費力,無法用於大量檢測。
作者在文中提到,西瓜是否適時採收對西瓜品質影響極大,過熟或者不熟採摘都會影響西瓜的品質與口感。在我國,採收時機主要還是依賴於瓜農的主觀經驗,他們往往透過生長週期、氣候(主要是氣溫)以及觀察瓜皮顏色、紋理來判斷西瓜成熟情況。
我國西瓜產量和種植面積居世界第一,但是出口量卻不到產量的1%。不僅是因為我們自己吃得多,還因為西瓜產後檢測和處理手段落後,導致質量良莠不齊,商品化程度低。
科學挑瓜:聲學無損檢測技術
科學挑瓜:聲學無損檢測技術
論文寫道,水果內部品質無損檢測是實現水果產後商業化處理的重要一環。隨著現代計算機技術、影像處理技術、感測器技術和測量技術的飛速發展,無損檢測技術以其非侵入、省時快捷的特點逐漸取代傳統的有損檢測技術,被廣泛的用於農產品品質檢測。
相較於其他的無損檢測技術,聲學檢測具有速度快、準確度高、成本低的特點。
聲學無損檢測方法主要透過檢測水果的質地來判定其成熟度或缺陷。西瓜的成熟度與內部結構和成分有關,而這些變化會反應在聲音變化上。這個方法的原理和我們拍西瓜聽聲響是一個意思,只不過更加準確高效。
透過論文圖示可以看到,裝置包括敲擊裝置、托盤、麥克風、控制電路和上位機等。透過敲擊裝置撞擊西瓜瓜皮發出聲音,在控制電路作用下完成敲擊訊號採集,並傳送給聲學引數分析軟體。
為了獲得更準確的資料,作者對結構和材料都進行了最佳化處理。
首先是聲音訊號的預處理,包括敲擊聲音訊號的端點檢測和去噪。透過線性預測殘差法結合切比雪夫I型低通濾波器進一步去除了原訊號中的噪聲與毛刺,在提高訊雜比的同時,確保原有聲學特徵的準確提取。
一切準備就緒後,作者進行了兩種試驗,分別為成熟度分類試驗和空心判定試驗。
試驗中選用的麒麟西瓜樣本於2015年5月底至6月初從杭州市餘杭區倉前鎮吳山前村五組化農呂天歡處的溫室瓜棚分四批次採摘,共計200個西瓜。這四挑樣本分別作為未成熟樣本、成熟樣本、過熟樣本和空心樣本。
剔除在運輸和搬運過程中損壞的樣本後,剩餘190個西瓜樣本(49個未熟化+49個成熟瓜+49個過熟化+43個空心瓜)。將剔除空心瓜之後的147個西瓜隨機分為校正集(75個)和驗證集(72個),用於西瓜堅實度的定量預測的研究。
成熟度分類試驗中,選用 147 個非空心瓜,隨機分為兩組:建模集 75 個,預測集 72 個。
空心判定試驗中,選取 190 個樣本(包含有空心瓜),隨機分為兩組,建模集 97 個,預測集 93 個。
建模集用來建立樣本的分類或空心判定模型,預測集用來測試模型的效能。
試驗採用了四種常見有監督機器學習演算法和模式識別演算法,分別是線性判別分析法(LDA)、K-最小近鄰法(KNN)、BP 神經網路技術(ANN)和最小二乘-支援向量機法(LS-SVM),以聲學特徵對未熟、成熟和過熟三種西瓜進行了分類,此外還對空心瓜進行鑑別。其中,LS-SVM法分類效果最佳。
商品化處理關鍵環節,造福廣大吃瓜群眾
商品化處理關鍵環節,造福廣大吃瓜群眾
水果內部品質檢測是實現商品化處理的關鍵環節之一,提高果農和銷售商利潤,滿足消費者對水果品質不斷提高的需求,擴大出口。
作者成功設計了一套行動式西瓜成熟度分類和空洞判定的聲學檢測試驗裝置。目前僅有少數已開發國家研製出了商用化的西瓜品質無損線上檢測裝置,國內尚無同類產品。
之前陝西師範大學博士孫靈霞的八萬字論文《八角茴香對滷雞肉揮發性風味的影響極其作用機制》引發網友熱議。
論文主要講了加入八角茴香和沒有加入八角茴香的滷雞肉到底有什麼區別,透過這種對比來了解風味在滷煮過程中有什麼影響,風味是如何形成的。瞭解滷煮的溫度、火力、加熱時間,讓風味達到可控,對於後面的風味的調控和控制才能起到指導作用。
儘管大家都在調侃用掉了多少雞肉,是否需要幫忙如何處理實驗材料,但是孫靈霞博士及其團隊的部分研究成果已經被推向市場了。正如她所表示的——研究目的是想要克服傳統工藝的弊端,保證品質的一致和穩定,把中國的滷煮推向世界。
這和本文關於西瓜檢測的論文作者毛建華的目的不謀而合——提高中國西瓜的商品化、擴大出口。這些題目看起來不那麼學術科研工作,背後其實都是科研工作者滿滿的努力和情懷。
用機器學習科學吃瓜,你學會了嗎?
參考資料:
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31562039/viewspace-2652867/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 浙大博士 130 頁論文,教你用人工智慧挑西瓜人工智慧
- 博士論文致謝詞
- 《機器學習》西瓜書學習筆記(五)機器學習筆記
- 王力巨集的瓜很大!我用Python爬取了瓜文評論區,發現更精彩Python
- 【論文】核心電腦科學會議排名
- KISTI:研究顯示中國科學論文的質量水平超過美國
- 資料科學系統學習 機器學習演算法 # 西瓜書學習記錄 [12] 整合學習實踐資料科學機器學習演算法
- 清華劉知遠:教你用HowNet在深度學習時代搞事情(附論文下載)深度學習
- 西瓜種類與挑選方法
- 周志華西瓜書《機器學習》機器學習
- 追一科技楊雪峰博士WOT演講:閱讀理解應用與挑戰
- 16個用於資料科學和機器學習的頂級平臺資料科學機器學習
- 「每章都能當做一篇博士論文」:閆令琪獲SIGGRAPH 2019最佳博士論文獎
- 教你用Xd做網頁網頁
- 【資料科學系統學習】機器學習演算法 # 西瓜書學習記錄 [6] 樸素貝葉斯實踐資料科學機器學習演算法
- 論文發表 | 美創&浙大二院合作論文在國家科技核心期刊發表
- NHK:71個領域中國科學論文被引用次數世界第一
- 機器閱讀理解與文字問答技術研究 | 博士學位論文
- 11月最熱論文Top10、五大學科最熱論文Top3!
- Python機器學習 5個資料科學家案例解析Python機器學習資料科學
- 日文部科學省:中國新冠論文數全球第一
- 《自然》:女性科學家發表的論文少引用也少
- 機器學習推薦的論文和文章機器學習
- 阿里演算法,浙大博士帶你寫專案經歷!阿里演算法
- 論文學習
- 建立個性化的 Github 個人主頁|8月更文挑戰Github
- 美國科學促進會:機器學習“正在導致科學危機”機器學習
- 比啃西瓜書更高效的“機器學習”方法機器學習
- 圖文並茂,700 頁的機器學習筆記火了!值得學習機器學習筆記
- 《科學計量學》:2019年前1%論文排名 中國首超美國
- 微博收藏(機器學習課程與論文)(三)機器學習
- 教你用 Python 來朗讀網頁Python網頁
- (資料科學學習手札130)利用geopandas快捷繪製線上地圖資料科學地圖
- 清華、浙大、復旦校友在列,2024蘋果博士獎學金華人佔一半蘋果
- 66 個機器學習硬核資源,書籍、課程、論文一應俱全!機器學習
- NLP詳細教程:手把手教你用ELMo模型提取文字特徵(附程式碼&論文)模型特徵
- Java可以用於機器學習和資料科學嗎? - kdnuggetsJava機器學習資料科學
- 40個機器學習&深度學習最佳資源集合(書籍、課程、新聞部落格、論文等)機器學習深度學習