機器視覺軟體中的深度學習技術

朗銳智科1發表於2018-04-26

近期,關於谷歌、Facebook、IBM、英特爾和微軟等大公司涉足深度學習領域的訊息紛紛佔據了各家媒體的頭條;在某些場景中,經過深度學習技術訓練的機器在識別影像時比人類更好,比如識別貓、識別血液中的癌細胞特徵、識別MRI掃描圖片中的腫瘤。
最近,一些機器視覺軟體公司已經在他們的產品中部署了深度學習技術,另外也有一些公司的全部產品都是基於該技術的。以瑞士ViDi Systems公司為例,這家公司在今年早些時候被康耐視收購。ViDi Systems公司由計算神經科學博士Reto Wyss於2012年創立,該公司開發的軟體使用人工智慧技術,用於改善應用中的影像分析,而這些應用都難以預測全方位的影像變化。
經典的幾何圖案發現和邊緣檢測,仍然是為機器人引導或其他精確測量提供亞畫素級精度的最佳方法。深度學習在零件質量的類人判斷和其他基於樣本的決策中最具價值性,因為它是通過樣本進行訓練的,它不再需要之前的檢測應用所需要的高階視覺技能。深度學習作為傳統機器視覺的一種補充。
韓國SUALAB公司最近釋出了SuaKIT檢測軟體,這是一個基於各個工業場所產生的實際影像資料的庫,具有分割和分類的主要功能。當軟體的深度學習演算法被教授正常產品和缺陷產品的新影像時(教授速度:在30分鐘內學習多達1000幅解析度為2048×2048的影像),使用神經網路來自動識別缺陷的值。
即使沒有豐富程式設計經驗的使用者也可以使用該軟體,因為它不需要針對逐個例項進行程式設計,而是通過收集和輸入有關缺陷的資料、通過自學來工作的。SuaKIT還可以通過CUDA(統一計算裝置架構)技術,使用高效能GPU來實現資料的高速處理。
“使用深度學習,檢測過程中的錯誤可以大大減少,因為它是建立在能夠進行自學習並進一步自我完善的系統之上的;這些都是通過簡單地收集和輸入缺陷資料來實現的。”SUALAB公司業務組副經理Hanjun Kim說道,“深入學習加上CUDA技術,使得SuaKIT即使在需要高速度的製造過程中,也能表現出更高水平的效能(超過傳統方法)。”
德國MVTec公司也將深度學習技術融入了其著名的HALCON和MERLIC機器視覺軟體產品中。自HALCON 13版本開始,MVTec就在提供基於深度學習的光學字元識別(OCR)。現在,HALCON軟體中包含一個基於深度學習技術的OCR分類器,其可以通過許多預訓練字型使用。MVTec表示,有了這些功能,其在OCR方面將有望獲得比之前所有分類方法更快的讀取速度。
此外,MVTec釋出的新聞稿中也表示,隨著新版本HALCON軟體的即將釋出,客戶可以基於深度學習演算法進行卷積神經網路(CNN)培訓。然後,可以使用培訓過的網路來自動分類對應於預定義類別的影像資料。
有了深度學習,機器學習才有了許多實際的應用,它還擴充了AI的整體範圍。 深度學習將任務分拆,使得各種型別的機器輔助變成可能。無人駕駛汽車、更好的預防性治療、更好的電影推薦要麼已經出現,要麼即使出現。AI既是現在,也是未來。未來,隨著越來越多的使用者在他們的應用中成功地部署該技術,深度學習技術將在市場上越來越流行。


相關文章