計算機視覺技術在物聯網中的發展與應用

視覺計算發表於2020-09-09

1.jpg

計算機視覺的發展演進
我們可以輕鬆地在日常產品中找到計算機視覺技術的應用,從可以識別手勢的遊戲機到可以自動聚焦於人臉的智慧手機攝像頭。如今,計算機視覺正在影響我們生活的許多領域。

實際上,計算機視覺在商業和政府使用中已有悠久的歷史。可以感測各種光譜範圍內的光波的光學感測器已在許多應用中部署:像製造中的產品質量檢測,用於環境管理的遙感或在戰場上收集情報的高解析度相機。這些感測器中的一些是固定的,而另一些則附著在移動的物體上,例如衛星、無人機和車輛。

過去,這些計算機視覺應用中有許多都限於某些封閉的平臺。但是,當與IP連線技術結合使用時,它們會建立一套以前無法實現的新應用。計算機視覺,再加上IP連線性、高階資料分析和人工智慧,將成為彼此的催化劑,從而引發物聯網(IoT)創新和應用的革命性飛躍。


推動計算機視覺的多個領域的進步

專為視覺設計的環境
視力或視覺是人類五種感官中最發達的。我們每天都使用它來認識我們的朋友、發現前進道路上的障礙、完成任務並學習新事物。我們設計視覺環境的物理環境,有路標和訊號燈可以幫助我們從一個地方到達另一個地方;商店有標牌來幫助我們找到它們;電腦和電視螢幕顯示我們消費的資訊和娛樂。考慮到視覺的重要性,將其擴充套件到計算機和自動化領域並不是一個大飛躍。

什麼是計算機視覺?
計算機視覺始於捕獲和儲存影像或一組影像的技術,然後將這些影像轉換為可以進一步作用的資訊。它由多種技術共同組成(圖1)。計算機視覺工程是一個跨學科領域,需要許多這些技術的跨功能和系統專業知識。

例如,Microsoft Kinect使用3D計算機圖形演算法來使計算機視覺能夠分析和理解三維場景。它允許遊戲開發人員將實時的全身運動捕捉與人工3D環境合併。除了遊戲以外,這還在機器人技術、虛擬現實(VR)和擴增實境(AR)應用等領域開闢了新的可能性。

感測器技術的進步也在許多方面超越了傳統的相機感測器而迅速發展。最近的一些例子包括:

紅外感測器和鐳射結合起來可感應深度和距離,這是自動駕駛汽車和3D對映應用的關鍵推動力之一
非侵入式感測器,無需物理接觸即可跟蹤醫療患者的生命體徵
高頻攝像頭可以捕捉人眼無法察覺的細微動作,幫助運動員分析步態
超低功耗和低成本視覺感測器,可以長時間部署在任何地方

2.jpg


圖1.由多個領域的進步推動的計算機視覺。圖片來源:IFA


計算機視覺變得智慧

早期應用
監控行業是影像處理技術和影片分析的較早採用者之一。影片分析是計算機視覺的一種特殊用例,其重點是從數小時的錄影中查詢模式。在現實世界中自動檢測和識別預定義模式的能力代表著數百個用例的巨大市場機會。

首批影片分析工具使用手工演算法來識別影像和影片中的特定功能。它們在實驗室設定和模擬環境中都是準確的。但是,當輸入資料(例如光照條件和攝像機檢視)偏離設計假設時,效能會迅速下降。

研究人員和工程師花了很多年時間開發和調整演算法,或者提出新的演算法來應對不同的條件。但是,使用這些演算法的攝像機或錄影機仍然不夠堅固。儘管這些年來取得了一些漸進的進步,但現實世界的糟糕表現限制了該技術的實用性和採用性。

深度學習突破
近年來,深度學習演算法的出現重新激發了計算機視覺。深度學習使用模仿人類大腦神經元的人工神經網路(ANN)演算法。

從2010年代初開始,透過圖形處理單元(GPU)加速的計算機效能已經變得足夠強大,足以讓研究人員實現複雜的人工神經網路的功能。此外,部分地受影片站點和流行的IoT裝置驅動,研究人員擁有龐大的影片和影像資料庫來訓練他們的神經網路。

2012年,一種稱為卷積神經網路(CNN)的深度神經網路(DNN)版本在準確性上實現了巨大飛躍。這一發展帶動了人們對計算機視覺工程領域的興趣和興奮。現在,在需要影像分類和麵部識別的應用中,深度學習演算法甚至超過了人類。更重要的是,就像人類一樣,這些演算法具有學習和適應不同條件的能力。

3.jpg


圖2.場景的語義表示


隨著深度學習的發展,我們正在進入認知技術的時代,其中計算機視覺和深度學習融合在一起,以解決人腦領域中的高階複雜問題(圖2)。我們只是在探索一切可能的事物。隨著更快的處理器,更先進的機器學習演算法以及與邊緣裝置的更深入整合,這些系統將繼續得到改善。計算機視覺將徹底改變物聯網。

用例增加
其他有趣的用例包括:
監控作物健康的農業無人機( )(圖3)
運輸基礎設施管理( )
無人機檢查( )
下一代家庭安全攝像頭( )

4.png


圖3.從無人機收集的影像中的植被指數(來源:Emmetts,)

這些只是計算機視覺如何在許多領域極大地提高生產力的一些小例子。我們正在進入物聯網發展的下一階段。在第一階段,我們專注於連線裝置,聚合資料和構建大資料平臺。在第二階段,重點將轉移到透過計算機視覺和深度學習等技術使“事物”更加智慧,生成更多可操作的資料。


挑戰
在讓計算機視覺技術對大眾更實用和更經濟時,有許多問題需要克服:
嵌入式平臺需要整合深度神經設計。由於功耗、成本、準確性和靈活性,很難做出設計決定。
業界需要標準化,以允許智慧裝置和系統相互通訊並共享後設資料。
系統不再是資料的被動收集器。他們需要以最少的人工干預就資料採取行動。他們需要自己學習和即興創作。整個軟體/韌體更新過程在機器學習時代具有新的意義。
駭客可以利用計算機視覺和AI中的新安全漏洞。設計師需要考慮到這一點。

原文連結:
本文轉載自千家網,本文一切觀點和視覺計算無關


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69956605/viewspace-2718275/,如需轉載,請註明出處,否則將追究法律責任。

相關文章