從試用到使用:計算機視覺產業新一輪發展的起步年

dicksonjyl560101發表於2018-11-01

從試用到使用:計算機視覺產業新一輪發展的起步年

 

https://mp.weixin.qq.com/s?__biz=MzI0ODcxODk5OA==&mid=2247498370&idx=2&sn=a3cf59324678183e9625a6555355249d&scene=21#wechat_redirect

 

視覺是最重要的感官之一,我們透過眼睛看到大千世界,透過大腦分析看懂場景,並能回憶過往的視覺記憶。計算機視覺,就是利用電子、資訊、計算機等技術,採用電子成像系統作為基礎的感知單元採集影片影像,並透過資訊化技術,分析並解釋採集到的影片影像。計算機視覺從學術上分類,包括影像處理、模式與影像識別、事件分析、場景理解等眾多影像相關的技術學科,以及計算機、訊號處理、物理學、數學、生物學等多個基礎學科,且隨著人工智慧技術的演進還在不斷髮展。

 

利用計算機視覺,我們最終期望透過技術的發展,計算機能和人一樣透過視覺觀察和理解世界,並且能夠具備自主適應和認知環境的能力。

 

計算機視覺技術百花齊放,加速多個產業升級

 

深度學習是當前人工智慧領域最為熱點的技術之一,其發展非常迅猛,透過深度學習技術,可以在短時間內達到傳統模式識別技術的效能。深度學習技術源於 80 年代的神經網路技術,最近兩年的發展才真正實現大規模商業化落地,背後驅動這項人工智慧技術的突飛猛進源於晶片技術發展帶來的計算能力指數級提升,網際網路和物聯網技術發展提供了海量的資料,深度學習技術開源推動演算法的快速工程化與迭代升級。

 

2018   年是深度學習為代表的計算機視覺技術百花齊放的元年,創業公司和成熟企業在人工智慧的浪潮裡相互競爭,加速多個產業的升級。在演算法層面,眾多創業公司推出了很多高效能的人工智慧演算法,成熟的行業領導企業也迅速完成了技術突破和解決方案升級;在晶片層面,創業公司和巨頭企業也釋出了各類神經網路的 IP 和晶片,形成 GPU、DSP、xNN、FPGA 各自發力的格局,滿足邊緣計算、中心計算和雲端計算的計算力需求。從計算機視覺應用的產業板塊上分析,以影片應用為基礎的影片安防、工業視覺是目前最快落地的行業,醫療、智慧駕駛領域的技術正在快速發展中,未來技術突破將會產生巨大的商業應用價值。

 

人工智慧技術和計算能力的突破勢必帶來產品和解決方案的全面升級,從而加速客戶應用的規模化效應。我們現在在交通道路上可以看到非常多的攝像機拍攝路面的情況,這些基本都具備人工智慧能力,能夠對道路上車輛的行駛情況分析,比如判斷是否違章。

 

以前要使用智慧化分析交通行為,攝像機要連線到工控伺服器,在伺服器裡部署影片處理的演算法實現智慧分析。直到 2007 年,以大華股份為代表的企業透過技術創新,推出了業內一體化智慧交通攝像機,把當時高效能的 DSP 嵌入到攝像機,利用一臺攝像機實現了交通違章和車牌識別功能,從而加速行業的快速升級和新型產品的普及。現在隨著深度學習技術的引入以及晶片計算能力的革命性提升,一臺交通攝像機可以處理幾十種的違章行為,而且還能進一步分析行人、非機動車的行為,實現對影片的全結構化解析,這又是一次里程碑式的發展。

 

同樣以人臉識別技術的應用為例,2017 年人臉識別技術取得關鍵性突破,大規模的人臉識別率達到 90% 以上,引發商業和產品化的快速落地。現在我們可以使用刷臉支付、刷臉開門、刷臉考勤等便捷的服務,我們同樣可以採用這項人工智慧技術實現商業的分析和資料服務。另一方面,隨著產品計算能力的大幅提升,新型人工智慧的一體化產品取代了傳統解決方案裡需要部署的一套複雜的系統。

 

儘管計算機視覺在深度學習技術推動下取得驚人的成果,但我們也需要清醒的看到人工智慧技術還存在很多瓶頸。當前的人工智慧還不夠真正的智慧,離機器自主認知還有很長的路要走,現有技術還只能做到高效地解決單一或特定的任務。此外深度學習演算法是個黑盒子,網路內部各層的解釋性差,在實際工程過中存在不可預見性,尤其是演算法還無法達到普適性要求,複雜性和融合性應用帶來很多誤差和相互干擾。

 

由於深度學習技術採用的是大規模資料驅動,大規模的資料訓練本身對超算中心的能力是很大的挑戰,同時在實際工程化應用中場景非常複雜多變,這會出現很多無法預測的干擾資料,導致很容易計算出未知的異常結果。更為重要的是雖然人工智慧已經有了非常高的效能指標,但客戶對人工智慧應用的期望卻往往超越現有的演算法表現結果,這也需要計算機視覺技術持續突破來解決的實際問題。


 

影片安防和工業視覺領域應用發展最快

 

2018   年計算機視覺技術在影片安防和工業視覺領域應用是發展最快的兩個領域,尤其在影片安防領域,也是業內公認最適合落地的行業。安防應用的攝像機每天產生超 3000PB 的資料,這些資料裡 99% 的資料都是無效的,而依靠人工智慧技術可以快速對影片資料進行結構化分析,可以挖掘出其中的價值資料,進一步結合大資料技術將資料進行時空碰撞,從而實現資料關聯和資料檢索應用。

 

計算機視覺作為物聯網的視覺感知和視覺認知的重要環節,除了影片安防的智慧城市和智慧交通的應用外,已廣泛應用於在智慧金融、智慧樓宇、智慧教育、智慧環保、智慧城管等各個採用影片應用的行業,即使是傳統的影片安防行業應用也已經從安全管理延伸到城市管理、綠色出行等新型應用。

 

以影片結構化技術的應用為例,這是一種基於影片內容進行資訊提取的技術。影片結構化解析技術實現了人、機動車、非機動車和行為的解析,其中人的基本特徵包括面部、性別、年齡、身高、髮飾、衣著、帽子、包、口罩、傘等;機動車的基本特徵包括車牌、車標、顏色、車型車系、車貼、駕駛座人員、車飾、車窗等;非機動車的特徵包括車型、顏色、非機動車牌、乘車人等;行為的基本特徵包括絆線入侵、穿越圍欄、區域入侵、徘徊檢測、物品遺留、物品搬移、快速奔跑、打架鬥毆、人員聚集等。

 

道路擁堵治理也是當前城市道路管理的痛點之一,人工智慧技術可以發揮巨大的價值,在管理區域內的每個攝像機可以識別出影片中的人、車的行為,即時分析違章,還能獲取到道路實時通行的人流、車流、密度等資料,依靠大量攝像機資料聯動,結合紅綠燈管理系統,對道路車輛通行按需管理並進行分流提醒,可以達到有效提升道路通行平均速度的目的。

 

同樣在生產製造過程中,質檢環節需要大量工人靠人眼去評判生產零件、整機的質量。現在計算機視覺高速發展,可以透過攝像機安裝在流水線上,高幀率拍攝影片影像並實時分析零部件的表面各種工藝缺陷,例如液晶屏的劃傷、裂紋,金屬零件的完整性,整件安裝的角度一致性等,同時還可以直接掃碼,實現生產過程自動化錄入。因此在工業視覺領域,隨著人工智慧的能力快速適配,機器開始逐步取代人工,再極大程度上降低生產成本的同時還提升了產品質量。

 

此外,現在在人臉識別、文字識別、物品識別、行為識別、肢體識別等各個領域都有非常豐富的應用出現,人工智慧已經融入到人們的生活、出行等各個方面,比如刷臉支付、拍攝翻譯、動植物分類識別、體感遊戲等等。可見,視覺技術的升級和應用的擴充,將帶來相關產業升級和使用者體驗創新。

 

計算機視覺產業新一輪發展的起步年

 

2017   年計算機視覺產業處於井噴期,眾多的創業公司、巨頭企業以及跨界公司參與到了這個產業裡,各類的新技術和新應用出現在視野內。2018 年更多的是技術到產業的落地,成熟達到商用的視覺技術結合市場的需求在行業中持續開拓市場,尚在演進中的技術正在探索挖掘試點應用,一些偽智慧的技術則被快速淘汰,同時學術界和工業界也在創新地研究新的技術點並尋求突破。

 

2018   年是計算機視覺產業新一輪發展的起步年,市場才剛剛啟動,經歷過去兩年市場和使用者認知的培養,當前業務應用開始逐步從試用走向使用,在這個過程中技術也得到持續發展,解決了試用過程中碰到的種種問題。

 

隨著市場需求的開啟,在晶片、演算法、應用各個層面有了更多的企業參與。從個別的算力平臺到多元化計算晶片的格局,從早期少數演算法公司技術創新到當前眾多成熟公司共同參與,從演算法單點爆發吸引眼球到現在人工智慧推動產業升級與應用融合,目前市場格局已經發生重大的轉變,走向了從技術驅動型轉換到應用驅動型的發展。

 

計算機視覺的市場規模非常巨大,這是一種推動各個產業升級的力量,我們無法單純衡量它的市場價值。可以預見,佔據應用市場以及技術領先型的公司將在未來人工智慧浪潮中獲取核心價值,並引領行業的發展。


 

未來 2-3 年發展趨勢

 

展望未來 2-3 年,計算機視覺領域在技術、應用、產業各個層面必然會有新的突破。在演算法方面,深度學習技術會繼續發展,但可能會有新的技術方法誕生引發新的變革。晶片方面,市場上會有更多高效能低功耗的神經網路 SoC 晶片釋出,同時部分固化的視覺演算法會內嵌整合到晶片裡。

 

應用方面未來應該會持續蓬勃發展,這對於企業和使用者而言都是非常巨大的市場和想象空間:

 

  • 首先在現有的基礎上,會更貼近使用者的實際使用需求,演算法的迭代升級也會快速提升使用者體驗;

  • 其次新演算法的推出也會帶來更多的應用場景和業務需求;

  • 最後,應用的擴充將推動產業的發展,隨著新一代產品和解決方案的釋出和普及,更多融合型、跨界型的業務模式會產生。

 

當下人工智慧、物聯網、雲與大資料、5G、雲端計算等主導未來的核心技術正在加速發展與演進,計算機視覺行業生態在這些技術力量的驅動下,必將形成新的技術和市場格局。

【完】

 

轉自:

http://blog.sina.com.cn/s/blog_cfa68e330102yzix.html



來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/29829936/viewspace-2218325/,如需轉載,請註明出處,否則將追究法律責任。

相關文章