前端智慧化的加速時刻:華為機器視覺的創新方程式

naojiti發表於2020-08-27

守林員小陳每天的工作,大部分時間都用來在林間巡邏,以便第一時間發現安全隱患。枯燥繁重的工作讓年輕的他有點鬱悶。

有天他舉著朋友圈裡轉發的文章問領導,聽說有地方都能用AI來識別山火了,我們們啥時候能用上啊,以後我也算半個用電腦上班的白領了。

領導懶得搭理他,新的智慧監控攝像機剛安裝不久,影像質量提升了不說,目標識別、異常行為監控之類的功能也都有了,哪裡還有經費換個“火眼金睛”!年輕人啊,就是身在福中不知福!

小陳囁嚅道:都不能及時更新,還叫智慧啊……

類似的經歷,正在城市的各個角落上演。

讓攝像機看懂正在發生的事件並提出告警,已經在越來越多的智慧城市專案中落地,不過實現形式卻各有不同。

目前,機器視覺智慧分析主要分為兩類:一種是前端智慧化硬體分析,另一種是後端伺服器分析。這兩種部署方式的區別,主要體現在三個方面:

1.時效性不同。

前端智慧化,側重於對影片進行實時分析,能夠實現“事中報警”,比如在機場、高鐵站,一旦發現移動目標出現了觸發預定義分析規則的行為,就會引發聯動;

而後端智慧化則會先將前端攝像機採集的影片流儲存到伺服器中,根據預設的不同規則,從海量的資料中提取出相關資訊,集中優勢計算資源做更深入的分析,實現檢測與事件檢測的協同聯動,方便“事後查證”。

2.資料量不同。

實時分析與預警,需要前端智慧化有較高的計算效能來支撐,如果把演算法整合在硬體配置低的攝像機上,處理速度變慢,就會喪失前端智慧的優勢。因此,大部分前端只能執行相對簡單的、對實時性要求很高的演算法。

後端智慧分析會根據需求配置足夠強大的硬體資源,可以處理成百上千攝像機組成的系統所上傳的資料,執行復雜的、允許一定延時的演算法。

3.成本焦點不同。

智慧前置對攝像機提出了強大的軟硬體計算能力要求,終端硬體成本比較高,好處是可以節省頻寬資源,幫助後端減輕計算壓力,同時實現無人值守,也能夠節省人力成本;

而後端智慧則需要在儲存管理、傳輸頻寬、伺服器叢集等方面進行較大的投入,來保障資料傳輸的穩定性,當然,分析運算的集中化也讓演算法升級、裝置運維都變得簡化。

那在現實中,究竟是“前端好”還是“後端好”呢?

用一句網路語總結,小孩子才做選擇,成熟的大人當然是全都要。

前端的響應速度與穩定性,與後端的資源能力和全域性視角,兩者互為補充,可以更加貼近一線、事半功倍。

舉個最簡單的例子,當自動駕駛汽車走在路上,如果攝像機採集的內容還要傳送到雲端進行識別、判斷、分析,一旦遇到網路不好的環境,那還沒等指令下傳,事故可能就已經發生了。最佳的解決方案,當然是由自帶智慧演算法的前端直接完成實時的路況判斷、障礙物識別、違法檢測,而更復雜的線路分析等海量資料學習,可以在泊車時交給後端處理,豈不兩全其美?

前後端協同,前端智慧化是重中之重

既然前後端協同,已經成為影片分析系統的必然趨勢,那麼,如何以更低耗能、更低成本實現前端智慧化,也就成為各行各業智慧化管理中的當務之急。

一方面,儘管人們早已習慣了大街小巷攝像機的存在,但其中大部分是僅具備影片採集功能的傳統攝像機,能“看清”就不錯了,在影片線索查詢時依然需要啟動人海戰術,消耗大量人力物力。

因此,能“看懂”發生了什麼的智慧化、數字化、高畫質化攝像機也就成了大勢所趨。有資料顯示,2019年的前端智慧化增速相比2018年,提升了100%。

另一方面,越來越多的智慧演算法開始從後端轉移到前端來完成。比如大家熟悉的車牌號識別、目標識別等等,能夠有效減輕後端的計算壓力,實時告警還可以有效降低漏抓誤報的可能。

但在實際場景中,光線、姿態、清晰度等等,都有可能影響識別效果,這就要求前端有終端晶片、軟體平臺等基礎的支撐,來使更多演算法可以落地。

尤其是在多媒體技術不斷更新迭代的情況下,文字、圖形、影像、動畫、聲音及影片等不同形態的資料混合在一起,需要技術雄厚、結合具體應用場景來攻克的企業才能完成這一挑戰。

就拿公共安全領域來說,有的是靜態識別,比如車輛、顏色等等;有的是異常行為,比如突然加速、聚集、突然跌倒等等;還有的要針對移動物體進行智慧化跟蹤分析、複雜場景下的影片分析等等……這些都需要不斷引入新的演算法來解決。

從這個角度看,前端視覺感知的種類、數量和質量,直接決定了智慧化程度的高低。

此外,前端智慧化要實現工程上的成本最優,需要可以演進式地發展。其中就存在著不少阻礙,比如有的前端系統比較難接入和相容,想要在監控功能基礎上增加智慧分析,往往需要重複安裝攝像機,重複建設無疑會造成極大的資源浪費;

再比如,目前市場發展不均衡,有的廠家有演算法但產品不足,有的廠家演算法和產品都有但缺乏配套軟體,最後呈現的分析效果和效率也都差異很大。

軟體缺乏可持續的演進能力,最直接的結果就是很容易遭遇效能瓶頸,尤其是在摩爾定律接近極限、難以突破的現狀下,智慧攝像機每3-6個月就需要迭代一次,如果沒有開放OS和相應軟體來對系統進行自動升級,以及加速演算法載入與迭代,那麼前端硬體的內建算力會很快被極速的計算量耗盡。

正如圖靈獎得主David Patterson所說,未來十年將是計算架構“新黃金十年”,透過架構最佳化、“軟硬協同”的方式來提升整體計算效能,將成為大勢所趨。

總的來看,儘管前端智慧化的前途看起來一片光明,但它也受限於許多前置條件,比如低成本量產的嵌入式AI晶片、高效能場景化的垂直演算法、全流程可演進的軟體平臺等等,沒有這些,前端智慧攝像機也很難飛入街頭巷陌。

淬鍊前端:華為的三個智慧方程式

在前端智慧化已經勢不可擋的情境中,華為也結合自身大量的計算、儲存、聯接、雲化、智慧、安全等各個領域的技術積累與商業實踐,在“全棧雲、全智慧、全場景”的機器視覺和大資料解決方案基礎上,給出了一個體系完備、面面俱到的解題樣本。

第一道方程式:AI芯+演算法商城,實現前端效能升級

算力是智慧的基礎,提供“軟硬協同”的算力支撐,華為也有自己的思路:

一方面,華為軟體定義攝像機(SDC)搭載專業AI晶片,算力最高可達20T,可以在極致低功率、極致算力等不同場景中為前端釋放極致算力。讓硬體可以輕鬆實現如目標分類和屬性識別等能力,甚至可以完全取代後端伺服器來完成影片全量特徵分析,提升實時響應能力。

此外,華為演算法與應用商城HoloSens Store也應運而生,實現前端智慧演算法按需可選,線上載入,賦予前端越來越強大的能力。

第二道方程式:軟體定義+按需適配,實現能力開放

智慧影片監控系統往往會在城市的多個場景、多種業務下使用,比如白天要檢測車輛排隊長度、甄別事故,晚上則重點看護應急車道情況。如何最大化地根據個性化需求來進行設計,讓前端智慧能夠快速響應、不斷創新呢?

答案自然是允許合作伙伴開發多元化的垂直場景演算法,這就需要開放性的軟體定義來將底層硬體能力釋放出去,實現多維感知感測器硬體等終端,以及多種軟體能力的接入。

華為就基於容器架構,華為打造業界首創攝像機OS,推出“軟體定義”架構。以標準、歸一化的軟體執行環境,實現軟硬體解耦,統一呼叫底層硬體的計算和編排能力、統一由作業系統封裝,開發者只需要聚焦功能側的能力,大大降低了開發門檻。

另一方面,透過一系列行業標準的北向接入協議,打造了開放的軟體生態。合作伙伴在完成演算法訓練與開發之後,就可以快速整合SDC OS公共軟硬體能力,打造成各自行業中具有差異化競爭力的商用產品。

這樣做的好處是,能夠讓大量合作伙伴加入並品嚐前端智慧化的商業機會,按照各自聚焦的場景開發大量匹配行業屬性的長尾演算法,解決客戶的實際問題,同時介面標準的統一,能夠持續演進迭代,進一步降低部署成本,增加其競爭優勢。

第三道方程式:多演算法+多工具,自動化敏捷開發

對於應用前端智慧的企業/機構來說,要自己訓練一個AI模型還是比較複雜、技能門檻較高的工作。想要實現AI普惠,前提就要讓應用開發變得更容易、更快捷,使其成為ICT從業人員的一項基本技能。

因此華為也將完善的SDC Studio開發工具鏈開放出來,提供通用演算法模型、演算法模型檔案格式轉換、資料的自動標註等服務,以降低應用者的開發成本,提升調測效率。結合前面提到的演算法商城,可以共同實現在SDC上的演算法與應用管理,以便讓前端智慧演算法和應用可以根據不同場景、全生命週期都能夠持續演進、敏捷開發。

完成了這三道方程式的解題,華為也就引領前端智慧來到了一個新的維度:

這裡不再是單一視覺影像的世界,而是集合了多種感測器,讓視覺、聽覺、雷達、定位等各種資料互相交織,形成一張全息感知的智慧網路,為城市治理、交通等精準護航;

也不再是需要重複“打補丁”的成本雷區,透過軟體定義攝像機SDC的開放服務化介面,讓前端可以跟隨數字技術的變化而動,不斷升級更大的價值;

更不是通用演算法的“一言堂”,不同種類、不同廠商的多演算法在框架體系內生長,一同將AI推向各個實際場景的細枝末節之中。這樣的城市之眼,不正是你我所期許的嗎?

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31561483/viewspace-2715347/,如需轉載,請註明出處,否則將追究法律責任。

相關文章