富蘭克林的風箏:ReID產業化拉開的計算視覺新序幕

naojiti發表於2020-04-01

請大家跟我想象一下,假如你的世界裡突然沒有了電,會是怎樣?沒有了鬧鐘和手機,沒有了燈光與網路,也沒有了電腦地鐵和飛機……

一切現代生活的便利,都源於1752年6月的一個雷雨天,富蘭克林放飛了他的風箏,讓世界“看到”了電——當時被認為是最神秘、也是最危險的力量之一。

近幾年來,人們面對城市中日益增多的智慧攝像頭,或多或少都會懷抱著如同“雷電”一樣的警惕。無數科幻電影都告訴我們,當走在路上的自己被電腦錄入,出行軌跡就有可能被隨時偵查到……

顯然,這並不是因為人工智慧(人臉識別)技術太強大,而是因為它還不夠強大,至少在大眾應用層面是如此。舉個例子,想要在精準識別與個人隱私之間達到平衡,行人重識別(Person Re-identification,簡稱ReID)就是一個非常有用的計算視覺技術。

因為它能夠透過質量並不高的人臉圖片,快速檢索出不同攝像頭下的同一個目標任務。

這會帶來什麼改變呢?

首先,人的臉和指紋一樣獨特,而ReID技術無需依賴高精度的人臉影像,也就避免了人們在公共場合被採集個人資訊的憂慮;同時,ReID解析度夠高,在一些人臉識別無效的情況下,可以起到替代作用。

因此,ReID也成為計算視覺科技企業們攻關的物件。最近,依圖科技在ReID領域取得突破,重新整理全球工業界三大權威資料集當前最優成績(SOTA),演算法效能達到業界迄今最高標準。

這一標準意味著什麼,能否成為ReID產業化的關鍵契機?

產業新動力:ReID的價值與門檻

本傑明·富蘭克林和他的風箏實驗,代表了人類邁出了現代文明旅程的第一步。在那之前,沒人能想象有電的生活;而今天,數十億人已經無法想象沒有電的生活了。

時代的需求和社會風俗的推動(很多時候是阻撓),總會有人為技術的程式助力。ReID即是如此。

相信大部分人都不會否認,人臉識別/計算視覺在城市中的應用,正在給生活帶來越來越多的便利。

比如透過智慧攝像頭來識別車流、車牌,實現高效率、低成本的安防;在火車站、機場等公共場所部署AI,實現犯罪分子的偵查和捕獲;幫助無人購物超市和商店提高使用者體驗;

再比如大家最熟悉的手機相簿,想要讓系統在不侵犯隱私的情況下實現照片聚類,ReID都是不可或缺的技術。

2018年,川普政府決定在美國南部墨西哥邊境追查非法入境者時,大眾就擔心ICE和其他機關可能會把人臉識別應用,從而導致錯誤辨識某個人並使其被錯誤拘留?因為在當時,人臉識別對於有色人群或女性的識別錯誤率依然很高。

既然ReID技術能夠讓智慧生活變得更精準有序,那為什麼久攻不下呢?這恐怕要從三個技術難點說起。

1.資料缺失。

我們知道,當前大多數攝像頭的成像質量、解析度、環境變化等差異都很大。在交通運輸、工業製造和城市規劃等實際場景下,99%的影像都是不含人臉或人臉部分是極其模糊的,僅有幾個畫素大小,這也導致在許多工中,人臉識別演算法經常失效,需要ReID頂上。

而一個高精準的ReID模型,要識別同一個人在多個攝像頭下的畫面,意味著其訓練需要足夠龐大、且具備連續性的行為資料。但與其他計算視覺任務相比,ReID領域的公開資料集所含的ID數量比較小,不同攝像頭的資料中同一個人的外觀也可能發生巨大變化,這些都給演算法分析造成了阻礙,需要在演算法設計上做很多創新與研發。

2.計算壓力。

如前所述,ReID往往被部署到規模人群的行為軌跡分析上,這意味著系統需要處理的資料規模成倍增長。即使是採取1:N級(單一特徵對比多種特徵)的人臉識別,用來失蹤人口搜尋等。加上角度、光線等複雜性,特徵提取、對比、判斷都需要龐大的算力來支撐。

但現有的智慧攝像機在本地終端無法部署足夠大的算力,往往會選擇將資料上傳到雲端,再進行識別和處理,不僅會造成一定的時延,延誤眾多關鍵任務;也有可能導致城市大腦“資料擁塞”,延宕整個系統的效率。

3.成本限制。

那麼,為什麼不考慮為攝像頭等邊緣終端加上晶片呢?答案就是貴。高通量計算晶片往往意味著更高的效能和穩定性,製程上自然也要求更小的奈米數,而ReID需要在泛工業場景中部署,如果為城市或工廠中的每個攝像頭都載入這樣高算力的ReID晶片,無疑是一筆巨大的開支,這也限制了ReID演算法在大規模商業化場景中的落地。

顯然,想要讓ReID從一種技術遠景完全照進現實,其所面對的困難和障礙並不小。這也是為什麼,我們一直關注著致力於用ReID改善體驗的公司。

用電子編織現實:依圖這樣改變ReID

如果說富蘭克林的風箏讓人類開始與電建立了聯絡。那麼,電力真正開始產生規模經濟,是從喬治·威斯汀豪斯(George Westinghouse)開始。他以交流電系統擊敗了愛迪生的直流電系統,從而讓發電廠與遠距離的使用者連線在一起。

而依圖在ReID中的表現,正如這場世紀對壘一樣,對ReID的現實落地起到了關鍵作用。

為什麼這麼說呢?

首先,依圖升級了ReID演算法的開發流程。透過結合AutoML等前沿技術,依圖創新性地實現了模型引數的自動搜尋與迭代,改變了演算法依賴研究員手工設計與調優的傳統開發流程。不僅降低了模型的訓練成本,也讓演算法的泛化性更強。

其次,進一步提升了ReID演算法的識別效能。依圖自研演算法在業界最具影響力的三大ReID資料集Market1501、DukeMTMC-ReID、CUHK03上,將兩大關鍵指標“首位命中率”(Rank-1 Accuracy),以及“平均精度均值”(Mean Average Precision,mAP)6項資料全部提升,達到了更高的mAP,目前達到了工業界第一,從而進一步穩固了中國AI在該任務上的領跑地位。

此外,ReID演算法的實用潛力持續進階。在實戰應用中,依圖還依託自研的AI晶片QuestCore(求索), 在僅憑穿著、步態特徵的條件下,將ReID做到2017年——2018年人臉識別的精度。當時,機場、火車站等公共場合已經開始大規模使用人臉識別進行安防保障了。這意味著,ReID也有望被以低成本的解決方案,儘快進入現實場景之中,讓人們無懼且享受計算視覺帶來的順暢體驗。

目前看來,依圖的創新將帶給ReID演算法更好的成本比,以及更絲滑的應用體驗,平衡了理想技術與現實困境之間的關係。

挑戰與機遇:ReID的未來路徑

必須承認的是,要讓城市換一種“眼睛”看行人,並不是一件容易的事。

一方面,各個城市攝像頭體系的建設標準、密度,以及進度都各不相同,要讓它們共同點亮ReID的“技能樹”,實現全面替換,還有許多與技術成熟度無關的挑戰;

還要面對複雜實景的挑戰。即使ReID演算法的首位命中率足夠高,只意味著演算法能夠在特定的幾個場景資料集下準確找出最容易識別或者匹配的那張。但現實中的場景遠比這有限的幾個資料複雜的多,資料模糊、建築物遮擋、天氣的改變等等,都會影響模型的實際表現。所以現在認為ReID模型能夠應付真實任務,還為時過早。

這也是為什麼,儘管依圖科技刷榜SOTA,演算法效能達到了業界目前的最高標準,但依圖的研發人員耿直地說,學術界的這三個資料集不能遠遠不代表工業界的最好水平,更精彩的表現還要放眼於實戰之中。

因為比賽中所採用的資料集,早已限定好了規模和分佈,屬於“應試作業”;而在依圖實際落地的ReID專案中,還會遭遇更加複雜的資料、環境、引數,是“奧數級別”的挑戰難度。

另外必須正視的一點是,要讓終端攝像頭完成高通量的實時計算,僅僅依靠研發端的突破還遠遠不夠,城市環境中是否具有足夠的邊緣計算節點,是否有邊緣計算資料中心提供澎湃的算力支援,這些都需要整個產業鏈乃至城市決策者的共同合作。

由此不難發現,在抵達ReID產業化的旅程中,科技企業起到了怎樣的作用呢?

以依圖為例,一方面,透過將自身科研優勢與新興演算法相結合,加快AI演算法的落地。

比如依圖就將自身在晶片研發上的硬體能力,與通用化演算法相結合,實現了軟硬體協同開發,不僅取得了刷榜的好成績,更關鍵的是啟用了ReID與晶片端的融合可能,讓更多的算力需求被釋放,從而帶動晶片產業乃至整個社會智慧的程式。

正如人臉識別逐漸滲透到社會的各個角落,ReID演算法也將成為智慧生活不可或缺的一部分。藉助AI晶片QuestCore™(求索)和ReID模型應用,依圖將催化出多大的商業富礦,構築基於ReID的新產業鏈。

1752年,富蘭克林爬上屋頂放飛一隻風箏的時候,可能並沒有想到,他將改變整個世界的科技認知與生產基礎設施。

而ReID對城市計算視覺應用的迭代,也將為人類帶來新的視角與光輝,並在不遠的未來成為與我們生活休慼相關的一部分。

廟堂之高,與江湖之遠的疊加,就是依圖乃至整個AI產業所紮根的廣袤土壤。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31561483/viewspace-2683985/,如需轉載,請註明出處,否則將追究法律責任。

相關文章