董明珠躺槍「行人闖紅燈曝光臺」,CV專家來支招

機器之心發表於2018-11-22

「紅燈停、綠燈行、遇到黃燈等一等。」

雖然從小就被教育遵守交通規則,但「中國式過馬路」的行為仍舊頻發、且屢禁不止。

為了規範大家文明過馬路,不少城市(深圳、天津、 莆田、新疆庫爾勒、廣州……)上線了「行人闖紅燈曝光臺」。顧名思義,闖紅燈的行人會被曝光在大螢幕上。

近日,網上流出的一張照片顯示:董明珠的照片也出現在了寧波的「行人闖紅燈曝光臺」上!旁邊還展示了她是在何地闖紅燈的。

董明珠躺槍「行人闖紅燈曝光臺」,CV專家來支招

然而,細看照片後卻發現:斑馬線上並沒有人。再仔細看看,原來是該系統把大巴車體上的董明珠廣告當成了真人。

這一烏龍事件引起了網友的熱議,小編朋友圈有眾多 AI 社群人員轉發討論,在新浪微博上搜尋「董明珠」,微博已經會自動給你推送「董明珠 闖紅燈」的詞條了。

董明珠躺槍「行人闖紅燈曝光臺」,CV專家來支招

董明珠躺槍「行人闖紅燈曝光臺」,CV專家來支招

有網友調侃,「之後估計李小龍也被顯示闖紅燈了」。

董明珠躺槍「行人闖紅燈曝光臺」,CV專家來支招

如何避免「被闖紅燈」現象的再次發生?機器之心採訪了多家計算機視覺公司,試圖瞭解「行人闖紅燈曝光臺」背後的技術機制,並尋找解題之道。

背後的技術與難題 

從曝光圖看來,模型主要會用 SSDYOLO 等目標檢測演算法預測人臉檢測框,並根據檢測框擷取人臉影像,最後透過計算人臉影像相似性而判斷闖紅燈者的身份。雖然過程並不複雜,但還有非常多未解決的問題,在這個案例中,活體檢測就成為了重要的缺失環節。

對於曝光平臺主要採用的技術,雲從科技研究院副院長周翔表示,整體流程可以分為「同步紅燈時間——抓拍人臉——後臺或前端實時比對——實時釋出或人工稽核」;其中,同步紅燈時間會比較簡單,抓取人臉也是比較常見的技術,但既然需要投入到生產中,那麼模型大小、穩定性和響應延遲等都需要特殊的設計。

武漢神目總經理黃瑞表示,這一場景主要是抓拍闖紅燈的行人,「立一個人像卡口與交通訊號燈互動和機動車闖紅燈有點類似,不同只是:一個抓人,抓臉與庫里人員 1:N 匹配核實真實身份;一個抓車抓車牌,與庫裡核對得出機動車真實身份。」不過,即使是同樣的技術應用到行人與車牌,多彩多樣的行人抓取也艱難得多。

儘管闖紅燈曝光流程很簡潔,在 GitHub 上呼叫一些預訓練實時檢測模型就能完成主體功能,但若想減少甚至避免「董明珠闖紅燈」這樣的誤差,還有很多最佳化的方面。

周翔說,出現這種情況的原因主要有:「(1)底庫沒有董小姐,所以自動選擇最相似的人進行顯示;(2)演算法沒有加入活體檢測,在這個距離上目前要判斷活體難度還是比較大的;(3)廣告當真人的現象目前看來比較正常,這是實際落地的一個妥協方案。」

深瞐科技 CTO 王建輝持相同的態度,他表示:「該事件只能說明該平臺的人臉檢測演算法效能還挺好,但是在產品設計過程中沒有考慮廣告牌等異常情況的處理,另外反映的是抓拍演算法並沒有做活體檢測,僅僅做的人臉檢測。技術難點是在非配合情況下如何做活體檢測。」

對於這種行人闖紅燈,難點確實在於非配合情況下的活體檢測,澎思科技首席研究員 Robert Lorenz 說:「這個案例在紅燈狀態下只要能捕捉到人臉就判斷為闖紅燈,缺少了人及動作的判斷。難點是人+動作的檢測,即抓拍人臉來自於「活體」人且有闖紅燈行走的動作。」

不過,黃瑞認為這件事不能算「誤判」,類似的事件全國各地每天都在發生。「按照抓拍機目前在國內市場的一般要求,就是隻做動態影像識別,不做活體識別。」在他看來,抓拍機和門禁等不一樣,判斷活體不是剛需。

解決方案 

這些都還是比較明顯和大方向上的難題,那麼,針對這些難題,又有什麼樣的解決方案呢?我們能不能不只檢測人臉,轉而檢測人的整個身體及動作來判斷是不是闖紅燈?

周翔表示,「不考慮語義資訊,目前沒有什麼稱得上特別好的解決方案,因為現在用的活體檢測演算法和硬體主要針對近距離場景,比如 3D 結構光、紅外雙目、動作、唇語、靜默等等,不過可以透過限定抓取人臉尺寸大小範圍來一定程度上緩解該問題。」

其實,如果不考慮語義或環境資訊,還是能透過一些硬體來解決問題,黃瑞說:「目前,部分南方城市某些地點已有的做法是,額外新增紅外攝像頭,但因為抓拍機場景通常距離很遠,所以要安裝的紅外攝像頭比較大型,各項成本都相對較高。」

考慮語義資訊則會有更好的表現,Robert Lorenz 表示,新增人體檢測可以在一定程度上解決這一問題。但也有多方面因素需要考慮,比如人臉的大小和身體軀幹的比例關係,否則也會出現印在行人衣服或者揹包上的偶像人臉被誤抓的問題。

加入姿態估計或移動座標等語義資訊確實可以判斷是廣告還是人,周翔說:「但是這樣會導致模型複雜度提升,如果不換用效能更好的硬體,演算法速度可能會有一定程度下降,在這個場景的必要性不是很大。」因為對於這種大規模應用,模型引數量、計算力和準確度都有很高的要求,複雜模型很難部署到實際應用中。

Robert Lorenz 最後表示,目前的解決方案主要有以下幾種:

  • 加入影像大小的檢測,印刷廣告上的人臉大小一般情況下會比行人的臉大,所佔畫素面積也會更大,只需要設定人行橫道由遠到近可能拍攝人臉的大小,可能很大程度上避免此類情況出現,但衣物等的人臉影像就存在一定的被識別風險;這屬於從工程角度杜絕這類問題,而不是演算法角度;

  • 影像質量判斷,拍攝真人和印刷物產生的照片存在明顯差異,比如膚色、紋理等,可以透過模型訓練讓計算機進行區分;

  • 加入深度資訊,比如雙目相機和 RGB-D 相機,獲取 3D 資訊,就可以遮蔽掉印刷物等 2D 影像,但此方案成本太高,不適用於闖紅燈;

  • 利用人體骨骼關鍵點檢測,並藉助關鍵點描述人體姿態、預測人體行為。基於人體的骨骼關鍵點和關鍵物體分析,還原人體姿態,理解人類的動作。澎思科技擁有的行為檢測技術還可以進行異常行為檢測(利用高精度的人體關鍵點,您可以檢測出影片中或圖片中人體的異常動作),比如針對闖紅燈這個情境下,就可以針對行人意外摔倒、行動緩慢人,坐輪椅殘疾人進行檢測,結合紅綠燈控制,就可以真正為人們的生活提供便利。

「誤拍是小事,切記文明出行,平安最重要。」今日上午 10 時 15 分,董明珠本人在新浪微博上對此事做了回應。

在小編看來,避免「被闖紅燈」的再次發生,需要作出努力的,除了技術方案提供商,還有我們自身。規範自身行為、文明過馬路才是解決問題的根本之道。來,跟著念一遍,「紅燈停、綠燈行、遇到黃燈等一等。」

相關文章