「專利解密」商湯科技:AI加持人臉識別

AIBigbull2050發表於2019-11-25

商湯的優勢還是在於AI人才的儲備和演算法優勢。目前在城市級萬路規模的視訊監控專案,AI尚未普及,一旦達到一定規模,對平臺端演算法和算力的需求將會極高。

集微網訊息,近年來,隨著安防體系的日漸壯大、監控點的不斷擴張和高清監控裝置的普及,監控獲得的影像視訊資訊呈現爆炸式的增長。傳統視訊監控系統的儲存和檢索等面臨著巨大的挑戰,如何快速、高效地從海量影像視訊中提取出有用的資訊至關重要。

「專利解密」商湯科技:AI加持人臉識別


為此,人們把人臉識別技術引入了視訊監控系統中,人臉識別技術很大程度上依賴於卷積神經網路的支援,而卷積神經網路需要龐大的計算量。


同時,現有的視訊監控系統中,人臉檢測識別都是在後端伺服器實現的,前端只負責影像資料的採集編碼及傳輸。這種前後端結合操作的模式,需要較大網路頻寬;同時,由於傳輸的視訊流資料中大部分都是無用的資訊,大大降低了後端伺服器對有效資料提取的效率。因此一種能夠直接應用在前端拍攝裝置上的人臉識別方法顯得尤為重要。


基於這些問題,商湯科技在17年8月31日申請了一項名為“人臉影像檢索方法和系統、拍攝裝置、計算機儲存介質”的發明專利(申請號:201710774389.9),申請人為深圳市商湯科技有限公司。


根據目前公開的專利資料,讓我們一起來了解一下這項人臉識別技術吧。


「專利解密」商湯科技:AI加持人臉識別


如上圖所示為人臉影像檢索方法的流程示意圖,這樣的方法將直接應用於拍攝裝置上。首先通過卷積神經網路獲得待檢索影像對應的待檢索人臉資訊。卷積神經網路經過處理器配置對應的卷積計算配置資訊,卷積神經網路包括至少一個卷積層,我們知道卷積層的層數越多,一般檢測效果也會越好,並且這個卷積神經網路是可以預先訓練好的。同時,這個步驟通過卷積神經網路處理獲得對應的待檢索人臉資訊,將後續檢索中的影像檢索轉換為人臉資訊檢索,使檢索更快捷,無需後續轉換。

其次,基於待檢索人臉資訊從資料庫中查詢匹配的預設人臉影像資訊,資料庫中儲存有預設人臉影像資訊。通過設定資料庫在拍攝裝置中實現了人臉的檢測與識別工作,大大降低了網路頻寬的要求,提高了資料傳輸效率。


最後,輸出待檢索人臉資訊匹配的預設人臉影像資訊。通過這樣的方案,卷積神經網路獲得待檢索影像對應的待檢索人臉資訊,卷積神經網路經過處理器配置對應的卷積計算配置資訊。由於卷積神經網路設定了卷積計算配置資訊,輸入到卷積神經網路中各卷積層中的影像的位寬都與卷積層相對應,提高了卷積層的處理效率,並輸入的待檢索影像可以快速準確的得到待檢索人臉資訊,既解決了定點運算計算精度低及影響計算結果準確度的問題,同時也提高了卷積神經網路的運算精度。

在瞭解了系統的整體方案之後,接下來我們再來看看該方法的硬體實施方案吧。

「專利解密」商湯科技:AI加持人臉識別

如上圖所示為該拍攝裝置中的組成硬體結構示意圖,其中包括影像採集模組、ISP處理模組、儲存模組、FPGA SoC模組、中央處理器、通訊模組以及供電系統。


影像採集模組,用於採集視訊流,並基於每個出現在視訊流中的人臉影像在採集的視訊流中篩選得到至少一個影像;ISP處理模組,用於對所有影像進行質量篩選,得到至少一個人臉影像質量達到設定閾值的第一影像;儲存模組,用於儲存對應第一影像的預設人臉影像資訊。


FPGA SoC模組包括硬體監測和中央處理,硬體監測實現通過卷積神經網路獲得待檢索影像對應的待檢索人臉資訊;中央處理用於為卷積神經網路配置對應的卷積計算配置資訊;通訊模組,通過通訊模組可將得到的匹配的預設人臉影像資訊傳送出去,同時還可以根據該預設人臉影像資訊屬於白名單或黑名單發出相應的資訊到預設的客戶端中。


以上就是商湯基於神經網路進行人臉識別的方案,通過在拍攝裝置設定的資料庫中檢索匹配的預設人臉影像資訊,實現了實時人臉檢索的效果,提高了檢索效率,不僅解決了現有方法中都在後端進行處理的某些侷限弊端,同時也實現了將檢測裝置佈置在前端時代價高昂的問題。人臉識別技術在我們的生活中也非常的常見,而商湯的這項技術無疑會使得我們的生活得到更多的便利。



https://www.toutiao.com/a6763087302034981384/




來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69946223/viewspace-2665547/,如需轉載,請註明出處,否則將追究法律責任。

相關文章