5G時代的視覺語義化技術:軟硬結合解決方案帶來的智慧新體驗

pythontab發表於2019-07-10

5G時代,更多物理裝置連結到高可靠、低延遲的網路空間,越來越多的場景需要更高效的視覺計算、更低延時的體驗,更好的隱私保護。在剛剛結束的百度AI開發者大會上,百度大腦視覺技術再次升級!百度視覺技術部、擴增實境技術部總監吳中勤全新發布視覺語義化平臺2.0-軟硬一體解決方案,讓邊緣裝置更聰明、更高效。

  會上,吳中勤著重通過飛槳-PaddleSlim,FaceID多模態人臉識別元件和AI相機3大技術和應用,展示了視覺語義化技術在軟硬體結合方面的全新升級。

  模型壓縮平臺PaddleSlim,助力端演算法快速高效落地

  隨著移動裝置被廣泛使用,在移動網際網路產品和眾多邊緣裝置應用深度學習和神經網路技術已經成為必然趨勢。但對於開發者來說,除了模型的訓練,在產品化過程中還會遇到各種各樣的工程化問題,例如安裝包大小、執行記憶體佔用大小、推理速度和效果等。當前主流的模型很難直接高效的部署到各種智慧裝置中。

  飛槳(PaddlePaddle),作為中國首個也是目前國內唯一開源開放、功能完備的端到端深度學習平臺,深受開發者的歡迎。PaddleSlim,是飛槳平臺中強大的模型壓縮工具,來源於百度視覺團隊的工業實踐。不僅簡單易用,而且支援的壓縮方式種類和效果業界領先。

  PaddleSlim 實現了目前主流的網路量化、剪枝、蒸餾三種壓縮策略,並可快速配置多種壓縮策略組合使用。針對體積已經很小的 MobileNetV1 模型,在模型效果不損失的前提下實現 70% 以上的體積壓縮。以人臉技術為例,在精度幾乎不衰減的情況下,模型速度提升接近9倍.同時也新增了基於模擬退火的自動剪枝策略 AMC 和輕量級模型結構自動搜尋功能 Light-NAS,對比 MobileNet v2 在 ImageNet 1000 類分類任務上精度無損情況下 FLOPS 減少 17%,在百度的OCR識別等業務線應用,精度無損甚至提高的情況下,速度均帶來了大幅提升。同時壓縮工具簡單易用,極大的提升了模型壓縮的開發效率。

  通過飛槳Paddle-Slim可助力開發者快速將不同場景的端演算法進行有效的往邊緣移植,為使用者提供相應速度更快、互動性更好的產品.

  多模態人臉識別開發元件FaceID,直擊軟硬體適配痛點

  現在AI落地如火如荼,百度人臉業務的增長速度今年比去年同比呼叫量增長了10倍,但是很多開發者都會面臨和AI產品結合時應該配置什麼攝像頭,應該買什麼品牌型號等問題,之後還有一系列的適配的工作。為了確保給開發者提供領先且實用易用的產品。百度聯合生態合作伙伴推出軟硬一體的多模態人臉識別元件FaceID。

  Face ID軟硬結合開發套件均支援RGB單目、3D結構光、近紅外3種模態,並搭載業界領先的人臉檢測、人臉關鍵點、人臉活體、人臉識別的全流程能力,較之前全流程業務速度可控制在500ms以內。同時可支援5萬底庫。極大擴充開發套件的應用範圍。從易用性角度,基於大量的客戶反饋和建議,優化了底層API設計,更符合場景化業務開發,有效降低開發週期。在場景支援上,對於人臉通行、人證核驗等典型場景,百度提供了場景化示例工程,並配合多種高階設定,幫助開發者一分鐘跑通業務流程。

  這款軟硬一體、即插即用的人臉識別元件,能夠極大地幫助開發者節約部署與維護成本,目前已落地政務、金融、教育、零售、公共出行等多個行業,裝置覆蓋量超過1200萬臺。

  AI相機,即拿即用的軟硬一體解決方案

  此次釋出的軟硬一體AI相機系列產品,將領先的AI視覺技術與智慧晶片技術聯合優化,實現了端上的AI視覺計算。系列包括“尋相人臉抓拍機”、“尋相魚眼人流相機”、“尋相智慧戶外相機”等多種形態的AI相機產品,可以實現人臉檢測、跟蹤、人體分析、車輛分析等功能,產品穩定性、功耗、綜合效果行業領先。

  如“尋相人臉抓拍機”利用Intel Movidius 技術,可支援幀率25 Hz、20張人臉在複雜光照條件下的高精度抓拍,在客戶實際場景使用達到96%抓拍和識別召回率。

尋相 VX-HT01人臉抓拍機

  除了人臉產品,我們也將人體分析、商品識別、SLAM等演算法升級成為軟硬結合產品,研製了客流分析相機、智慧貨櫃、無人零售店、服務機器人等產品,均已經落地投入使用。

  以品牌連鎖門店為例,利用人臉抓拍機和人流分析相機百度構建了門店智慧監控方案,用於統計線下門店轉化率,識別重複到店顧客,繪製商區熱力圖。這套方案易部署、價效比高、產品可靠,已經簽約落地多家品牌連鎖企業,在3C賣場、手機品牌店、通訊營業廳、便利店等多個場景中幫助企業主進行做出“更智慧”的運營決策。

  百度完整的軟硬一體產品線,可助力開發者、企業靈活地組合各軟硬體產品及功能,解決不同場景下對視覺語義化技術的需求。

  在高效能的軟硬結合產品的背後,隱藏著百度模型加速、人臉識別、物體檢測等多項取得了學術競賽第一的領先演算法,積累了多年的異構計算優化技術,以及和深圳供應鏈的深度整合能力。

  在即將到來的5G時代,百度視覺語義化平臺的軟硬結合解決方案無疑對視覺技術在不同場景的落地需求提供了堅實助力。彌合虛擬世界與物理世界的間隙,重新整理人們探索世界的方式,未來,人工智慧視覺技術將離你我身邊越來越近。


相關文章