深蘭科技的征途,AI的賽場與戰場

naojiti發表於2020-09-08

在頂尖學術會議中成功“刷榜”,一直被看做是AI企業實力的絕對證明。尤其是在AI研究創新湧現、幾大頂會迎來“論文大爆炸”的背景下,學術競爭也愈加激烈,想要“出人頭地”,真不是件容易的事。

最近在全球計算機三大頂級會議之一ECCV 2020上一舉拿下8個賽事冠亞季軍大獎的深蘭科技,彰顯實力。

而且,深蘭科技也在Kaggle平臺上舉辦的ECCV挑戰賽Google Landmark Retrieval 2020上斬獲金牌,在計算機視覺模式識別會議CVPR2020中斬獲了12項冠亞季軍,在國際計算機視覺大會ICCV2019競賽中拿下“四冠四亞一季”的成績……各種優異成績的井噴,顯然不是偶然。

我們知道,計算機視覺是當前人工智慧學術界非常活躍的研究領域,而ICCV、CVPR、ECCV這計算機視覺方向的三大頂級會議,更是雲集了谷歌、史丹佛、BAT等等科技巨頭,被中國計算機學會評為最高階別學術會議。

在這樣的“學術修羅場”能夠拿下挑戰賽的大滿貫、取得多個第一的戰績,深蘭科技的技術底蘊與含金量不容小覷。

初看結果,讀者們可能會很詫異,深蘭科技到底做了哪些創新,又對當下乃至未來一段時間的AI研究帶來怎樣的影響?

沿著這些問題思考,或許我們能對AI技術與產業邏輯,有更深一層的理解與認知。

深蘭科技的創新成績單

既然是硬核學術會議,自然還是成績說話。我們先來看看深蘭科技在三大頂會拿獎到手軟的各種創新演算法,究竟都在做什麼。

就以此次ECCV為例,深蘭科技獲得雙冠的GigaVision 2020挑戰賽,是由清華大學基於其新推出的資料集PANDA而組織的。

PANDA是全球首個十億畫素級別視訊資料集,在如此大規模的資料集上完成影像多類別目標檢測,既要保證演算法能夠在目標尺度變化、擁擠遮擋的複雜情況下準確地識別出行人和車輛這兩種不同的目標,還要保證足夠高效,在十億畫素級別解析度下快速完成。

顯然,這一任務的完成,能夠對大規模現實場所中的行人檢測、動作識別、異常檢測等帶來技術上的飛躍,讓人臉識別、無人駕駛、監控安防等應用結果更準、效率更高。

而針對技術上的難點,深蘭科技DeepBlueAI團隊在檢測賽道將任務解耦為多個子任務,把難點獨立出來重點解決,並根據以往檢測經驗,通過所積累的模組和方法,使得結果有了進一步的提升。最終以領先第二名2.6個百分點的成績強勢獲得冠軍。

在其他類目的挑戰賽中,深蘭科技DeepBlueAI團隊相繼完成了基於部分MSCOCO資料集來進行80個類別目標檢測的小樣本學習任務;在不使用任何預訓練模型從頭開始訓練的限制下,在ImageNet的子集上獲得最高的準確率;運用優化資料增強方法、特徵提取器、後處理等方法,對無人機視角拍攝的圖片,完成車輛、行人等目標的定位分類……

上述成績,都只是深蘭科技2020年研究成果的一部分,也是其技術積澱和底蘊的又一次佐證。

實際上,在ICCV 2019,深蘭科技就曾在VisDrone Challenge (無人機視覺挑戰賽)中,運用Cascade RCNN+DCN+FPN+DoublueHead檢測器,以及IOU Tracker+ KCF+Tracklet vote的跟蹤演算法,來解決部分目標過小、資料分佈影響預訓練效果等難題,最終以領先4個多百分點的巨大優勢獲得兩項冠軍。

CVPR 2020的NightOwls 檢測挑戰賽,也為參賽者們設定了不小的難題。現有的視覺檢測演算法不能很好滴解決夜間場景圖片中的行人,這無疑會給無人車夜間行駛的可靠性、監控安防的安全效能等都帶來了一定的限制。

所以NightOwls就開展了相應的比賽,而深蘭科技也順利在 “單幀行人檢測”和“多幀行人檢測”兩個賽道中拿下了冠軍。夜間行人檢測與白天行人檢測相結合,能夠打造適用於不同天氣條件、全天候的行人檢測系統,讓現實世界的出行安全更有保障。

關於深蘭科技在數個AI頂會上的創新表現,我們就不在此一一列舉。可以肯定的是,深蘭科技作為中國AI企業的代表,在頂會競賽中大放異彩,不斷向全球傳達和證實著中國AI力量的實力,達到了世界領先水平。

深蘭科技的學術+產業“雙迴圈”模式

大家可能會好奇,在計算機視覺這一競爭激烈的賽道上佔據技術上的多方位領先,深蘭科技到底做了些什麼?

這恐怕就要從深蘭科技的業務邏輯說起了。

我們知道,2017年開始的人工智慧資本熱潮,帶動了一大批AI企業的湧現,大致可以歸為兩類:

一種是專研演算法的技術型企業。其核心資產是演算法、資料等能力,需要引入深度學習領域的高階人才,大量投入底層演算法研發與創新,常常需要跟谷歌、微軟、Facebook這樣的科技巨頭“搶人”。儘管投入巨大,但也正是這一類企業推動了人工智慧底層技術的不斷精進,而一旦達到規模效應,就很容易佔據行業領軍者的位置。

而另一種則是產業升級的應用型企業。商業邏輯也很清晰,就是向演算法供應商購買技術,通過自己的工程師團隊將其打磨成體驗良好的成熟AI產品,藉助自身的服務能力與銷售渠道將解決方案售賣出去。

而有意思的是,深蘭科技走出了一條獨特的路。

借用2020年十分火爆的一個關鍵詞“雙迴圈”來形容,深蘭科技一邊在各種AI頂會上尋求技術上的系統性、基礎層面的領先,一邊帶動AI技術落地應用、服務民生,開闢了一個“基礎技術+產業聯動”的雙迴圈模式。

舉個例子,前面提到深蘭科技在CVPR 2020各個挑戰賽中提出的多項檢測與分類演算法,就被落地應用在了智慧熊貓公交車等產品上,讓公交車自主制動和執行,為城市公共交通提供了新的選擇;乘客掃手就能上車,體驗和效率都大大提升;智慧機器人還能感應駕駛員和安全員的實時狀態,最大程度地保障乘車安全;藉助關鍵點檢測打造“異常行為識別系統”,車廂內有人摔倒、偷盜等情況都可以及時告警……

再比如,智慧城市建設中部署的許多商業化攝像機,難以在惡劣天氣下保持比較穩定的識別準確率,給城市管理帶來了很多隱患。深蘭科技奪冠的“挑戰賽霧天條件下的(半)監督目標檢測任務”,恰好就針對這類問題,讓攝像機在惡劣天氣環境或光照條件較差的情況下,依然能夠很好地完成任務,讓深蘭科技的客戶或整合其演算法的企業能夠更好地使用AI。

今年春節期間,面對防疫工作中的測溫剛需,深蘭科技快速上線的AI熱感視覺行為監控系統——貓頭鷹,就融合了多種世界冠軍級技術,採用了紅外熱成像技術和自主研發的機器視覺演算法,深度融合紅外和可見光影像,人們只要進入被測溫範圍就能實時測出體溫,無需停留,在防疫的同時大大方便了出行。而能如此快速地打造出服務社會的剛需產品,顯然離不開深蘭科技將長期的技術積累與產業需求深度整合的能力。

正是這種底層研發突破與產業標準化落地的雙重效應,讓深蘭科技在學術競賽中彰顯實力的同時,也很快將先進演算法落地,藉由產業化的規模效應實現商業價值,再進一步推動AI技術的進步,進入自身發展的良性迴圈。

行穩致遠,未來可期

一邊是技術創新,一邊是應用落地,深蘭科技顯然選擇了一條更難走的道路。大部分人可能會問,有必要嗎?

比如直接售賣演算法或者解決方案,深蘭科技始終堅持基礎研究和應用開發雙落地的模式,可能並不討巧,卻成為中國AI形成差異化優勢的關鍵巨助力。

將視角放在全球技術競賽的大背景下,會發現中國AI依然需要在基礎研發上加速追趕。

北京智源人工智慧研究院釋出的《人工智慧下一個十年》中就提到,在AI全領域,2009-2020年期間全AI領域被45個頂會和頂刊錄取論文資料顯示,中國學者量和論文量都約為美國的1/3,十年間美國AI論文量超出中國4萬多篇。

想要拿下全球頂尖的技術桂冠,最根本的是要提高自身的創新能力。從這個角度看,像深蘭科技這樣不斷向基礎研究發起衝鋒的科技企業,正在建構起中國AI未來十年的競爭“天頂”。

另一方面,如火如荼的新基建熱潮背後,要解決各行各業、不同場景下對演算法精度、效能的要求,在資訊化不足、資料缺失等傳統行業完成智慧化改造,更需要領先演算法來保駕護航,完成與產業端的深度整合。

如果說技術能力是舟,那麼對產業應用的重視與探索就是槳,幫助AI更平穩地駛向大海。

舟楫相配,得水而行——或許是深蘭科技帶給我們對未來最美好的想象。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31561483/viewspace-2718104/,如需轉載,請註明出處,否則將追究法律責任。

相關文章