人工智慧技術發展綜述

AIBigbull2050發表於2020-11-16

人工智慧作為電腦科學行業的頂尖技術之一,從1956年達特茅斯會議上正式提出開始就一直備受各行業關注。在圖靈測試中,對人工智慧的認定和評判是以人為唯一參照物的,基本的思維出發點仍然是仿生學。這裡隱含著一個推論,即人是AI無限趨近但又永遠達不到天花板。但實際上在AI問世後的幾十年裡似乎並沒有沿此路徑去演進。今天我們已經可以看到在某些細分領域AI的能力已完全超出人類的對應水平。

一、艱難探索:功能簡單、經驗寶貴

實際上2016年初甚至更早,在大量行業存在潛在需求並且擁有巨大空白市場的情況下,智慧作為前沿命題已經出現在很多大大小小的安防公司的ppt甚至是具體產品上。但是受限於當時的顯示晶片算力、採集終端技術、後端演算法技術以及整體方案成熟度,這個時間段推廣的演算法大多屬於早期開荒用途,絕大多數演算法落地到實際部署時效果差強人意。這個時期演算法大多以物體/人體模型檢測為主,基本功能都是最簡單的周界入侵、拌線告警、逆行檢測等事件類檢測,業務功能和實現機制相對簡單。

現在看來,那個時期的演算法、業務功能以及配套方案大多不好用,甚至相對比較落後。但那個時期在智慧演算法落地上的探索對之後深度學習演算法在安防行業的蓬勃發展提供了大量的工程化經驗,無論是各類演算法分析嚴格的場景限制、演算法部署時工勘的多樣化技巧和注意事項都是前期演算法探索者遺留的寶貴經驗。

二、時代浪潮:安防是AI最好的栽培土

2016年註定是人工智慧行業不平凡的一年。這一年,作為GPU行業的絕對領導者英偉達釋出了基於人工智慧深度最佳化的全新Pascal架構,並在GTC2016上正式釋出了基於完整P100大核心的Tesla系列顯示卡、TeslaP40及TeslaP4,並在同年釋出了針對深度學習神經網路設計的嵌入式晶片 NVIDIA Jetson TX1。無論是作為伺服器級GPU卡的P4/P40,還是作為嵌入晶片元老的TX1,這兩類GPU推出後,在人工智慧高速發展的幾年內長期提供著海量的算力支撐,即使在今年依然能在很多專案中見到其身影。

2016年初,Google開源了TensorFlow原始碼,使得深度學習的訓練系統第一次暴露在公眾視野中,並隨之引爆了整個人工智慧演算法行業。僅僅在釋出的第一年裡,TensorFlow就幫助超過百萬的研究人員、工程師、藝術家、學生以及其他行業人員取得了巨大研究進展。基於TensorFlow及包含加州伯克利分校的caffe以及微軟的CNTK網路等框架,大量人工智慧演算法如雨後春筍般湧現,也點燃了新一輪人工智慧的探索高潮。人臉識別、行為分析、影像結構化分析、OCR識別等複雜的影像資訊處理及提取技術和演算法得到了質的提升,從原來的探索前行逐漸演變成成熟可靠的方案,並且透過大量的實際應用部署獲取到大量樣本訓練,反向為演算法本身的演進提供了海量的資料支撐。

人工智慧任何演算法想要變成成熟方案並且能廣泛推廣都離不開海量資料的訓練以及實戰獲取的經驗。當其他行業正苦於沒有足夠的資源來進行更進一步提升時,同樣還是2016年,這一年國家正式釋出“十三五”建設規劃,要求在“十三五”期間基本完成影片影像基礎設施及應用系統建設,全面構建影片影像資源綜合應用體系,整合各類影片影像資源並進行智慧化解析處理,安全有效利用社會影片資源,實現影片影像匯聚、共享、解析與應用,使安全與運維能力大幅提升,為公安機關各部門、警種、政府其他部門及社會提供影片影像資訊綜合服務。同時,在影片影像資訊解析系統中也明確提出了海量的解析需求,包括影片內容(實時流+錄影流)進行結構化分析、資訊提取,以及對影片影像資訊按預定策略比對、碰撞、深層次、大區域、多維資料探勘和研判。

由於“十三五”規劃對影片影像分析演算法有著明確要求,所以在“十三五”建設期間湧現了無數演算法建設的需求。針對各級使用者的需求,包括基於人工智慧的人臉、影片結構化、ReID等深度學習演算法和相關應用落地“試驗田”進行實地部署和演練,透過大量的合作聯合實戰實驗室等方式獲取夯實的資源支撐。隨著“十三五”建設的深入,除傳統安防企業外,越來越多的網際網路公司也加入人工智慧的前進浪潮中,人工智慧也因此得到了爆發式的增長。

歸功於海量算力帶來的底層夯實支撐,各種開源架構以及探索者們提供的技術基礎以及國家“十三五”等政策的利好,在如今時代,安防行業無疑是人工智慧最好的“栽培土”。在這期間孕育出無數的演算法公司,只要你能想得到,任何智慧分析需求都會有人來響應。而同樣在演算法應用上,依賴人臉識別演算法實現的“刷臉”登入、“刷臉”開門甚至情緒、疲倦識別等一系列應用在整個安防行業內不斷衍生。使用者願意花錢,廠家願意投入研究,這是人工智慧最好的時代。

三、困境:人工智慧重新定義安防

好的AI=算力+演算法/樣本,這是大家對人工智慧的傳統認知。對於AI本身來說,海量算力配合充足的正負樣本,加上大量訓練和調優後的演算法就基本可以交出一個滿意的答卷。在第一輪人工智慧的建設浪潮中,大家都在追求更高的指標、更多的標籤以及更高的效能,為了極致的指標投入大量人力物力。而隨著專案逐漸開始落地,當演算法投入實戰,當整個安防行業正式向前邁進時,人們也逐漸發現一個無法繞過的問題:人工智慧到底是單純的部件化產品還是一個系統性的方案?在回答這個問題之前,我們先回過頭看一下深度學習演算法本身,從“聰明”程度來區分的話,人工智慧可以簡單的分為弱人工智慧、強人工智慧以及超人工智慧。

弱人工智慧是指能以智慧的方式高效完成特定領域內的工作,不具備真正的思考能力,如人臉識別、AlphaGo。當行業里人工智慧熱度逐漸冷卻,大家也認識到當前的人工智慧實際還是在弱人工智慧等級上。人工智慧演算法可以在滿足要求的影像上做到很高的精度,而一旦圖片質量無法滿足要求,指標就會急劇下降。安防行業的影像資料無論是圖片還是影片流基本都是由前端攝像機提供,因此人臉識別對傳統前端整個體系都提出了挑戰。

而人臉識別想要順利落地併為使用者提供最優解決方案,所面對的挑戰不止這些。人工智慧落地需要端到端系統中每一類元件的重新適配,人工智慧重新定義了安防,對每個節點上的裝置都提出了新的挑戰。回到前面的問題,人工智慧應該是一個單純的部件化產品還是一個系統性的方案?答案顯而易見,在安防行業,拋開落地談產品都是空中樓閣。人工智慧演算法是一個對前端、儲存、大資料以及演算法算力排程乃至協議標準都有著嚴格配套要求的系統方案,而安防行業的實施配套要求,如機房、電費、人工等一系列產品之外的成本也無疑對人工智慧的整套方案TCO提出了更高的要求。

四、捲土重來:注重落地與應用

現如今,人工智慧依然是行業內最火熱的話題。但是使用者已經不像初遇人工智慧時那麼迷信演算法,很多時候使用者更願意讓演算法驗證一下可行性,或者乾脆與演算法廠家以合作實驗的形式來確定演算法是否可用。而各個廠家以及演算法公司也在專案實踐中發現了單純靠人工智慧、深度學習、大資料這些實際是不夠的,例如宇視提出“場景定義演算法”“AI工程化”等更加註重演算法落地和實際應用的理念。與此同時,透過新一輪演算法的不斷PK以及“十三五”建設的格局洗牌,有實力、有經驗的廠家也逐漸改變了自己的探索方向,不斷投入到演算法的落地、智慧分析整體方案的拉通以及使用者應用的完整閉環和流程簡化中。

人工智慧演算法作為最核心的技術,依然需要不斷投入和探索,這是永恆不變的真理。另一方面,各個演算法廠家已經不再把演算法指標作為最重要的競爭力,而是把多演算法解決方案、應用生態配套作為最關鍵的亮點。原本單一演算法可能無法實現的業務,現在透過不同演算法協同檢索比對可以很輕鬆實現,這種組合應用的整體方案已然成為新的建設熱點。

五、未來:探索無止境

未來,一方面隨著演算法和業務的高度融合,勢必會在各個行業形成行業屬性凸出的專用業務及解決方案,人臉識別的建設和發展重點也會逐漸有針對性地對各個行業業務場景進行調整;另一方面隨著演算法的不斷推陳出新和同質化及GA/T1400標準(中華人民共和國公共安全行業標準)的不斷最佳化,演算法正在向著標準化元件演進。就像當年IP相機經歷過的一樣,人臉在內的各種深度學習演算法都終將成為標準的交付件,而管理演算法的多演算法服務框架平臺勢必會成為下一波平臺建設的新高潮。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69946223/viewspace-2734389/,如需轉載,請註明出處,否則將追究法律責任。

相關文章