依圖科技 CEO 朱瓏:我們是如何做智慧城市的?

dicksonjyl560101發表於2019-08-10


依圖科技 CEO 朱瓏:我們是如何做智慧城市的?

新舊血液不斷融合,舊規則被打破,新邊界因此擴寬。

作為最早一批闖入泛安防戰場的 AI 公司,依圖歷經七年磨礪,先後參與全國近 300 個地市的公共安全建設,終於在前排段位中獲得一席之地。

依圖同時有著傳統安防公司低調收斂的一面,在這個封閉而殘酷的市場,少說多做永遠是第一準則,所以我們很少看到依圖對外談起安防業務。在今天的廈門人工智慧峰會,朱瓏首次系統性地對外解構了當下依圖佈局智慧城市的核心思路,同時透露了將在廈門市推進智慧城市業務的計劃,值得琢磨。

1、從影片和攝像頭的角度來看,智慧城市的管理分為五個等級,從最簡單的代替人記錄、可追溯,到可檢索,可關聯,再到可預判、代替人的決策,最後可規劃、代替人統籌。

2、智慧技術要往下躍遷,最重要的就是提升基礎設施,而智慧技術的基礎設施就是資料、演算法、儲存、算力和傳輸。

3、城市智慧的提升以基礎設施的提升為驅動,比如增加感知的密度,增加演算法的識別能力……逐步累積就能在整個城市規模上實現智慧等級的躍遷。

4、智慧密度的提升分為宏觀和微觀兩個角度。宏觀上,單體智慧要變成群體智慧,識別的內容要匯聚在一起才能形成新的大的智慧體。微觀上,要普及成從一個算力到 1 萬個,甚至 10 萬個,算力要急劇提升,才能有經濟性,高價效比的基礎才能夠普及開來。

以下為朱瓏演講內容,經機器之心編輯。

我先簡單介紹一下我的背景,從中能看出美國研究人工智慧的不同學派。我在美國待了十年,我的三位導師,一個是學理論物理出身的 Alan Yuille,他也是霍金的學生。第二個是我在麻省理工大學人工智慧實驗室讀博士後的老闆 Bill Freeman,他也是在今年 4 月人類首次拍攝到黑洞照片研究小組的領導者。

第三位大家可能比較熟悉了,紐約大學教授 Yann LeCun,他是推動這一輪人工智慧浪潮興起的技術——深度神經網路的其中一位奠基人,他也因此獲得了 2018 年的圖靈獎。由此可見,在美國從物理到深度神經網路再到腦科學,不同領域的頂級專家都在研究人工智慧,他們推動了過去幾十年人工智慧的發展,讓 AI 有了今天這個基礎。

那麼,人工智慧現在處於一個怎樣的狀態?

剛才高文院士有講到人類智慧的演化用了大約 630 萬年。我總結了人類文明的變遷:600 萬年前,人類從直立行走到形成了最原始的社會形態用了,再到 1 萬年前的農業革命,工業革命我們花了 200 年,而人工智慧從一九五幾年開始到現在,也就 60 多年的時間,人類的文明史或者是地球的文明史大致就是這麼一個歷史。

依圖科技 CEO 朱瓏:我們是如何做智慧城市的?

從眼睛看到這個世界的感知智慧到語言也即認知智慧的誕生,到今天很可能出現一個新的物種,那就是機器,它慢慢地具備了人類的智慧。這裡有兩條曲線,黑色的表示從生物自然界產生的人類的智慧曲線,另一條金色代表機器的智慧曲線。 當機器的智慧曲線與人類的智慧曲線交叉甚至超過的時候,文明的形態會是什麼?這非常值得我們遐想和憧憬或者是思考。

我今天給出最重要的一個觀點就是, 文明的變遷靠的是科技的推動,科技推動就是基礎設施的革命。 這裡我列了一些不同文明時代的基礎設施,從剛才談到的發明火到使用文字,農業文明時期有了輪子、道路;工業文明出現了蒸汽機、內燃機,有了鐵路;資訊文明,也就是我們過去 30 年的網際網路時代,出現了計算機、PC、網際網路、手機,人類克服了時空的障礙。這幾個最重要的基礎設施的變革,導致了文明的變遷。

我們現在處於什麼時代?我們這個時代的基礎設施又是什麼呢?過去 30 年,CPU 運算能力提升了 100 萬倍,儲存能力也提升了 100 萬倍,通訊能力也即資料的傳輸速度提升了 100 萬倍。 我們現在是站在過去 30 年的基礎上來看接下來發展的基礎。

智慧時代只談開始的時間可能定義得不清楚,這裡只談 2019 年回溯回去的過去五年,我們發生了什麼、五年前是什麼。

AlphaGo 在 2015 年的時候戰勝人類棋手的那一天,也是機器以計算機視覺為代表超過人類的那一天,大家可能記憶猶新。人工智慧現在已經非常火了,但就是這火的過去五年,機器又發生了什麼呢?

依圖科技 CEO 朱瓏:我們是如何做智慧城市的?

機器的演算法水平又提升了 100 萬倍,什麼意思呢?就是人臉識別為代表的錯誤率又下降了 100 萬,它可以從 1 萬人當中識別、1000 萬人當中識別、 1 億人當中識別出你,10 億人當中識別你,甚至 20 億人當中識別你,這是已經看似超過人類的那個時刻之後,它又提升了 100 萬倍,算力提升了 10 萬倍。

從過去我們用 1 萬量級規模的資料做訓練,到百萬規模的資料做訓練,到現在用 10 億的資料集做訓練,又提升了 1 萬倍,速度是非常快的。

基礎設施現在處於一個什麼水平?當前發展了這麼多,AI 處於什麼樣的一個水平呢?

我這裡用比較通俗的語言講:人不需要思考、本能地一眼瞄過去,能看見的、能說清楚的、能看懂的,這也是機器可以看到的;比如說這裡有人,有座位,這個是機器可以看清楚的。但這麼遠要識別清楚,可能有點難;比如這裡有多少個人?可能要數一數,誰跟誰近,可能要想一想,機器還不一定能做好。機器可以聽懂什麼?

能聽懂一句語音識別,但理解一句話、一個段落可能就變得困難,對一個文章的理解還比較困難。非常低階的智慧機器已經可以或者接近可以了。 我們覺得智慧要往下躍遷,最重要的就是提升基礎設施,我後面會講基礎設施是什麼。

我把機器智慧分成幾個階段:

第一個就是記錄功能,沒有任何的識別能力;第二級是可識別,比如說攝像頭能識別人臉;到第三級可關聯,不同的攝像頭之間識別出來資訊之間的關係是什麼?怎麼判斷?這是有關聯性;第四個是可預測、可預判;第五個是可規劃。大概分這個級別。

我們覺得智慧的提升是在基礎設施的提升上。我舉城市管理的一個例子,因為城市管理當中包括安防攝像頭的覆蓋,把剛才講的五級智慧做一個分類,從最簡單的代替人記錄、可追溯,到可檢索,可關聯,再到代替人的推理,代替人決策,最後到代替人統籌。

依圖科技 CEO 朱瓏:我們是如何做智慧城市的?

右邊這一列是說達到這些級別的提升,我們要怎麼做。攝像頭規模從稀疏分佈到 20 萬級別、人員覆蓋從重點人員進出到人群行蹤的跟蹤,從主幹到到網格化密度。這裡可以看到我們的感知需要增加密度,我們的演算法需要增加識別的能力,慢慢地就在整個城市規模上,有智慧等級的躍遷。

這是一個空間佈局的感覺,當密度達到一定程度的時候,就可以在空間上或者一個關鍵場所的圍欄上,形成自己的新的高階的智慧,比如看軌跡怎麼發生、事件怎麼建模。

我們提了一個概念:基礎設施提升的關鍵在於,提升一個區域或者一個城市的智慧密度。 分兩個維度來解釋,一個是宏觀上,單體智慧要變成群體智慧,一個攝像頭的智慧要變成 1 萬個攝像頭的智慧,他們之間識別出來的內容是能夠匯聚在一起,能夠形成一個新的、大的智慧體。

微觀上,要普及成從一個到 1 萬個,甚至 10 萬個,微觀上的算力要急劇提升,才能有經濟性,或者說價效比較高的基礎能夠普及開來。

這是我們今年 5 月份釋出的 AI 晶片,這是雲端的一個視覺晶片,一塊晶片能夠支撐 50 個攝像頭的算力,那一臺 1U 的伺服器可以支撐約兩百路攝像頭的算力,比同類的市面上最先進的英偉達的方案提高 5 到 10 倍的價效比。

一個是它的能耗降低了非常多,空間降低了非常多,降低多少呢?

一個機櫃能夠支撐一萬路攝像頭的全解析的功能,且機櫃中有空間的限制、電的限制、能源的限制、算力的限制,這是在一個城市在做城市的智慧等級的提升上面,有了非常重要的基礎設施的準備。由此,我們就可以開啟城市管理的豐富的場景。

依圖科技 CEO 朱瓏:我們是如何做智慧城市的?

這裡列了大概 18 個場景,包括機場、火車站等等,可以解鎖更多的應用。我們認為,今天從演算法的成就到演算法的提升,到我們整個城市或老百姓都能感知到,點亮 AI 就是要在基礎設施上做重大的提升。

除了剛才高院士提到的人才資本和政策以外,我們認為基礎設施就是資料、演算法、儲存、算力和傳輸,一定會在未來的幾年會進一步以三倍、十倍的速度再加大速度提升,這才是革命性的,這個會讓智慧文明更快速的到來。

這是我們的一個小小的願景,也是希望能夠在廈門以 10 萬路的視覺中樞為基礎,助力廈門成為全球智慧密度最高、智慧等級最高的城市。謝謝大家。




來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/29829936/viewspace-2653272/,如需轉載,請註明出處,否則將追究法律責任。

相關文章