AI如何落地企業?UCloud三步走戰略:Build,Train,Deploy

AI科技大本營發表於2018-04-09

【AI科技大本營導讀】AI 在經歷了一波浪潮之後,走到了最重要的一個環節:落地。傳統企業如何搭上 AI 的順風車,助力企業升級呢?UCloud 實驗室研發總監葉理燈認為人工智慧落地主要分為三個步驟:一個是 Build搭建,一個是 Train訓練,一個是 Deploy部署。

AI火爆原因

2017年人工智慧非常火,到底原因是什麼呢?UCloud 實驗室研發總監葉理燈在一次小型媒體見面會上發表了自己的看法。

第一,AI火爆有一定的前奏,首先是技術上的進步,深度神經網路的提出和計算能力發展帶來AI的爆發。

第二,開源框架降低了學習和應用的門檻,例如 TensorFlow 等。

第三,媒體的宣傳。2016 年AlphaGO 帶來一些平民化的認知,這是人工智慧的第三波浪潮。第一波,第二波是 20 世紀 50 年代,70 年代,一波一波地持續推進AI科技發展的程式。

為什麼這次AI的話題爆發會這麼持久?或者說它的應用離普通百姓比較近呢?葉理燈認為,這一波主要基於深度學習,深度神經網路的發展。

第一,演算法的發展。

第二,計算能力提高。雲端計算,以及晶片硬體的發展,給計算能力提供很好的支援,因此落地比較容易。

第三,資源支援。很多大廠,像谷歌會提出一些開發的框架,比如說 TensorFlow,將人工智慧機器學習的門檻降低,使得本次浪潮中在AI實用性上做得比較好。

第四,計算機視覺的成熟。人臉識別,包括 iPhone Face ID等人工智慧技術在影像識別上最成熟的應用。

在葉理燈看來,人工智慧的發展主要依賴於三個要素:資料;演算法;計算能力。

首先是資料。有一個說法叫有多少個人工就有多少個智慧。在一波機器學習的浪潮中,從機器學習分類可分為監督學習和非監督學習,90% 有實用意義的機器學習都是監督學習,監督學習意味著訓練模型,事先給資料打標籤,打標籤是一個體力活,資料量越大,資料出來的精度就越高,所以為什麼說有多少人工就有多少智慧。舉個例子來說,鑑黃,假設你要做一個鑑黃模型,鑑別這張圖片是黃色的還是性感的還是普通的,需要找很多圖,並且一張一張進行人工的標記。

接下來是演算法和大量的計算能力。有一個理論叫“火箭理論”,如果把人工智慧當火箭的話,那麼資料是火箭的原料,計算能力就是引擎,演算法就是引擎的控制器。

AI與雲端計算的關係

為什麼說雲端計算跟人工智慧的落地有很大的關係?

首先,隨著雲端計算的發展,很多網際網路企業的創業基本上都是在雲端計算上,因此越來越多的資料是在雲端計算上產生的,資料的生產和消費都在雲端計算上。因此,在雲端計算上做機器學習的訓練和 Inference 是非常自然的一件事情。

另外一點,在觀察了很多家 AI 公司之後,葉理燈稱明確感覺到 AI 分為兩波浪潮:上下半場。上半場是很多初創型企業借人工智慧浪潮去創業。下半場從去年下半年開始,很多傳統行業覺得人工智慧對提高生產效率有很大的幫助,他們開始建專門的團隊,或者引進有AI能力的公司來幫他們去提高生產效率。舉個例子:傳統的紡織行業,以前去判斷布是否合格,是人工去看的,現在會有專門的演算法公司給他們做演算法,通過計算機視覺,通過圖片去判斷布織的是否合格,這明顯就提高了效率,降低了人力成本。

同時人工智慧跟目前的區塊鏈有點類似,它只是一門技術,它不是一個行業,也就是說這個東西要落地的話,一定要跟行業結合起來,滲透到行業裡面去,這才是人工智慧的價值所在。

例如,金融領域的演算法做的是 Case by Case,這個領域的公司多數不會選擇做一個通用的 AI ,因為他們覺得當前這個階段做通用的AI價值不大,一是每個行業面臨的問題是不一樣的,沒有一套通用的解決方案,第二,他們覺得人工智慧一定要從炒概念這一點跳出來,結合行業具體的問題去通過 AI 的演算法去解決。

AI落地三步驟

人工智慧落地有三個步驟,一個是 Build搭建,一個是 Train訓練,一個是 Deploy部署。

Build,是指根據目前遇到的問題去找對應的演算法或者定義對應的演算法,將演算法用到自己的資料中列一個模型出來,這個模型要變成線上服務才能產生價值。比如剛才提到的鑑黃模型,總得放線上上,拿一張新的圖片的時候,它變成一個服務,才能去鑑定這個圖片到底是色情的還是普通的。

AI落地除了以上三個步驟外,還有很重要的一點,就是AI的系統。企業要把AI落地,其實是要搭建一套AI的系統。每個行業的IT水平參差不齊,有些公司可能去買一些硬體和計算機自己搭一套。對於沒有能力自己搭建AI系統的公司,雲端計算是一個很好的輔助手段。雲端計算在這方面已經很成熟了,包括基礎設施的建設,包括軟體架構的建設,可以幫企業去落地。

葉理燈介紹 UCloud 是一箇中立的平臺,企業宗旨是上不碰應用,下不碰資料。UCloud 專門提供一些易用的 AI 平臺,把上述提到的 AI 落地三步驟的後兩個步驟包含進來,包括 AI 訓練,模型推理。

在合作伙伴合作方面,UCloud與英特爾進行了深度的合作。UCloud採用英特爾至強系列處理器,利用英特爾提供的CPU能力、虛擬化能力、Caffe、針對AVX指令集的優化和針對機器學習的庫等等。同時,UCloud和英特爾已經聯手提供了很多定製化方案,讓使用者能夠享受到強大效能的產品和高效率服務。

除此之外,UCloud還會去引入 AI 演算法公司。目前 UCloud 平臺上有8萬多家企業,這些企業可能需要 AI 的能力,他們自己沒有能力建設的時候,會有專門的 AI 公司提供相應的 AI 能力。這些AI能力中包括OCR 識別(Optical Character Recognition,光學字元識別),比如目前一些快遞公司會拍一張快遞單,直接把地址抽出來就是 OCR 。

在“ AI 訓練”和 “AI 線上推理”上,葉理燈舉例稱,例如網際網路金融P2P行業,為了加快客戶的放貸速度,客戶會在網站上提供個人資料,包括身份證、以前的信貸記錄,此前靠人工去判斷。現在UCloud會做一個演算法,去識別圖片裡的文字,再做語義識別,判斷這個人的信用到底怎麼樣。一些擁有自己的演算法和模型的AI 公司,可以方便地把AI 模型搬到 UAI-Inference 這個產品上,這樣相當於把這個模型變成一個線上服務, UCloud 對外提供介面,系統直接把UCloud的介面遷入他們的系統裡面去,加快P2P行業公司的放貸速度。

UCloud服務某“線上論壇”公司。UCloud的AI線上服務給他們做什麼呢?UCloud訓練模型,這個模型用來識別這個論壇上的使用者頭像,甄別這個頭像到底是不是一個人,如果沒有頭像會提醒他做什麼,有頭像的話會識別頭像裡面的內容,然後給他們推薦相關內容和服務。

葉理燈還在媒體見面會上介紹 UCloud 優勢:海量的計算資源,基於英特爾處理器搭建。英特爾產品成本很低,效能很高,同時英特爾也做了很多軟體優化工作,包括基於機器學習的特點框架,利用英特爾 Caffe,專門用於計算機視覺的框架,根據他們的指令集做了優化。

舉個例子,在識別圖片裡面文字的時候,如果用未經框架優化的普通的CPU來識別,時間應該是幾十秒,但是經過英特爾Caffe框架優化完成之後,變成一秒鐘,這個提升是非常大的。

相關文章