線上公開課 | 如何基於模型訓練平臺快速打造AI能力?

京東科技開發者發表於2020-03-05

線上公開課 | 如何基於模型訓練平臺快速打造AI能力?

課程概要
近年來,隨著大資料的積累、理論演算法的革新、計算能力的提升,人工智慧人工智慧再次受到學術界和產業界的廣泛關注,並在很多應用領域取得了突破性進展。不過,定製模型往往需要 AI 演算法科學家們搭建深度學習模型,不斷地進行訓練和測試才能得到。在實際工作中,業務方往往還要根據場景和資料的變化,持續進行模型改進工作。這時候,低成本快速定製併發布 AI 能力至關重要。那麼京東在 AI 方向有哪些探索?AI 開發全流程是怎樣的?如何加速模型開發?本文將解答這些問題。
點選【
閱讀 】可檢視課程影片!

基於模型訓練平臺快速打造AI能力

— 京東智聯雲 朱二濤 —

AI能力開發全流程

目前,人工智慧領域尚未形成完善的參考框架。但人工智慧標準化白皮書(2018 版)基於人工智慧的發展狀況和應用特徵,從人工智慧資訊流動的角度出發,提出了一種人工智慧參考框架,這個框架描述了整個 AI 能力的產生。

線上公開課 | 如何基於模型訓練平臺快速打造AI能力?

在人工智慧整個體系中有三大要素:資料、算力和演算法。

基礎設施提供者(算力)

基礎設施提供者為人工智慧系統提供計算能力支援,實現服務與外部世界的溝通,並透過基礎平臺實現支撐。AI 上的計算能力通常由智慧晶片提供;與外部世界的溝通則透過新型感測器實現,比如攝像頭、麥克風以及各種物聯網裝置,它們負責蒐集終端資料供業務使用;基礎平臺包括分散式計算框架提供商及網路提供商提供平臺保障和支援,即包括雲端儲存和計算、互聯互通網路等。比如京東智聯云為大家的技術平臺,其中包括算力支援,雲主線上儲存、微服務等,同時也可以基於整個產品體系打造一個整體服務平臺。

資訊提供者(資料)

資訊提供者在人工智慧領域是智慧資訊的來源。透過知識資訊感知過程由資料提供商提供智慧感知資訊,包括原始資料資源和資料集。原始資料資源的感知涉及到圖形、影像、語音、文字的識別,還涉及到傳統裝置的物聯網資料,包括已有系統的業務資料以及力、位移、液位、溫度、溼度等感知資料。

資訊處理者(演算法)

大多數人對人工智慧的理解可能更偏向於演算法這部分,比如對資料的清洗、提取特徵值等,這相當於一個資料建模的過程,在此基礎上進行一些模型訓練。然後再針對業務場景提供智慧推理、智慧決策等支援。智慧推理和智慧決策最終會輸出有價值的智慧資訊,這就到了“智慧執行與輸出”環節,輸出整個智慧資訊流動過程的結果,包括運動、顯示、發聲、互動、合成等功能,這也是整個 AI 的能力產生的結果。

01 三種主要的人工智慧晶片

線上公開課 | 如何基於模型訓練平臺快速打造AI能力?

人工智慧晶片按照不同用途可以被分為三類:模型訓練、雲端推斷、裝置端推斷。第一類晶片主要用在訓練環節的晶片,處理海量訓練資料和複雜的深度神經網路,如 GPU/TPU 提供強大的平行計算和浮點計算能力。當我們將模型訓練出來後,可以將其釋出為雲端服務提供給使用者使用。

用於雲端推斷的晶片也是我們所說的第二種型別的晶片。目前主流的人工智慧應用需要透過雲端提供服務,將採集到的資料傳輸送到雲端伺服器,用伺服器的 CPU/GPU/TPU 去處理推斷任務,然後將資料返回終端。

第三類晶片執行在裝置端,包括智慧手機、智慧安防攝像頭、機器人、自動駕駛、VR 等,它能夠快速做一些推斷和決策,並且不受網路的影響。怎麼去理解?假設現在有一個攝像頭,如果我們要把這個攝像頭採集到的所有資料都傳送到服務端進行處理,那麼可以想象需要多少點網路頻寬才可以滿足。但是如果我們把一些資料處理的任務放到終端完成,而僅把處理結果上傳,這樣對網路的要求就會低很多,並且使用者的體驗也能明顯提升。

02 如何衡量資料的質量?

資料是我們成功的起點,在人工智慧領域,資料主要有兩類:結構化資料和非結構化資料。結構化資料是高度組織和整齊格式化的資料,它是可以放入表格和電子表格中的資料型別,能夠用 SQL 來查詢,並且適用於機器學習,資料分析挖掘等。

非結構化資料不能用表格型表示,它沒有一個統一的格式。這種資料通常儲存在非關聯式資料庫中,並使用 NoSQL 進行查詢,適合用於深度學習去處理。在網際網路發展起來之後,非結構化資料的量已經越來越大了,現在企業資料中 80% 都是非結構化的資料。

對於企業而言,獲取資料的方式通常有三種:

  • 從行業資料供應商購買
  • 自行積累或採集,包括行業積累、爬蟲等
  • 從合作伙伴處獲取行業資料

資料越準確,與自身的業務越匹配,那麼用這些資料訓練模型進行業務推斷的結果就越接近於真實場景,因此為企業自身帶來的價值會更大。如何評判資料的質量?有四個緯度:

  • 關聯度(Relevancy):首要標準
  • 時效性(Recency)
  • 範圍(Range):範圍影響效果
  • 可信性(Reliability):專業人員標註

簡單來講,資料與自己的業務關聯度越高越好,這是首要標準。另外還要關心資料的時效性,以及使用者的需求。對於可信性,不同的業務場景有對應的專業人員,讓他們去制定行業標準,進行資料標註,可以在很大程度上保證業務資料的質量。

03 機器學習的流程拆解

在整個 AI 能力的鍛造過程中,演算法研究是其中一步,也是重要一步。機器學習是傳統人工智慧裡的一個新的分類,主要研究如何模擬和實現人類的學習習慣。簡單來講,機器學習透過各種演算法訓練模型,並用這些模型對新問題進行識別與預測。

線上公開課 | 如何基於模型訓練平臺快速打造AI能力?

機器學習的流程主要分為以下幾個步驟:

訓練資料收集

原始資料是機器學習過程的第一步,它從各個渠道被採集而來。資料集通常會分成兩個部分:一部分用來做訓練,即訓練集;另一部分用來做驗證,也就是測試集。

資料預處理

由於收集到的資料往往比較粗糙或者噪音較多,需要將這些資料進行預處理,包括業務敏感資料脫敏,對不合格的資料做一些清洗、格式轉換,或是特徵提取等處理,得到有效的訓練資料。

訓練預測模型

到了訓練預測模型階段,演算法工程師就可以出面了。在正式開始模型訓練之前,我們需要結合資料和業務的特點選擇合適的演算法。機器學習可以實現的目標被分為:分類、迴歸、聚類、異常檢測等。前期演算法工程師需要透過測試集和訓練集,在集中可能的演算法中做一些 Demo 測試,再根據測試的結果選擇具體的演算法,這樣可以規避大範圍的訓練模型改動帶來的損失。

模型評估

選擇出一個模型後我們需要去驗證以下這個模型是不是合格。如何評估呢? 這就要用到之前說的測試集對模型進行測試。由於測試集對模型來說是完全新的資料,因此可以客觀地度量模型在現實世界中的表現情況。這個過程其實是一個迴圈迭代的過程,我們會在這個過程中對演算法進行改造或者對引數進行調整,最後得到一個比較理想的模型。我們通常會將這個模型做成一個服務供人們去使用。

以京東智聯云為例,京東智聯雲將訓練好的模型提供成下圖中這樣的線上服務 API。它分成幾個方向,每個方向都有對應的通用 AI 能力,讓大家去應用。比如在零售領域,會將一些京東領先的演算法模型封裝成通用的 API 提供給使用者。每一個 API 都會提供一些呼叫方法的介面,使用者可以線上申請使用。當然了,我們也提供離線版本或者 SDK,方便和使用者的業務進行深度結合。

線上公開課 | 如何基於模型訓練平臺快速打造AI能力?

AI能力開發全流程

京東智聯雲人工智慧部平臺推出了一款叫 NeuFoundry 的產品。作為京東豐富場景的最佳實踐,NeuFoundry 提供從資料標註 - 模型開發 - 模型訓練 - 模型評估 - 模型釋出的一站式人工智慧開發平臺,提升 AI 開發的效率、降低開發成本。該平臺不僅支援影像類、文字類深度學習,還支援機器學習,比如銷量預測等,此外,它還會透過預設模型來進行海量資料訓練,讓智慧供應鏈更加智慧聰明。

NeuFoundry 提供的主要服務包括:

資料管理

以資料庫及物件儲存等方式,提供海量儲存空間,儲存和管理使用者資料,並提供資料標註、資料分析等功能服務;

AI 能力定製化

可根據實際業務所需要的能力和場景,結合企業實際業務資料,訓練定製化 AI 能力;

AI 服務支撐

智慧中臺為各類 AI 能力的執行,提供基礎環境支撐,保障 AI 服務穩定、可靠提供業務服務。

線上公開課 | 如何基於模型訓練平臺快速打造AI能力?

在 NeuFoundry 的功能框架圖中,模型開發區域牽涉到基礎支撐層和模型開發層,往上是京東智聯雲提供的一些優秀的預置服務,再往上是 NeuFoundry 支援的應用場景。

在 NeuFoundry 的資料管理服務中,該平臺可以提供資料集管理和標註服務,同時內建公開資料集和定製行業資料集;此外,還提供工具支援使用者線上標註或者匯入已有標註資料,包括常見的文字、圖片、影片、音訊等。

在 NeuFoundry 提供的模型訓練任務中,平臺支援 TensorFlow、Caffe、PyTorch 等常見的引擎框架及多種專案執行方式,並且為不同型別的開發者提供多種互動方式。如針對對演算法比較精通的演算法工程師提供任務提交和 Jupyter NoteBook 方式;對於業務開發人員,提供透過圖形化拖拽或者自動化訓練方式,方便快速的定製化 AI 模型,不需要掌握演算法開發能力。

為什麼說 NeuFoundry 可以幫助企業加速 AI 能力鍛造?因為在 NeuFoundry 中,針對常見的業務場景,我們預置了一些行業領先的演算法模型在裡面。使用者只要把自己的業務資料放上來,透過自動化的訓練方式,就可以用這些演算法來快速迭代屬於自己的定製模型。通常,使用者在 NeuFoundry 上只需兩步就可以建立自己的 API 能力:

(1)選擇場景和資料,提交任務;

(2)檢視模型評估結果,釋出成服務。

線上公開課 | 如何基於模型訓練平臺快速打造AI能力? 建立 API

AI 能力打造其實只是“智慧平臺”的一個環節,整個京東智聯雲會針對金融領域及具體的應用場景,在此基礎上從業務、技術、資料等角度出發為企業提供不同領域的解決方案。

在金融 AI 場景架構圖中,基於底層的執行資源和資料資源之上,不同應用場景的開發層基本上是一致的。往上看,是包括客流分析、內容稽核、使用者行為解析、智慧決策、使用者畫像、風險控制在內的一系列預置服務,這些服務會根據金融場景進行專門的最佳化和定製。

線上公開課 | 如何基於模型訓練平臺快速打造AI能力?

最後,朱二濤基於為大家演示瞭如何在 NeuFoundry 上使用自動化訓練建立口罩識別服務。他表示,演示中的口罩識別只是基於圖象分類的能力進行訓練模型的,在 NeuFoundry 這個智慧化平臺上,還會基於人臉識別,提供更加專業的 AI 能力。

透過學習本篇課程,我們瞭解了 AI 能力是如何開發的,及京東智聯雲在這方面的探索與能力 NeuFoundry——一站式 AI 能力鑄造廠是基於京東零售及零售基礎設施、豐富的場景和海量資料打磨的人工智慧開發平臺最佳實踐,積累了成熟的一站式模型開發工具和優質的資料集,並沉澱為成熟模型與 AI 服務。NeuFoundry 可為大中小企業提供一站式開發平臺,助力企業快速低成本構建自己的智慧中臺,完成智慧化轉型。

點選【 閱讀 】可檢視課程影片!

Q&A 課程問答

NeuFoundry 不同框架,模型訓練出來後如何部署,支援什麼部署?

NeuFoundry 提供 JupyterNotebook 環境,使用者可以在 Juypter 環境中,完成訓練和部署驗證的環節。如果是透過 NeuFoundry 提供的自動化任務訓練出來的模型,NeuFoundry 可以幫助使用者把模型釋出成一個線上服務。

針對這次的疫情,衍生出口罩糾正模型,大面積遮擋的人臉識別,客服防控疫情諮詢客服等等,我想知道這些資料獲取和模型的準確度如何把控?

這個我給大家解釋一下。在 AI 模型訓練中,訓練資料和業務越相關,訓練的準確性或者效果會越好。如果您的業務場景是一些公共場所,或者是光線或者攝像頭效果不好,當然也包括會有遮擋人臉等情況。那我們就應該針對這種場景去做針對性的資料採集,找到典型的資料。然後針對這個資料,我們再去做一些最佳化和訓練。那麼這個模型,針對您這個場景,效果相對會更好一些。其實沒有一種模型是適用於所有場景的,都會有一些各自的適用範圍。

樣本比較少,怎麼訓練,效果才能好?

這個是很多企業想去做 AI 建設的時候,碰到一個比較典型的問題,就是說自己的業務資料可能不是太好去抽取或者提煉。這個剛剛我也提到了,如果您在這個行業積累不夠的話,您可以去做一些行業的採購。資料量級的要求呢,以影像分類為例,大概這個量級在幾百張到一千張的時候,他的準確性在一定程度上就能滿足業務需求了,再增加資料提升效果就沒那麼有效。如果說您的業務場景跟京東智聯雲這一塊的能力比較貼合的話,那我們這塊也可以幫您去做一些資料準備,或者說行業場景的支援。

線上公開課 | 如何基於模型訓練平臺快速打造AI能力?


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69912185/viewspace-2678634/,如需轉載,請註明出處,否則將追究法律責任。

相關文章