微軟AI大師會參會小記

折騰範兒_味精發表於2019-02-17

微軟AI大師會系列|人工智慧商業落地之旅

週五參加了這個微軟的AI大師會,會議的主題主要是由幾位微軟在AI方面的重量級大師來介紹微軟目前在AI賦能商業落地方面的進展,主要圍繞著知識圖譜智慧問答使用者畫像幾個方向來介紹了一些微軟目前的商業落地的進展

WechatIMG63
WechatIMG63

WechatIMG65
WechatIMG65

會場並沒有留下ppt等資料,於是我就把我拍到的照片和做的筆記分享一下,說實話整個大會聽得我有點尷尬,所有吐槽都寫在最後面

第一場 微軟人工智慧賦能商業

第一場主要由張祺博士講一講現微軟人工智慧在toB這方面的整體佈局和已有的一些成果。

微軟AI三大生產線

  • 第一方AI產品
    • 必應搜尋
    • 微軟小娜(智慧助理)
    • 微軟小冰(聊天機器人)
  • 將AI融入微軟所有產品與服務
    • 微軟 Office系列產品
    • Azure 認知智慧服務
  • AI商業化產品線
    • 縱向行業方案
    • 橫向行業方案

搜尋引擎是最早的人工智慧產品,這個就不用說了,微軟藉助bing搜尋,積累了很多資料。微軟小娜,微軟小冰這個就是對話機器人,但這倆我的感覺更多的還是新鮮和玩具

比較牛逼的是第二大類,將AI融入微軟所有產品與服務!

微軟 Office系列產品 AI外掛

大會上主要講了word ppt在AI方面的最新成果,都是以office外掛的形式,目前已經開放上線,使用者可以直接去下載(然而我並沒有搜到Mac版,現場有演示WIN下的外掛)

Word的外掛就是比較常規的智慧翻譯,得益於微軟面向全球的office服務,微軟的翻譯支援60多種語言

比較牛逼的是PPT外掛,可以支援在PPT演講模式,實時聽演講者的講話,實時的進行字母展現+60多種語言的翻譯,這個相當的實用啊

Azure 認知智慧服務

Azure其實就是微軟的雲端計算平臺,提供各種雲服務,但是這裡的認知服務單指Azure國際官網提供的 AI和認知服務API

azureAI
azureAI

看著就像廠裡ai.baidu.com一樣,把大廠的一些成熟AI的功能開放成api服務,適當的收費/免費提供(Azure收費,廠裡的ai.baidu.com免費的)

順帶一提Azure國內也有個官網,但是國內的官網看不到這個AI和認知服務。

坦白說,身為開發者,我更關注這個Azure認知服務相關的會,因為他清楚地以API的形式介紹清楚了,如果三方廠家想接入,可以清楚的知道我能做什麼?多少錢?可以用API去評估準確性,可以用量級來評估成本。

資料化人工智慧轉型

這個題目,微軟對各大行業商業落地需要面臨的,資料化/人工智慧化轉型,做了一些分析

目前人工智慧在商業落地上走的比較快的幾個方向是

  • 客戶溝通
    • 智慧客服
    • 定製化體驗
    • 客戶分析

智慧客服這個話題,後面有案例單獨深入介紹

  • 賦能員工
    • 員工生產力
    • 商業分析
    • 知識圖譜

這塊主要講的是每個公司在員工培訓,以及員工高效工作上,可以藉助資料探勘/知識圖譜構建/輔助分析,等AI方案來提高生產力,這裡面知識圖譜後面有單獨一講,這個知識圖譜也是當下我最關注的

  • 優化運營
    • 智慧預測
      • 深度分析

基本上是說,從大資料分析預測的角度,來輔助運營手段,這裡面後續沒深入展開

  • 轉型升級產品
    • 產品創新
    • 差異化體驗
    • 新的使用者場景

所謂創新,都是掛在嘴邊,真正用AI創新出來的又有啥?反正本次分享會沒深入提,不過演講嘉賓倒是說,從人機互動的角度,視訊捕捉/聲音識別/AR 等方式是值得做創新和差異化的,但可惜,不在今天演講範圍內

坦白說微軟的AR Hololens 真的是堪稱AR界的霸主,無人能撼動的地位,有相關講座真的很想聽

智慧客服市場的一些前景

然後就開始介紹市場了,無非是眾多行業/眾多場景都需要智慧客服,而微軟擁有海量資料,來自Office Bing LinkdIn,微軟很有優勢

  • 行業 金融/健康/零售/電信/製造
  • 場景 銷售/導購/視訊/市場
  • 資料 Office Bing Linkedin

而中國有個最大最牛逼的優勢是中國的體量非常大

  • 中國移動的一個省一星期的客服資料,是美國梅西百貨一年的資料量
  • 客服這個事情,在中國有著3000億的人力成本規模

第二場 人工智慧商業落地

整場介紹了微軟為一個保險行業做的智慧客服這一個專案

客服市場所面臨的難點和問題

當前自動客服市場,基於以下幾個原因,導致的有很大的瓶頸和問題

  • 根本原因

    • 基於FAQ 問答
    • 人工錄入
    • 定製模板 窮舉問法
  • 問題和瓶頸

    • 大量人工工作
    • 維護成本高
    • 知識更新慢
    • 多渠道資訊不一致
    • 擴充套件性,敏捷性不夠

AI能賦予自動客服的

  • 懂知識,能推理
    • 建立結構化知識體系
    • 冬天產生答案
    • 推理回答複雜問題

構建結構化知識體系,其實就是所謂的專業領域知識圖譜

知識圖譜構建背後面臨很大的難題

微軟有個服務化知識圖譜團隊,但這種把知識圖譜對接如何落地,本次分享並沒有討論,不過後面倒是介紹了一些定製知識圖譜的難點

非結構化資料/半結構化資料/結構化資料-知識圖譜

WechatIMG68
WechatIMG68

  • 懂客戶,會溝通
    • 使用者意圖理解
    • 客戶深度理解
    • 多輪對話能力

這裡面有很多難點,其實都圍繞著自然語言處理NLP,簡單的說就是理解使用者意圖,多輪對話,深度理解等。其實對標廠裡的就是Unit多輪對話技術,也是眾多Bot服務都必須要解決的最難得問題

  • 懂產品,善推薦
    • 產品理解
    • 使用者理解
    • 個性化推薦

這裡面的難點在於,特定領域的客服需要理解特定領域,還需要結合使用者畫像、個性化推薦

  • 能進步,善學習
    • 大規模離線學習
    • 線上快速學習
    • 自我學習

這裡面其實技術專家充分講了這裡面面臨的問題

  • 大規模資料
  • 離不開人工的標註
  • 人工的監督
    這背後面臨的各種成本,但其實並沒有量化,也沒有舉例在這個保險客服的實際案例中,人工訓練AI成本到底有多少

WechatIMG67
WechatIMG67

這是一個整個保險客服案例的技術難點回放,其實能感知到AI對客服這塊是一個很好的戰場,有很多AI技術值得推進。

但關於這個保險客服的現場演示,槽點挺多的,中場休息環節,由一個主持人帶著大家在網頁上體驗了這個保險客服,但是這個體驗很sb,全程對於一次保險對話,都是基於FAQ式的傳統客服模式

  • 問:我要買保險
  • 答:你要哪種?三選一
  • 問:我要A
  • 答:你有個女兒是否一起投保
  • 問:可以
  • 答:請上傳照片
  • 問:傳個小狗的照片
  • 答:你上傳的是動物,不是小狗,請正確上傳(後面還傳了個王力巨集的照片也識別出來了)

看著在場的人覺得,哇!好厲害!都能影像識別出錯誤的照片,但整個過程這個客服問答應該凸顯的,多輪對話自然語言理解上下文場景推理一概沒表現出來,除了附加了一個影像識別,整個case,可以說一點AI的技術含量都沒有,完全可以通過基於FAQ式的問答方式實現,但對於現場不懂的其他行業人來說看似好AI,好厲害。

這TM到底是推廣AI呢,還是給不懂的麻瓜洗腦AI呢?

第三場 知識挖掘以及智慧應用

這是我最感興趣的一場,裡面詳細介紹對於專業領域,如何通過挖掘的方式,去構建一套屬於專業領域的知識圖譜,也是上一場提到的

建立結構化知識體系

人類的知識是通過經驗規律得到的總結

但計算機需要的是

  • 有結構的知識
  • 可計算的知識
  • 也就是知識圖譜

WechatIMG69
WechatIMG69

圖中就是一個雙向知識圖譜

  • 左邊是關於神經疾病相關知識圖譜,介紹了神經疾病都有哪些分類,相關,延展。是從大量醫術,醫用文獻中挖掘出來的

  • 右邊是醫院針對病人的一些處理規則,如何確診?怎麼治療?能手術麼?哪種治療?應該是從醫院的看病大資料中挖掘出來的

中間通過演算法,將2套可計算的知識資料進行推理,進行關聯,形成了微軟介紹的一個醫用大資料知識圖譜例子

知識圖譜研究的是什麼問題?

  • 知識發現
  • 抽取融合
  • 知識表示
  • 知識推理/語義計算
  • 恰當使用

WechatIMG71
WechatIMG71

計算機可計算的知識分為

  • 結構化資料

那些我們存在我們自己資料庫中的有自己專屬定義欄位的資料都叫結構化資料,可以查詢,可以索引,可以分類,可以進行計算機所能操作的各種行為

  • 半結構化資料

那些存在別人資料庫中本身已經被結構化的資料,但因為別人並不對外直接提供資料庫,而是以網頁,表格等形式進行輸出,可以通過人工的策略,人工的評估抓取,將他們重新結構化構建成為自己的資料庫的資料,簡單的說就是抓取別人資料後人工+機器策略可以復原結構化

WechatIMG74
WechatIMG74

  • 無結構化資料

純自然文字,語義理解後進行結構化抽取,這才是最難的,也是最難統一,根據文字樣本需要定製訓練的,也是需要投入最多人力進行結果校準,訓練校準的,但這塊絲毫沒提這裡面的成本和質量效果問題

WechatIMG72
WechatIMG72

知識的表示/整合,最終形成網狀圖譜

WechatIMG73
WechatIMG73

通過網狀的圖譜,可以進行推理和語義計算,這裡有一個通俗易懂的例子可以說明基於圖譜的語義計算

  • A歡樂喜劇人,那個禿子他兒子很帥
  • B這期歡樂喜劇人的主持人郭德綱是個禿頭,但很棒
  • C郭德綱的孩子英俊,比他爹強多了
  • D看了最強大腦,裡邊嘉賓主持都不錯,帥

選出和A表達意思最相近的選項

如果是老的語義計算都是基於詞向量的近似性,因此一定是得出B這個大難,但是擁有知識圖譜,並且能通過知識圖譜進行推力計算的(需要歡樂喜劇人的主持人是郭德綱這一背景關係),會得出C這個答案

知識的應用

演講嘉賓介紹了關於這種推理問答的應用

人物關係/圖譜

Bing搜尋搜奧巴馬的老婆是誰,直接展現出米歇爾.奧巴馬,看似是一個精準展現出這門深奧技術的效果的一個case,但槽點來了

  • 這例子被人舉了無數次了吧
  • 在AI沒爆發的時代,各大搜尋引擎都早就支援了吧
  • 你們家的Bing在這塊也沒啥顯著優勢吧

baiduaobama
baiduaobama

googleaobama
googleaobama

知識圖譜的藍圖遠景

  • 讓計算機掌握知識

    微軟開放的 microsoft concept graph 英文已經release
    全網際網路級別的廣度知識圖譜

  • 讓計算機學會聯想

    網遊 – 毒品,讓計算機通過學習能理解這種比喻知識圖譜

  • 讓計算機學會創造

    假設知識圖譜
    例子:藥品/資料/成分/病理 我們擁有這些知識圖譜
    假設檢驗 預測 藥與治病之間的關係
    科研人員那幾年前的藥理病例資料進行海量預測,然後查詢近幾年裡藥品論文發表情況,發現計算機蒙對了20%

第四場 構建智慧的問答機器人

這一場更加的學術範兒,更加的演算法範兒了!

  • 問答機器人分層

    • 閒聊層 微軟小冰
    • 資訊層 精準資訊需求
    • 任務層 完成特定目標
  • 智慧問答及問題生成

    • FAQ式
    • 基於資料
      • 無結構化 – 文件
      • 半結構化 – 表格
      • 結構化 – 知識圖譜
    • 人工輔助/監測

WechatIMG75
WechatIMG75

微軟必應搜尋 passage-based

基於必應搜尋,會閱讀網頁搜尋中結果,直接找到網頁中找到能夠回答搜尋問題的那句話,在搜尋結果頁直接展現,無需使用者點到該網頁裡再全文閱讀尋找到岸

WechatIMG76
WechatIMG76

微軟必應搜尋 table-based QA

對於股票行情,體育競賽得分等query,可以在搜尋到直接結果的同事,把相關其他資訊,以結構化表格的形式呈獻給搜尋使用者,從而得到豐富的結果展現

微軟必應搜尋 Question Generation

搜尋的反向,海量的抓取網頁內容or資料內容,通過分析內容本身,預先的生成一些搜尋問答對,從而進行快速的QA 問答結果和匹配

給予任何一個文字,就可能提前生成可能問的問題,預先知道針對文字能問啥

WechatIMG78
WechatIMG78

WechatIMG79
WechatIMG79

大難題

  • Domain Adaptation is one Big Challenge

用開放領域(搜尋)的大量資料,無法解決專有領域的問題
如果沒有標註資料,或者只有大量無結構化資料,則面臨很大問題

  • 上下文 多輪對話

如果擁有大量對話資料,可以深度學習
缺乏大量對話資料
只好利用邏輯,利用語義推理,語義理解,然後進行回答生成
目前準確度滿意度都是難題

第五講 基於大規模行為資料的使用者畫像

這一講大概是在掃盲使用者畫像

  • 使用者畫像,就是打標籤

WechatIMG81
WechatIMG81

  • 使用者畫像 6個維度/圖示
    • 遠遠不止6個維度
    • 每個維度有相關屬性

WechatIMG80
WechatIMG80

  • 跨平臺使用者行為資料集!!!!

這個其實還是挺牛逼的,他可以跨越豆瓣/微博等跨公司之間的使用者資料進行畫像,並且將這些畫像進行統一,最終能描述一個人在網際網路上的全面畫像
沒錯這裡有很多隱私問題,不討論了
和廠裡的GlobalSession 以及IDMapping 很是類似
我曾一度懷疑微軟是怎麼做到的,畢竟他的搜尋和廣告模式,推廣度遠不及Google和廠裡
後來同事說,他有作業系統,好吧,無話可說,作業系統可以記錄一切哈哈哈哈哈

  • 使用者移動規律與位置預測

僅用位置資訊,用使用者移動規律,推測使用者年齡/工作,屬性

  • 使用者心理特徵 (使用者心裡畫像)
    • 四體液假說(心理學)
    • 詞彙學假說(心理學)

使用者畫像不僅僅描述一個人的客觀屬性,還通過人在社交網路裡留下的對話資訊,來描述使用者的人格星哥

  • 使用者的大五人格準則
    • 外向性
    • 隨和性
    • 神經質
    • 盡責性
    • 開放性

WechatIMG82
WechatIMG82

微軟小冰

  • 基於微博微信的大資料匹配指數,微軟小冰直接在天津衛視的非你莫屬節目中,對應聘者進行人工AI性格畫像

  • 微軟小冰寫詩,用幾十位民國詩人的詩詞當做訓練集

    • 識別照片
    • 內容分析提取
    • 提取出批量關鍵詞
    • 過濾出適合寫詩的關鍵詞
    • 寫詩

WechatIMG83
WechatIMG83

為什麼忙碌這種詞適合寫詩?紅綠燈不適合?因為民國詩人那會就是這個套路
為什麼嘴邊掛著虛假的笑容?因為民國詩人就是這個套路
哈哈哈哈

互動體驗環節

語音實時識別

現場主持人開啟錄音軟體,一邊說話,一邊螢幕上實時的把說的話錄入,底下的觀眾一片叫好(我的尷尬症都犯了),紛紛激動的提問能識別方言麼?能識別英文麼?

語音錄入這程度,無數公司N年前就做到這種水準了吧,都不用AI大公司出馬,科大訊飛,漢王都能做的非常非常好了,這果真是給麻瓜開的大會麼?
識別方言,識別英文,語音錄入,這已經是很多輸入法軟體都已經支援的了吧

視訊分析

這個例子就很酷炫,很像廠裡AI大會上,視訊分會場所展現的對外免費開放的視訊結構化AI開放API,但是這個demo更接地氣!!感覺還是挺牛逼的

WechatIMG84
WechatIMG84

主持人輸入了一段新聞聯播的節選,直接就人臉識別分析出整個新聞聯播中出現的人臉,這裡面是彭麻麻,微軟Bing有自己的一大堆名人庫和名人圖譜,因此點開詳細介紹,可以看到相關名人資訊,並且還可以精確跳轉到彭麻麻所出現的時間點

WechatIMG85
WechatIMG85

主持人把介面切到內容識別,可以看到,整個視訊的聲音音軌都被一一識別出來,轉化成文字,以時間軸的方式,記錄成可檢索,可挖掘的非結構化文字資訊,不僅僅是聲音音軌,就連視訊中出現的字幕資訊,也被OCR識別轉化成文字,記錄進入時間軸。

這個demo還是相當酷炫的!類似的技術廠裡在AI開放平臺的視訊API,都大概能實現,但還沒有見到這麼接地氣的落地demo,感覺這個demo是整個微軟AI落地大會裡,最落地的一個東西了。

但是,會場來的嘉賓專家,都是NLP/語音語言/知識圖譜相關的專家,這個視訊只演示demo,完全沒有在本次的議程中內。

吐槽:AI 還是 PR?

整個大會更像是一個宣傳分享會,在微軟大廈自己的報告廳舉辦,面向的也都是一些傳統行業,非計算機行業內的人士,但整個分享會最後給我的感覺略微尷尬

坦白說幾位大師講的內容相對來說更技術一些,圍繞著一堆自然語言處理方面深入的技術,這裡面每一個方向都是值得深入去探討的技術難題,這些技術難題背後一定是面臨著目前AI能力不完善所存在的一些短板或者說不足,因此這些AI如何對商業賦能這個話題,我個人覺得,應該是充分的瞭解當前所擁有的AI能力和應用範圍後,由最瞭解AI的人與不懂AI的傳統商業人士一起去尋求切合的適當的商業落地方案。

但這次的分享會完全不是這個基調,幾位博士用稍微通俗易懂的詞彙給在場的傳統人士傳達一個個其實根本聽不懂的概念,現場的傳統人士紛紛覺得高大上,好牛逼,然後會暢想orYY出很多AI賦能商業場景,真正落地的有幾個?大會上並沒有引導討論這一個個方案背後落地所面臨的成本,光是在介紹美好的前景。

給傳統行業人士用通俗易懂的解釋AI的時候都是這麼說的:

機器可以自主的學習,能讓機器學會人的對話,學會理解人的知識和意識,我們有大資料,我們可以交給機器,讓機器去自己從大資料中訓練+學習

聽到這樣AI的結論,不懂的人們於是開始暢想賦能商業落地美好的未來,但是AI真的能做到麼?真的能不用花費額外代價能做到麼?需要花費代價才能做到的話?代價到底有多少?錢?還是人力輔助?

有一句不恰當的話叫

人工智慧:有多少智慧,背後就有多少人工

AI可以讓機器像人一樣自己去學習,但有沒有想過人在從小到大的學習過程中經歷了多少老師的輔助?聽過多少的課,做過多少道題?多少老師親自告訴你這道題錯了,那麼理解不對,你這麼想走進了死衚衕。人的學習過程中是不斷通過人來校正認知的,機器也一樣。

現在機器學習最大的成本難道不是對所有機器學習的模型進行海量的標註/校對,重複訓練,重複校對,這背後的成本是多少?難道不是商業落地方面最需要考慮的麼?是你已經訓練好了,商業落地直接付諸資金,直接拿來就用?還是說得讓商業合作方一起和你出人出力去訓練優化在特有商業場景下的人工智慧?

說實話,如果是前者,早就拿出來宣傳服務直接賣錢了,而不是尋求商業落地合作。

現在所有的AI廠商都面臨一個問題,手頭有AI的能力,但這個能力都不是完美的,都有缺陷和短板,不能直接商業化,因此需要坐下來和各大垂直領域行業進行深入洽談和思考,如何將能力有限的AI應用進垂直領域中去,從而解決效率/成本等問題。

AI現在就像是個錘子,他不是萬能工具箱,什麼都能解決,他就只能砸一些特殊釘子,但是AI廠商根本不知道哪裡存在這種巨有商業落地價值的特殊釘子,所以AI廠商抱著拿著錘子找釘子的方式開放能力去尋找合作,在我看來這樣的合作就要充分的說明,什麼釘子可以砸,什麼釘子不能砸,這才是有價值有意義的商業落地討論

但這次大會並不是這種feel,在宣傳著一個個很學究很演算法的NLP技術,宣傳著這些技術有多牛逼(真的很牛逼,每個嘉賓都是當之無愧的大師級),面向的確實一群完全不瞭解的計算機行業外人士,商討的卻不是這些技術的具體提供形態,提供服務or對接的落地方式,而是畫出了一個大餅,所有不懂得人在現場一起high,提問問一些不著調的東西,諸如 AI/大資料,有沒有個人隱私問題AI來了後,工人失業咋辦?甚至有些現場示例,智慧問答客服體系,採用的根本是非AI的方式,而是傳統的FAQ式的自動客服,反正在場的傳統行業認識根本分辨不出來這裡面的區別。

專家大師們,講著非常有價值有意義的技術方案和成果,臺下的觀眾們一臉懵逼的YY不著邊際的暢享,AI怎麼落地?這個話題感覺在雞同鴨講的氣氛中和諧的結束了

我是真的期待一些面向開發者,或者面向各行業人士,能解答下面這些問題的AI大會

  • 這麼些真的很厲害的技術方案怎麼落地?
  • 這些個方案,我們應該怎麼對接?
  • 對接的服務有哪些,對接的形式是怎樣?
  • 對接的過程中需要付出哪些成本和代價,在落地的過程中,哪些是當下AI方案的短板和不足?
  • 需要用繞路or人工的方式去cover和彌補?
  • 這種人工的方式又需要多大投入?

這些商業落地所真正要考慮的問題,這次大會其實都沒體現,更像pr show肌肉,讓不明覺厲的觀眾high起來的一次會。

相關文章