一文看懂Echo和Alexa,亞馬遜如何用蘋果的玩法在玩語音?

代官山發表於2018-11-27

一文看懂Echo和Alexa,亞馬遜如何用蘋果的玩法在玩語音?

投遞人 itwriter 釋出於 2017-03-17 08:51 評論(0) 有3450人閱讀 原文連結 [收藏] « »

一文看懂 Echo 和 Alexa,亞馬遜如何用蘋果的玩法在玩語音?

其實 Echo 和 Alexa 的關係,就像 iPhone 和 Siri 的關係一樣:一個是硬體產品,一個是語音服務。

  從 1 月份美國的 CES 電子消費展開始,每週關於亞馬遜 Echo 的報導可謂「層出不窮」,Echo 緣何如此受到無數媒體的追捧?很多同學都有點不太理解,而且中國的 AWE 家電展後,很多文章在分析中國的智慧產品時,還經常拿來與 Echo 進行對比。無論是 CES 還是 AWE,Echo 背後已經帶上了一層耀眼的「光環」。

  當然, Echo 是一個來自美國的智慧產品,所以在中國的確很難買到。 很多同學也看過多篇有關 Echo 的文章,但是並沒有體驗過這款產品, 所以經常被各種概念弄得「雲裡霧裡」,很多文章一邊說 Echo,然後又提到 Alexa,如果你在網上搜尋亞馬遜 Alexa,可以發現有使用者中心,有開發者中心,甚至還有基金會。筆者希望通過本篇文章來闡述一下 Echo 系列產品的關係,以及亞馬遜的戰略,希望能夠對大家有所幫助,以下:   

  1,Echo 和 Alexa 的關係:你中有我

  簡單而言,其實 Echo 和 Alexa 的關係,就像 iPhone 和 Siri 的關係一樣:一個是硬體產品,一個是語音服務。Echo 音響使用的語音服務是 Alexa, 所以 Echo 音響的喚醒詞可以是 Echo,也可以是 Alexa。值得一提的是,亞馬遜的 Alexa 是對外開放的,不僅 Echo 能用,其他硬體也有用,在今年 CES 展上很多智慧硬體都在用 Alexa,這項服務對外開放使用, 開發者可以為 Alexa 開發外掛,貢獻更多的功能,如果星巴克希望使用者通過 Alexa 來訂購他們家的咖啡,只需要開發一個小外掛就行,現在已經有成千上萬家企業在這麼幹。

  可以說,亞馬遜是在用蘋果的玩法來玩轉語音服務。如果你進入 Alexa 的開發者中心(https://developer.amazon.com/alexa),就可以清晰的看到三個大產品,包括 Alexa Skills Kit(技能外掛),Alexa Voice Service(語音服務),以及 Alexa Fund(基金會) 。 他們各自都有什麼功能呢?下面一一為大家介紹。

一文看懂 Echo 和 Alexa,亞馬遜如何用蘋果的玩法在玩語音?

  2,Alexa Skills Kit(技能外掛)

  使用者剛買來 Echo 音響時,其實功能很少,只能問問天氣(what's the weather),即不能聽歌,也不能控制家電, 這些功能都需要去 Alexa 的 APP 開啟相應技能(Skill) 才能使用。因為在美國聽歌是收費的,所以開啟聽歌的功能時,使用者就需要繫結信用卡。 Alexa APP 並未上架到蘋果 Appstore 的中國市場, 如果要體驗,可以瀏覽 Alexa 的 Web APP :http://alexa.amazon.com。   

一文看懂 Echo 和 Alexa,亞馬遜如何用蘋果的玩法在玩語音?

  進入 Web APP 後, 右側選單 Music&Books 處可以設定聽音樂、聽書的功能,點選選單 Skills 可以設定技能外掛, 這裡有上萬個技能外掛,基本都是第三方開發者為 Alexa 開發的功能。

  在選單 Home 下,可以看到和音響對話的歷史記錄,並可對每次對話的答案標記是否滿意,這樣可以幫助 Alexa 完成「機器學習」。使用者和 Alexa 的聊天記錄只有自己可見,對開發者是封閉的。而國內一些語音語義平臺,能讓開發者在平臺上面就看見使用者的聊天記錄,相信很多普通使用者知道了這點,就都不敢再跟智慧產品當那種「無話不談」的朋友了。

  如果你希望 Alexa 智慧裝置能控制家裡的電器,也要開啟相應的技能外掛才行。比如你用的是美國快思聰(Crestron)的智慧家居系統 , 則可以開啟技能外掛 Crestron Home Automation for SmartHome , 開啟時需要 Oauth 帳號授權, 這樣 Echo 音響就能知道你家裡連線了多少 Crestron 的裝置,然後就可以通過語音來控制它們。而如果你是一個開發者,如何給 Alexa 開發技能外掛呢? 

一文看懂 Echo 和 Alexa,亞馬遜如何用蘋果的玩法在玩語音?

  首選,你要登入亞馬遜的開發者中心(developer.amazon.com),進入 Alexa 的選單後,會讓你選擇是開發外掛(Alexa Skills Kit),還是接入語音服務(Alexa Voice Service)。這裡我們選擇 Alexa Skills Kit 即可,接下來按操作步驟進行即可。 

  Alexa 可以開發三種型別的外掛:自定義(custom)、智慧家居(smart home)、快報(flash briefing) 。當然, Alexa 並不要求開發者將自己的內容資源(如音視訊、問答對等)上傳到亞馬遜, 而只是在 Alexa 中定義「意圖」,當使用者觸發「意圖」時呼叫開發者定義的介面,類似於微信公眾號的開發者模式, 開發者自己在介面中返回 Alexa 要回答使用者的答案, Alexa 做到了「意圖」和「回答」的分離,在 Alexa 平臺定義「意圖」,而在開發者自己伺服器上面實現回答。而國內很多語音語義平臺,沒有實現「意圖」和「回答」的分離,要求開發者將「答案」上傳到平臺,所以給開發者感覺不太好,總認為將自己的核心機密資料上傳到了第三方。

  亞馬遜通過 Alexa 吸引普通使用者與它對話,同時也吸引了更多的開發者為它貢獻外掛, 同時保障了普通使用者和開發者的權益,而且產品也做到了:不會「索取」開發者的核心資料,更不會把普通使用者的對話記錄開放給開發者。筆者相信,這也是 Alexa 能夠獲得成功的一個非常重要的原因。

  3,Alexa Voice Service(語音服務)

  如果我們想開發一款擁有像 Echo 音響一樣,具有語音互動功能的產品,那麼,我們直接接入 Alexa 的語音服務即可。產品的接入方式也十分簡單,在開發者中心建立一個語音服務的應用,就可以獲得兩個 KEY: Client ID 和 Client Secret, 這兩個 KEY 值是呼叫介面時需要用到的。介面地址為: https://avs-alexa-na.amazon.com ,請求介面時傳遞錄音檔案, Alexa 的雲端同時進行了語音識別和語義理解,將音訊檔案轉換為文字,然後對文字進行理解,如果觸發了某個技能外掛的「意圖」,則呼叫開發者的定義第三方伺服器的介面,如果是聽歌或聽書等「意圖」,則呼叫亞馬遜自家的資源。語義理解後 Alexa 將需要返回的文字內容合成為音訊檔案,所以介面的返回內容也是音訊檔案。  

一文看懂 Echo 和 Alexa,亞馬遜如何用蘋果的玩法在玩語音?

  Alexa 語音服務這麼簡單? 核心功能就是一個介面? 沒有喚醒模組?沒有麥克風陣列? 很多國內做開發的同學,可能會有這些疑問。其實,Alexa 並沒有像國內的語音平臺那樣,將語音、語義、喚醒、麥克風陣列打包在一起, 然後收一個很高的 License 費用。Alexa 只專注於雲端識別,而喚醒、麥克風陣列等技術是開放的。

  這是官方的示例程式碼 https://github.com/alexa/alexa-avs-sample-app , 示例程式碼中喚醒用了 Sensory 和 KITT.AI,麥克風陣列用了科聲訊的兩麥方案。Alexa 不繫結任何硬體方案,喚醒和錄音的技術方案完全掌握由開發者自己決定。Alexa 只是對錄音的質量提出要求:  

一文看懂 Echo 和 Alexa,亞馬遜如何用蘋果的玩法在玩語音?

  因為 Alexa 不繫結任何硬體方案,這就使得硬體成本可以降下來,Alexa 也並沒有在語音技術上收費,使用者是在使用產品過程中對內容進行付費。而國內的語音平臺總想著在語音技術本身上收費,語音技術還要繫結自家的喚醒模組、麥克風陣列或者 SDK,也並沒有開放 API。一個 License 費用就能收 60 多塊錢,這使得智慧語音技術成本一直也降不下來,當然這可能因為國內外的開發環境不同,還有文化差異所導致。

  筆者認為,雖然人工智慧被炒得很熱,但普通使用者目前還是嚐鮮的態度,並沒有形成強烈的剛需,市場並未開啟。如果智慧產品要想要開啟市場,那麼應該有兩點基礎要求:第一,就是真正意義上能替代「人工」,比如工業機器人、智慧客服,他們真的能替代人工,所以它們會有市場;第二點,就是讓普通使用者能夠用低成本「嚐鮮」。 很多服務機器人或者智慧音響產品就比較尷尬, 既然不能替代人工,那麼使用者只能把它作為「娛樂產品」來消遣, 但價格又這麼貴,普通使用者只能「望而卻步」了。  

  4,Alexa Fund(基金會)

  Alexa 基金會孵化是使用該項技術的創業專案,它要求所有專案按照他們規定的時間點進行,4 月 9 號之前報名,7 月 17 日開始開發, 經歷 13 周時間,10 月 12 日演示產品。   

一文看懂 Echo 和 Alexa,亞馬遜如何用蘋果的玩法在玩語音?

  所有專案都集中在一個地方進行開發, 亞馬遜會選擇一處風景優美的地方,每年的地方都不一樣,今年在西雅圖,明年可能在紐約。在這 13 周的開發中,有 Alexa 官方高階技術人員在現場為專案提供技術支援。

  Alexa 通過這個基金會不僅吸引很多創業專案,還能快速孵化專案,出現一批又一批基於 Alexa 技術的好產品。

  我們再來梳理一下 Alexa 整個產品生態,看看亞馬遜是如何用蘋果的玩法在玩語音的。亞馬遜 Alexa 通過基金會、技能外掛、語音服務打造起整條的生態鏈,使得創業者、開發者、消費者都聚集在這個生態鏈中,實現了多方共贏。 

一文看懂 Echo 和 Alexa,亞馬遜如何用蘋果的玩法在玩語音?

  第三方產品不管是硬體產品,還是 APP 都可以通過開發者中心的語音服務接入 Alexa,消費者在使用第三方產品時同時為亞馬遜帶來使用者,相當於第三方產品又幫助推廣了 Alexa 服務,於是 Alexa 得到了迅速的傳播。  

  最後做一個小小的廣告,因為 Alexa 目前還不支援中文,Echo 在國內也很難買到。為了讓大家能體驗一下 Alexa 的智慧服務,智眾互動出了一款虛擬的中文 Echo,大家不用購買硬體裝置,也能用中文對話的方式體驗 Echo 的功能,大家可以試一下: https://echo.zhizhongai.com/

  本文作者:智眾互動 CEO 羅飛,智眾互動是一家提供人工智慧解決方案的公司,是注重早教內容沉澱的人工智慧技術公司。提供機器人或音響的技術解決方案以及內容解決方案。羅飛的微訊號:luofei614 , 歡迎加微信交流。

相關文章