一文看懂Echo和Alexa,亞馬遜如何用蘋果的玩法在玩語音?
一文看懂Echo和Alexa,亞馬遜如何用蘋果的玩法在玩語音?
投遞人 itwriter 釋出於 2017-03-17 08:51 評論(0) 有3450人閱讀 原文連結 [收藏] « »
其實 Echo 和 Alexa 的關係,就像 iPhone 和 Siri 的關係一樣:一個是硬體產品,一個是語音服務。
從 1 月份美國的 CES 電子消費展開始,每週關於亞馬遜 Echo 的報導可謂「層出不窮」,Echo 緣何如此受到無數媒體的追捧?很多同學都有點不太理解,而且中國的 AWE 家電展後,很多文章在分析中國的智慧產品時,還經常拿來與 Echo 進行對比。無論是 CES 還是 AWE,Echo 背後已經帶上了一層耀眼的「光環」。
當然, Echo 是一個來自美國的智慧產品,所以在中國的確很難買到。 很多同學也看過多篇有關 Echo 的文章,但是並沒有體驗過這款產品, 所以經常被各種概念弄得「雲裡霧裡」,很多文章一邊說 Echo,然後又提到 Alexa,如果你在網上搜尋亞馬遜 Alexa,可以發現有使用者中心,有開發者中心,甚至還有基金會。筆者希望通過本篇文章來闡述一下 Echo 系列產品的關係,以及亞馬遜的戰略,希望能夠對大家有所幫助,以下:
1,Echo 和 Alexa 的關係:你中有我
簡單而言,其實 Echo 和 Alexa 的關係,就像 iPhone 和 Siri 的關係一樣:一個是硬體產品,一個是語音服務。Echo 音響使用的語音服務是 Alexa, 所以 Echo 音響的喚醒詞可以是 Echo,也可以是 Alexa。值得一提的是,亞馬遜的 Alexa 是對外開放的,不僅 Echo 能用,其他硬體也有用,在今年 CES 展上很多智慧硬體都在用 Alexa,這項服務對外開放使用, 開發者可以為 Alexa 開發外掛,貢獻更多的功能,如果星巴克希望使用者通過 Alexa 來訂購他們家的咖啡,只需要開發一個小外掛就行,現在已經有成千上萬家企業在這麼幹。
可以說,亞馬遜是在用蘋果的玩法來玩轉語音服務。如果你進入 Alexa 的開發者中心(https://developer.amazon.com/alexa),就可以清晰的看到三個大產品,包括 Alexa Skills Kit(技能外掛),Alexa Voice Service(語音服務),以及 Alexa Fund(基金會) 。 他們各自都有什麼功能呢?下面一一為大家介紹。
2,Alexa Skills Kit(技能外掛)
使用者剛買來 Echo 音響時,其實功能很少,只能問問天氣(what's the weather),即不能聽歌,也不能控制家電, 這些功能都需要去 Alexa 的 APP 開啟相應技能(Skill) 才能使用。因為在美國聽歌是收費的,所以開啟聽歌的功能時,使用者就需要繫結信用卡。 Alexa APP 並未上架到蘋果 Appstore 的中國市場, 如果要體驗,可以瀏覽 Alexa 的 Web APP :http://alexa.amazon.com。
進入 Web APP 後, 右側選單 Music&Books 處可以設定聽音樂、聽書的功能,點選選單 Skills 可以設定技能外掛, 這裡有上萬個技能外掛,基本都是第三方開發者為 Alexa 開發的功能。
在選單 Home 下,可以看到和音響對話的歷史記錄,並可對每次對話的答案標記是否滿意,這樣可以幫助 Alexa 完成「機器學習」。使用者和 Alexa 的聊天記錄只有自己可見,對開發者是封閉的。而國內一些語音語義平臺,能讓開發者在平臺上面就看見使用者的聊天記錄,相信很多普通使用者知道了這點,就都不敢再跟智慧產品當那種「無話不談」的朋友了。
如果你希望 Alexa 智慧裝置能控制家裡的電器,也要開啟相應的技能外掛才行。比如你用的是美國快思聰(Crestron)的智慧家居系統 , 則可以開啟技能外掛 Crestron Home Automation for SmartHome , 開啟時需要 Oauth 帳號授權, 這樣 Echo 音響就能知道你家裡連線了多少 Crestron 的裝置,然後就可以通過語音來控制它們。而如果你是一個開發者,如何給 Alexa 開發技能外掛呢?
首選,你要登入亞馬遜的開發者中心(developer.amazon.com),進入 Alexa 的選單後,會讓你選擇是開發外掛(Alexa Skills Kit),還是接入語音服務(Alexa Voice Service)。這裡我們選擇 Alexa Skills Kit 即可,接下來按操作步驟進行即可。
Alexa 可以開發三種型別的外掛:自定義(custom)、智慧家居(smart home)、快報(flash briefing) 。當然, Alexa 並不要求開發者將自己的內容資源(如音視訊、問答對等)上傳到亞馬遜, 而只是在 Alexa 中定義「意圖」,當使用者觸發「意圖」時呼叫開發者定義的介面,類似於微信公眾號的開發者模式, 開發者自己在介面中返回 Alexa 要回答使用者的答案, Alexa 做到了「意圖」和「回答」的分離,在 Alexa 平臺定義「意圖」,而在開發者自己伺服器上面實現回答。而國內很多語音語義平臺,沒有實現「意圖」和「回答」的分離,要求開發者將「答案」上傳到平臺,所以給開發者感覺不太好,總認為將自己的核心機密資料上傳到了第三方。
亞馬遜通過 Alexa 吸引普通使用者與它對話,同時也吸引了更多的開發者為它貢獻外掛, 同時保障了普通使用者和開發者的權益,而且產品也做到了:不會「索取」開發者的核心資料,更不會把普通使用者的對話記錄開放給開發者。筆者相信,這也是 Alexa 能夠獲得成功的一個非常重要的原因。
3,Alexa Voice Service(語音服務)
如果我們想開發一款擁有像 Echo 音響一樣,具有語音互動功能的產品,那麼,我們直接接入 Alexa 的語音服務即可。產品的接入方式也十分簡單,在開發者中心建立一個語音服務的應用,就可以獲得兩個 KEY: Client ID 和 Client Secret, 這兩個 KEY 值是呼叫介面時需要用到的。介面地址為: https://avs-alexa-na.amazon.com ,請求介面時傳遞錄音檔案, Alexa 的雲端同時進行了語音識別和語義理解,將音訊檔案轉換為文字,然後對文字進行理解,如果觸發了某個技能外掛的「意圖」,則呼叫開發者的定義第三方伺服器的介面,如果是聽歌或聽書等「意圖」,則呼叫亞馬遜自家的資源。語義理解後 Alexa 將需要返回的文字內容合成為音訊檔案,所以介面的返回內容也是音訊檔案。
Alexa 語音服務這麼簡單? 核心功能就是一個介面? 沒有喚醒模組?沒有麥克風陣列? 很多國內做開發的同學,可能會有這些疑問。其實,Alexa 並沒有像國內的語音平臺那樣,將語音、語義、喚醒、麥克風陣列打包在一起, 然後收一個很高的 License 費用。Alexa 只專注於雲端識別,而喚醒、麥克風陣列等技術是開放的。
這是官方的示例程式碼 https://github.com/alexa/alexa-avs-sample-app , 示例程式碼中喚醒用了 Sensory 和 KITT.AI,麥克風陣列用了科聲訊的兩麥方案。Alexa 不繫結任何硬體方案,喚醒和錄音的技術方案完全掌握由開發者自己決定。Alexa 只是對錄音的質量提出要求:
因為 Alexa 不繫結任何硬體方案,這就使得硬體成本可以降下來,Alexa 也並沒有在語音技術上收費,使用者是在使用產品過程中對內容進行付費。而國內的語音平臺總想著在語音技術本身上收費,語音技術還要繫結自家的喚醒模組、麥克風陣列或者 SDK,也並沒有開放 API。一個 License 費用就能收 60 多塊錢,這使得智慧語音技術成本一直也降不下來,當然這可能因為國內外的開發環境不同,還有文化差異所導致。
筆者認為,雖然人工智慧被炒得很熱,但普通使用者目前還是嚐鮮的態度,並沒有形成強烈的剛需,市場並未開啟。如果智慧產品要想要開啟市場,那麼應該有兩點基礎要求:第一,就是真正意義上能替代「人工」,比如工業機器人、智慧客服,他們真的能替代人工,所以它們會有市場;第二點,就是讓普通使用者能夠用低成本「嚐鮮」。 很多服務機器人或者智慧音響產品就比較尷尬, 既然不能替代人工,那麼使用者只能把它作為「娛樂產品」來消遣, 但價格又這麼貴,普通使用者只能「望而卻步」了。
4,Alexa Fund(基金會)
Alexa 基金會孵化是使用該項技術的創業專案,它要求所有專案按照他們規定的時間點進行,4 月 9 號之前報名,7 月 17 日開始開發, 經歷 13 周時間,10 月 12 日演示產品。
所有專案都集中在一個地方進行開發, 亞馬遜會選擇一處風景優美的地方,每年的地方都不一樣,今年在西雅圖,明年可能在紐約。在這 13 周的開發中,有 Alexa 官方高階技術人員在現場為專案提供技術支援。
Alexa 通過這個基金會不僅吸引很多創業專案,還能快速孵化專案,出現一批又一批基於 Alexa 技術的好產品。
我們再來梳理一下 Alexa 整個產品生態,看看亞馬遜是如何用蘋果的玩法在玩語音的。亞馬遜 Alexa 通過基金會、技能外掛、語音服務打造起整條的生態鏈,使得創業者、開發者、消費者都聚集在這個生態鏈中,實現了多方共贏。
第三方產品不管是硬體產品,還是 APP 都可以通過開發者中心的語音服務接入 Alexa,消費者在使用第三方產品時同時為亞馬遜帶來使用者,相當於第三方產品又幫助推廣了 Alexa 服務,於是 Alexa 得到了迅速的傳播。
最後做一個小小的廣告,因為 Alexa 目前還不支援中文,Echo 在國內也很難買到。為了讓大家能體驗一下 Alexa 的智慧服務,智眾互動出了一款虛擬的中文 Echo,大家不用購買硬體裝置,也能用中文對話的方式體驗 Echo 的功能,大家可以試一下: https://echo.zhizhongai.com/
本文作者:智眾互動 CEO 羅飛,智眾互動是一家提供人工智慧解決方案的公司,是注重早教內容沉澱的人工智慧技術公司。提供機器人或音響的技術解決方案以及內容解決方案。羅飛的微訊號:luofei614 , 歡迎加微信交流。
相關文章
- Alexa Guard評測:如何用亞馬遜Echo構建家庭安全系統?亞馬遜
- 語音助手的前世今生篇之亞馬遜Alexa亞馬遜
- 打造DIY版Echo:樹莓派+ Alexa 語音服務樹莓派
- Voicebot:亞馬遜Alexa是影響最大的語音助手亞馬遜
- 英特爾計劃明年推出智慧音響 內建亞馬遜Alexa語音助手亞馬遜
- 三星PK亞馬遜Echo 或推出語音互動藍芽音響亞馬遜藍芽
- 亞馬遜將推便攜版echo音響:發力語音識別功能亞馬遜
- 亞馬遜釋出升級版Fire TV電視棒:支援Alexa語音亞馬遜
- 科普丨一文看懂語音識別的技術原理
- 蘋果推類似亞馬遜Echo智慧音響:攝像頭能識別人臉蘋果亞馬遜
- 亞馬遜的Alexa的語義分析效能得到大幅度提高亞馬遜
- 亞馬遜Alexa是如何失敗的?亞馬遜
- 由亞馬遜Alexa營造出的語音生態圈,竟然為開發者賺錢提供了新出路亞馬遜
- 亞馬遜Alexa與美國媒體合作語音深度新聞,喚醒新聞傳播新模式亞馬遜模式
- 語音助手市場來勢洶洶,亞馬遜Alexa 2019將會如何應對?亞馬遜
- 亞馬遜:使用者現可以選擇退出Alexa錄音人工稽核亞馬遜
- 亞馬遜Alexa語音助手爆漏洞;國產銀河麒麟桌面作業系統V10釋出;《堡壘之夜》下架蘋果商店亞馬遜作業系統蘋果
- 亞馬遜在Win10上宣佈Alexa應用更新後臺執行:擴音通話亞馬遜Win10
- 抬頭三尺有Echo:領先蘋果,亞馬遜把智慧音響裝進你家天花板蘋果亞馬遜
- 一文看懂 C 語言 I/O
- 如何用Python語音合成,以及文字轉語音~Python
- “直播+遊戲”語音房互動玩法遊戲
- 語音遊戲是否可以成為Alexa擴張的助推器?遊戲
- CES語音助手們戲很足!谷歌、亞馬遜、蘋果都來搞事情?谷歌亞馬遜蘋果
- 谷歌向亞馬遜echo下戰書:將獨立研發智慧音響谷歌亞馬遜
- 亞馬遜統治智慧音響市場 將推觸控式螢幕Echo亞馬遜
- Neato掃地機器人:支援亞馬遜語音控制了機器人亞馬遜
- 分析稱蘋果亞馬遜掌控自由音樂未來蘋果亞馬遜
- 亞馬遜用AI語音技術提供品牌服務(蘋果企業簽名)亞馬遜AI蘋果
- 一文看懂二叉樹的概念和原理二叉樹
- 一文看懂 GithubGithub
- 亞馬遜將推流媒體音樂服務 僅限Echo使用者使用亞馬遜
- 亞馬遜Alexa會成為智慧家居時代的Android嗎?亞馬遜Android
- Amazon SageMaker新玩法——定製你的語音識別模型模型
- Kaldi在語音資料庫timit上的聲學和語音模型訓練--1資料庫MIT模型
- 可怕!亞馬遜正在試圖通過Alexa控制我們的生活亞馬遜
- 一文看懂IP、UDP和TCP三者的關係UDPTCP
- 華為EMUI 10語音助手更新了!語音功能出現新玩法,小藝太智慧了UI