語音助手的前世今生篇之亞馬遜Alexa

声学在线發表於2019-02-14

亞馬遜的Alexa是一款語音啟用的互動式人工智慧機器人,或稱個人助理,人們可以透過它與亞馬遜的Echo、Echo Dot和其他亞馬遜智慧家居裝置通話。與Siri和Cortana一樣,Alexa的設計宗旨是響應許多不同的命令,甚至可以與使用者對話。

而在早期,Alexa只是一項專利內容,2012年8月31日,四名亞馬遜工程師註冊了一項基礎性專利,這項專利的內容日後最終演變成了Alexa。

一個男性使用者在一個安靜的房間裡說:“請播放甲殼蟲樂隊的Let It Be。”

一臺小型臺式電腦回答說:“沒問題。”

然後系統開始播放這首歌曲。

自此,Alexa誕生了。

說起Alexa,你們知道為什麼一個語音助手會叫這個名字嗎?

為什麼叫Alexa?

2014年11月,亞馬遜在釋出Echo的同時釋出了Alexa。 Alexa這個名字的靈感來自科幻電視劇和電影《星際迷航:原傳》和《星際迷航:下一代》中“企業號”飛船上的計算機語音和對話系統

語音助手的前世今生篇之亞馬遜Alexa

之所以選擇Alexa這個名稱,是因為它與X都有一個很難讀的子音,因此可以更高精度地識別,並且,這個名字也被認為會讓人想起亞歷山大圖書館

看來,起名字也是一門玄學!知道了名字的起源,接下來,給大家講講Alexa是如何運作的。

Alexa如何運作?

以Echo 為例,2014年亞馬遜推出語音助手Alexa時,Alexa起初是搭載在智慧音響Echo上的,而Echo本身也是亞馬遜毫無預警推出的一款比較“隨意”的產品。不料Echo大受好評,幾百萬消費者的家中都用上了智慧音響。

於是亞馬遜成立了兩個團隊,其中一個負責繼續開發Echo系列產品,例如Echo Spot、Show、Dot、Plus等等,另一個則專攻Alexa。

Amazon構建了一個自然語言處理系統,這是我們所見過的最容易與之互動的系統之一。使用者提出一個問題或發出一個命令,通常不需要問兩次。Alexa的成功部分依賴於內建在所有Echo裝置中的幾個非常敏感的麥克風。

語音助手的前世今生篇之亞馬遜Alexa

Echo裝置只有在使用者要求Alexa做某事時才會將使用者的聲音流到雲端,同時,使用者的請求也會顯示在應用程式中,如果不想留下記錄,可以刪除它們。預設喚醒詞是Alexa,但可以將其更改為“Echo”、“Amazon”或“Computer”。

一旦使用者說出了喚醒詞,麥克風就會接收你接下來要說的所有內容,並將其傳送到亞馬遜雲端計算機上進行快速分析,並給出相應的動作。

除了智慧音響以外,Alexa還能在別的裝置上執行嗎?當然可以!不僅可以,恆溫器、汽車、甚至連電燈都可以執行Alexa。

Alexa連線了多少裝置?

Alexa的成功,讓亞馬遜的野心迅速膨脹,亞馬遜建立了新部門Alexa語音服務,專門負責開發各種硬體和軟體,而這些產品的開發宗旨只有一個:把Alexa搭載到所有東西上,從電風扇到電燈泡、電冰箱甚至是轎車等一切物品。

該部門負責人Priya Abani說道:“我們的目標就是,無論在什麼地點、用什麼裝置,使用者都能召喚Alexa。我們的願景就是一個Alexa無處不在的新世界。”

亞馬遜基本做到了,亞馬遜裝置部門高階副總裁Dave Limp最近在接受媒體採訪時,公佈了 Alexa 的最新資料:“迄今為止,售出的預裝了 Alexa 的智慧裝置數量已經超過了 1 個億。”

目前已經有超過 150 種產品預裝了 Alexa,包括耳機、恆溫器、個人電腦、汽車和電燈開關。

逾 4500 家不同製造商生產的超過 28000 種智慧家居裝置與 Alexa 合作,Alexa 的技能數量已經超過 70000 種。

而在這70000 種技能中,除了實用技能,Alexa 還有些意想不到的好玩的技能。

Alexa有什麼好玩的技能?

Alexa的“Meow”功能可以發出“喵喵”的聲音,讓你在擼貓的時候與貓輕鬆地“交流”。

語音助手的前世今生篇之亞馬遜Alexa

Magic 8-Ball”功能類似於“答案之書”,當你有問題的時候問它,這個現代版的經典預言玩具將會給你答案。問任何一個是或否的問題,它都會告訴你“很有可能”,“我的回答是否定的”或其他更隱晦的回答。

Geek Humor”當你需要一個科學的雙關語時,極客幽默已經準備好了笑話。例子:“銫和碘喜歡一起看什麼節目?”答:“CSI。”

看完這些技能,技術大牛們是不是蠢蠢欲動,自己也想建立專屬於自己的技能呢?別急,這個是完全可以的!

如何建立Alexa技能嗎?

亞馬遜在2015年開放了Alexa技能的開發,任何人都可以使用免費的Alexa技能工具包(ASK)來建立Alexa技能。由於Alexa使用自然語言程式設計(NLP),那些想要建立一種技能的人不需要擔心複雜的語音識別。ASK工具還使新手更容易使用複雜的NLP思想。

聲學線上
聲學線上

相關文章