智慧聊天對話機器人的對比

天府雲創發表於2018-12-18

陪聊機器人哪家強?小冰、小娜、小度,小i還是sir.

小冰、小娜Cortana、Siri、騰訊小鯨、出門問問、科大訊飛、度祕、QQ群qq機器人……哪家語音語義技術牛?

繼小冰、小娜、Rinna、Tay、Zo之後,微軟再推全新聊天機器人Ruuh

語音機器人:哪家強 度祕/小冰/Siri/小娜/小黃雞橫向評測!

天貓精靈方糖/小度智慧音響/小愛/小米音響mini對比,你更愛哪款?_ZNDS資訊 https://news.znds.com/article/32798.html

(天貓精靈是阿里與國內IoT領域第一平臺塗鴉智慧達成了合作,小度是自家的,小米小愛是第三方合作的,華為音響是自家的

IBM深藍、谷歌阿爾法狗、騰訊絕藝、搜狗汪仔、小度機器人和阿里大腦等等代表都是人工智慧的典範

帶著疑問,讓我們進如神奇的人工智慧智慧聊天對話軟體領域……

案例場景:圖靈機器人or百度AI+訊飛語音+樹莓派=語音聊天機器人

智慧對話裝置:百度智慧音響/華為/小米/藍精靈/天貓精靈/叮咚機器人

(代工廉價硬體+對話式人工智慧作業系統+AI模型軟體+雲端資料中心(訓練)+網路客戶端 一般市場就流行這個解決方案)

網頁/app/軟體智慧客服聊天:各家都有各自的智慧客服聊天助手,AI介面+選單+列舉式的服務

實體機器人、伺服器機器人和工業機器人:開源的機器人作業系統和硬體派別很多,開源社群很多iRobot

國內市場:小帥智慧機器人,阿爾法蛋機器人,麥吉機器人,未來小七機器人,智伴機器人,巴巴騰機器人等等

(在語音互動方面機器人都是差不多的。因為國內生產機器人的都不是自己研發語音系統的。所以很多品牌都是使用同類的語音互動系統。智慧機器人就是兩大系統,語音互動系統+資料爬取系統。 有上千的品牌和幾百元品牌有時候使用起來功能都差不多。國內語音互動是科大訊飛做的最不錯的。之前很多機器人都是使用他們的系統。 他們自己也生產的機器人就是阿爾法蛋機器人。 他們也把自己系統授權給很多品牌。 後面我估計很多品牌機器人為了搶佔市場把價位拉的很低,阿爾法蛋機器人賣700多, 人家用它系統直接300多賣。 2017年中旬科大訊飛就停止對外授權語音互動系統了。 國內很多品牌機器人就轉到國外語音互動系統NUANCE。 蘋果手機SIRI語音就是由這家公司提供的。 開始我還擔心這類語音識別是國外公司會不會反應比較慢。經過對比其實沒多大變化。硬體:從樂高時代過渡到多種品類)

各家公司的應用

機器人的鼻祖:圖靈機器人,目前所有的人工智慧模型和語音識別的模型源自這。

谷歌機器人

微軟小冰小娜

蘋果Siri

百度語音[小度/度祕(基於dureos)]

訊飛語音(很多智慧電視和車載語音助手用的這家)

微軟小冰是微軟推出的一款虛擬聊天機器人,有十幾種生活服務技能,小黃雞具有純聊天功能。圖靈機器人是一顆人工智慧機器人大腦,虛擬機器器人是圖靈機器人的應用場景之一,個人開發者可使用圖靈API快速創造屬於自己的虛擬聊天機器人。除此之外圖靈機器人具備超500種生活服務技能。

語音語義的現狀可以大致描繪人工智慧在工程界的應用情況。

有自主語音語義相關技術且可以在國內使用其服務的幾家公司有:出門問問、科大訊飛、雲知聲、思必馳、百度(度祕)、騰訊(騰訊小鯨)以及Google(Google Now)、微軟(小冰、小娜Cortana)、蘋果(Siri)。

我們先來看看這四款機器人的一些簡介。

語音機器人哪家強 度祕&小冰&Siri&小娜橫向評測

和語音機器人聊天,總是會帶來一些歡笑,四家智慧機器人各有特色,而聊天時各種歡樂的小冰,則更能引起大家的興趣。

現在智慧語音機器人也越來越向多元化發展,就比如我們今天評測的四款智慧語音機器人產品,四款智慧機器人雖沒有涇渭分明,但卻各有千秋,我們具體從以下四個方面來看:

“吃”方面,Siri和小娜都能為你提供附近餐廳的資訊,度祕則能夠為你提供整套服務,比如提供自家的外賣服務等,可以說做的更加周到。

“行”方面,如果需要叫車的話,Siri、小娜都會提出“超出其能力範圍”,而度祕則會直接提供兩種專車服務,相對來說更人性化一些。不過需要指出的是Siri在你提出一個目的地後,會直接跳轉蘋果地圖,並顯示規劃好的路線。

“玩”方面,在推薦電影時,度祕給筆者留下了很深刻的印象,不僅有最新的電影推薦,還有各種片種的推薦,順帶都有一些點評,十分不錯。另一方面,讓語音機器人唱個歌什麼的,也挺有意思,而且小娜真的令筆者震驚了,逼真的人聲唱出所點的歌曲,頗有一番風味。

“聊”方面,毫無疑問小冰賤賤的、更接地氣的回答,會引起得大多數人的興趣,小冰的回答有時也略顯機(nei)智(han)。作為小冰的姊妹,小娜表現也並不差,但並沒有小冰的回答更為有趣,其他兩個就略顯一般化。

                                                                   技術架構=語音系統和資料處理系統+硬體系統

總體來說,度祕連線到服務,Siri提供資訊,小冰就是賤賤的賣萌,陪你聊天,而小娜則是提供資訊和聊天兼有之。

【簡介】

從1945年到2015年,以人工智慧為題講述了許多很美的故事,模仿遊戲便是其實之一。但春冬輪迴,在人工智慧的世界裡,人們的幻想像一個小球一樣,被拋得高高,也註定摔得慘慘(1974與1987年兩次人工智慧寒冬)。

這一次,人們對人工智慧的幻想被扔得更高了。強人工智慧、機器毀滅人類的說法時常有。但這更像是預言家的說法,像陰謀論。目前的人工智慧還是基於邏輯與資料、沒有直覺,對情感的理解與創造力更是無從談起。

球被拋得高就一定會落得慘,甚至摔得粉碎。不過,做工程的人更謹慎些,要給這個球栓上一根繩子。這根繩子就是“從實際應用出發、從使用者角度考慮”。

語音語義的現狀可以大致描繪人工智慧在工程界的應用情況。有自主語音語義相關技術且可以在國內使用其服務的幾家公司有:出門問問、科大訊飛、雲知聲、思必馳、百度(度祕)、騰訊(騰訊小鯨)以及Google(Google Now)、微軟(小冰、小娜Cortana)、蘋果(Siri)。

到底哪家的語音語義技術牛?

微軟小冰屬於聊天機器人,主打人機對話,每週例常解鎖一種玩法。但微軟小冰不能提供太多的實質性的服務,比如查詢機票、查詢車票、叫車,這些出門問問卻能做到。

如何客觀的評價技術的優劣?在這個資訊交流特別頻繁的時代,被使用的人工智慧演算法大都來自學術界的公開成果,很難有一家公司擁有不屬於這個時代的技術。就從語音識別的角度上講,各個公司的識別率大都在90%以上(這個問題實際上要複雜些,比如方言識別率、生僻詞識別率等就有更多說法了)。當一家公司的技術只比另一家的好5%或者1%,使用者便很難感受到優劣,技術被應用的場景便成了重要的不同之處。

人工智慧語音語義系統的基本實現方法

這些公司的語音語義技術都和“雲”離不開關係。人工智慧系統按照一套邏輯推理程式,在海量的資料中尋找其認為最正確的答案。這就意味著,被使用的人工智慧系統其覆蓋的領域越廣,就越是對資料以及運算能力飢渴。小型離線裝置,如手機、家用電腦都無法滿足這樣的需求。解決辦法是搭建一個擁有超強處理能力以及海量資料的“計算機叢集”,並將其接入網路,也就是我們所說的“雲”。搭建了AI語音語義系統的雲就是AI語音語義雲,是這些AI公司的基礎設施。

搭建了智慧雲之後,還需要合適的語音輸入埠。這個埠可以來自公眾號、APP這類軟體,也可以來自音響、可穿戴智慧手錶這類硬體。

如何正確看待目前市面上知名的語音語義系統?

雖然人工智慧系統的概念很廣,具體到語音語義的概念還是很廣,因此這麼多類似但不同的人工智慧公司在不同方向上深耕。從使用者角度看,這些產品的不同之處還蠻大。

擅長搜尋查詢訊息的個人助理的有騰訊小鯨和出門問問

1、騰訊小鯨目前公開的資訊較少,主要被嵌入TOS系統。與Ticwear類似,TOS系統被搭載在智慧手錶當中。不過,小鯨的功能與其他語音助手類似,可以設定鬧鐘、查詢資訊,但不能像出門問問那樣直接叫車、訂咖啡。

有資料顯示,曾在GoogleBrain工作過的工程師創立了名為ScaledInference的公司,該公司的種子輪投資者就包括騰訊首席探索官David Wallerstein和騰訊本身。另外,也有訊息稱,騰訊沒有停止其他視覺識別產品的研發。

這有點像微信當年的研發。

2、出門問問主要做2C(面向消費者)硬體產品,其智慧手錶Ticwatch是國內銷量較高的一款全互動智慧手錶。出門問問的人工智慧語互動技術自成體系,包含語音識別、語音合成(TTS)、語義理解、垂直搜尋、智慧推送5個部分。其最大的特點是可以語音呼喚本地化生活服務,導航、看新聞、查天氣等都可以通過手機APP或者手錶實現。

最近,出門問問推出了內測版的“魔法小問”,要把人工智慧從查詢資訊——如“今天有什麼電影”——提升到提供完整服務,如直接幫助使用者訂電影票。這一點是其他智慧系統做不到的。

擅長連續對話的“聊天機器人”有圖靈機器人和度祕

3、圖靈機器人主要做2B業務,其語音語義系統與小冰很相似,是連續對話機器人。圖靈可以被嵌入微信公眾號、APP、網站或者智慧硬體,使用者可以讓它講笑話、做遊戲,也可以用它查快遞、查新聞。最近圖靈機器人接受了奧飛動漫的投資,走智慧兒童玩具的路。

4、度祕是百度推出的一款與小冰類似的連續對話機器人。另外,使用者可以在對話的同時,查詢“圖靈是誰”這樣的資訊——這藉助了百度的搜尋引擎。最近,百度推出嵌入了”度祕“的實體機器人”小度“。

還有一類人工智慧系統即不是助理也不是聊天機器人,而是被用於做智慧語音互動解決方案,他們有訊飛語音雲、雲知聲的、思必馳

2017年百度和渡鴉合作推出了三款人工智慧硬體產品——raven H、raven R和raven Q,其中raven H是渡鴉加入百度後推出的第一款智慧硬體產品,也是DuerOS 對話式人工智慧作業系統的標杆之作。(現在市場呼聲不大)

5、科大訊飛的“訊飛語音雲”包括語音合成、語音識別和搜尋、語音聽寫等技術,該雲對方言、生僻字的語音識別率較高。訊飛語音輸入法就是基於此雲開發的。科大訊飛“主要”做的是2B(面向企業使用者)服務,將自己的人工智慧服務授權給其他企業。

另外,科大訊飛在最近幾年也開始發力2C(面向消費者)的產品,比如智慧音響、錄音寶、錄音筆等硬體。可以看到,科大訊飛的產品多是智慧化的傳統產品,而非個人助理或聊天機器人。另外,科大訊飛偏向深耕“語音識別”,而非連續對話。

6、雲知聲主要做2B業務,方向是智慧家居和車載市場,這裡便有了與出門問問類似的“軟硬結合”的概念。

與“可穿戴裝置、手機及電腦上的智慧語音語義系統”不同,智慧家居語音系統的聲源可能很遠且被噪音包圍。也正因此,雲知聲把推廣的重點放在了“聲源識別、噪聲抑制、回聲消除”以及指令的識別上,而非對使用者意圖的理解上(語義理解)。

值得一提的是,在京東與科大訊飛宣佈“在一起”的時候,阿里與雲知聲就達成了合作。不過,最近一段時間,未有相關訊息。

7、思必馳與雲知聲的方向挺相似,為企業客戶提供智慧硬體語音互動方案,比如通過語音控制智慧硬體的開關。思必馳在車載領域的合作多一些,比如車蘿蔔。最近,思必馳又宣佈完成了融資,要把“智慧語音融進硬體”這條路走得更遠些。

8、小冰、小娜(Cortana)、Siri和Google Now

Cortana、Siri和Google Now,即是聊天機器人,也是個人助理。

微軟小冰與微軟小娜都基於必應搜尋和深度神經網路等技術,屬於2C產品。微軟小娜如今可以在iOS、Android、Window 10系統中使用,她更像一個祕書,可以打電話、發簡訊、發郵件以及查詢上一場曼聯的比分。但是微軟小娜在國內手機中的功能少很多,語音響應很慢。

微軟小冰作為一個對話系統,入駐於微信、微博等應用或者Windows 10系統中,她也可以查詢各種資訊。與小娜不同,小冰不可以呼叫電話等應用,她更像一個虛擬人物,可以陪使用者聊天(連續對話)、玩遊戲(基於影象識別等人工智慧技術)。

總的來看微軟小娜和小冰代表著微軟的兩個方向:小冰連續對話能力強,可移植行強,因此可以嵌入到微信、微博、美拍等應用中。小娜是Window 10配套的人工智慧系統,能夠呼叫Windows 10中的各種應用和資料,被視為個人助理。

Siri大家熟悉,是一款可以呼叫應用的聊天機器人。如今的Siri除了定鬧鐘、發簡訊以外,還可搜尋照片、播放音樂、提供建議。它或許不是最強大的,但更面向使用者。

Google Now在國內無法良好的使用,對中文的識別效果很差,中文版的能力也很弱。但是作為Google的產品,它天生便有了比其他人工智慧產品更多的資料、更好的資料探勘能力,這使得Google Now成為了一款“主動推送”能力很強的助理產品。

Google Now憑藉與Chrome瀏覽器、Gmail、Google日曆等等Google應用以及Android系統的“近親關係”,使得其可以實現很多其他產品做不到的功能。比如,語音解鎖、任意介面“OK,Google”喚醒、主動推送你喜歡的和你需要的“即時帖”。有人曾稱讚:

“早上醒來,我驚奇的發現Google Now居然直接告訴了我去兼職工作的路上所要花費的時間。但是我沒有設定,而且那不是我真正工作的地方。”

可以看到,Google從使用者的地理與實踐資訊中明白了他何時去何地兼職。但仍需強調,Google Now在國內的功能很少,而且實現一些即時功能,使用者必須把個人資料交給Google。

作為巨頭推出的產品,小娜、Siri和Google Now經常被媒體用來比較,但這種比較有些不太恰當。一方面,幾款產品中,只有Siri的易用性在國內不錯。另一方面,人工智慧系統要明白使用者的用意,必須獲取資料——越多越好。因此,人工智慧系統必須入駐更多的軟體或者平臺,獲取更高的許可權。小娜雖然入駐了Android與iOS,但她仍然是微軟的產品,在Windows 10上才有更好的易用性。同樣,Google Now與Siri分別是Android陣營與iOS陣營的產品,前者擅長挖掘資料、主動推送,後者擅長聊天、被動建議。

可以看到,這些語音方面的人工智慧公司有業務2B或2C的,選擇軟硬結合或者只做軟體解決方案,深耕智慧家居或者智慧穿戴。這些選擇,無分對錯或者好壞。但總體來看,人工智慧仍然沒有認知能力,人與人工智慧聊天又涉及到感情投入——這是一個超出自然科學範疇的問題。使用者對智慧家居的認知度還不夠高,相關產品不夠成熟、定價不夠親民。這樣看,搞智慧家居系統這樣的生態,似乎有點望得太遠。

因此,人工智慧在普通消費者身上的落地是否可以先在“一個點”上引爆,比如人工智慧系統作為助理,從僅可查閱機票資訊提升到可以提供訂票服務。

【參考資料】

1、基於訊飛語音,百度語音,圖靈機器人樹莓派的智慧語音機器人https://blog.csdn.net/u013372900/article/details/72785306

2、對話式機器人-百度AI-百度AI開放平臺 http://ai.baidu.com/solution/robot

      DuerOS官方網站 https://dueros.baidu.com/ (物聯網作業系統)

3、圖靈機器人-中文語境下高智慧度的機器人大腦 http://www.tuling123.com/

4、圖靈AI開放平臺-首頁 http://biz.turingos.cn/home

5、小冰、小娜Cortana、Siri、騰訊小鯨、出門問問、科大訊飛、度祕……哪家語音語義技術牛?-虎嗅網 https://www.huxiu.com/article/137733/

6、圖靈+百度語音 聊天機器人 移植小結 -  https://blog.csdn.net/xpp012/article/details/77665029

相關文章