為了理解自然語言,聊天機器人還要走很多“歪路”

行者武松發表於2018-03-01

為理解自然語言,唯有慢慢的填坑。



上週,以先進的機器學習和自然語言處理技術見長的聊天機器人初創公司Talla推出了一款HR機器人。而就在近日,其執行長ROB MAY在某科技網站撰文,指出了一些聊天機器人在自然語言處理上面臨的問題,並表示,雖然自然語言處理技術能夠改善使用者體驗,但依舊面臨著各種技術挑戰。


為了理解自然語言,聊天機器人還要走很多歪路


以下是正文:


目前諸如Slack以及HipChat等聊天機器人的應用逐步增多,企業都在使用聊天機器人發揮更多功能。不少應用程式開發商都在試圖搶佔這個新的風口,特別是不斷加強對自然語言處理技術的研究,從而寄希望於通過該技術提升使用者體驗。

對於自然語言處理技術,我們已經投入很多精力來改進、來提升相關的使用者體驗。自然語言處理技術是一個新興的研究領域,儘管我們擁有一個強大的資料科學研究團隊,但對於該技術的研發還處於初始階段。目前來看,自然語言處理技術依舊不夠成熟,也不夠完善,相關的工程例項根本談不上良好的使用者體驗。

不久前,我們推出了具備自然語言處理功能的聊天機器人Task Assistant,超過700家公司使用了該產品,產生了不少相關教訓:

1、人類語言極為不同

即便是關於簡單任務,人類與聊天機器人之間的互動也各有不同。在使用者語言中,充斥著各式各樣的誇張、隱喻、文字拼寫錯誤以及俚語,這些語言組織方式的存在使得聊天機器人需要大量的訓練。

Facebook語言技術開發團隊工程總監艾倫·帕克(Alan Packer)曾就如何構建機器翻譯技術進行過深入探討。雖然工作語言並不像使用者的日常用語一樣多樣化,我們可以通過所提供聊天機器人的型別對不同工作進行區分,從而對機器所能理解的語言加以限制。雖然自然語言處理技術仍非易事,但是通過針對不同工作使用者進行相應調整,能夠有效減少機器理解歧義引發的相關問題。

2、聊天機器人不能將所有不理解轉嫁給背後的人類客服

很多聊天機器人的背後都有人類干預,當機器無法理解使用者語言時,它們將相關問題轉給人類處理。這種處理問題的想法是通過這種方式訓練聊天機器人,直至其儲存了足夠多的資料以應對各種問題。但當使用者期望獲得更好的使用者體驗,並期望機器能夠完全理解其意思時,這並不是一個可持續性的解決方法。因為當使用者提出一個獨一無二的問題時,機器無法進行擴充套件。據統計,目前15%的谷歌搜尋都是獨一無二的,這意味著每天都有上億次的獨特查詢。對於聊天機器人來說,要回答所有的人類問題時相當困難的,因此單單依靠背後的人類客服並不是長久之計。


為了理解自然語言,聊天機器人還要走很多歪路


第一點已經不用多說了,畢竟在這一點上,多數人都已有了自己的認識,而關鍵的第二點卻一針見血的說出了當前的一個盲點所在。的確,按照當前的方法,聊天機器人也只是一個會模仿的提線木偶而已,並不能真正的理解自然語言,而這樣就代表著一切努力終將是白費力氣。


不過,在當前針對自然理解語言面臨的問題上,ROB還能夠提出這與眾不同的一點,如此新穎奇特,也難怪他的公司在機器學習與自然語言處理上能達到如此成就。

原文釋出時間:2016-08-13 22:16
本文作者:韓璐
本文來自雲棲社群合作伙伴鎂客網,瞭解相關資訊可以關注鎂客網。


相關文章