微信翻譯出Bug上熱搜,程式設計師又背鍋?

AI科技大本營發表於2019-03-05

作者| 伍杏玲

來源 | 程式人生(ID:coder_life)

60s測試:你是否適合轉型人工智慧?

https://edu.csdn.net/topic/ai30?utm_source=cxrs_bw

天擼了!昨天微信翻譯因為出Bug被網友送上熱搜,網友質疑微信在翻譯明星內容時,結果是近乎“惡搞”。

當輸入:“you play basketball like caixukun”時,微信翻譯為:“你的籃球打得真好。”

640?wx_fmt=jpeg

微信團隊對此回應道:“很抱歉,由於我們的翻譯引擎在翻譯一些沒有進行過訓練的非正式英文詞彙時出現誤翻,導致部分語句翻譯出現問題,目前正在緊急修復中。”

640?wx_fmt=jpeg

經過微信團隊的緊急修復,目前再次輸入該語句時,翻譯結果改為英文結果:

640?wx_fmt=png

 

翻譯軟體頻出Bug

 

這不是微信翻譯第一次“胡亂自主”翻譯了,之前曾出現過“ohh”的翻譯Bug。使用者在微信輸入“ohh”三個字母,點選翻譯,其結果為:留在我身邊。

這一浪漫翻譯被使用者譽為“表白神器”,並強烈隔空對話微信:程式設計師哥哥的浪漫我們收下了,這個Bug不要改!所以今天微信ohh的翻譯仍保留“留在我身邊”。

640?wx_fmt=png

與微信翻譯浪漫的Bug相反的事,谷歌翻譯的Bug顯得很“詭異”了。

去年七月,有人發現在谷歌線上翻譯輸入18個英文字“dog”,選擇將其從毛利文翻譯成英文時,結果竟是末日正在接近的預言:

      640?wx_fmt=jpeg

“Doomsday Clock is three minutes at twelve We are experiencing characters and a dramatic developments in the world, which indicate that we are increasingly approaching the end times and Jesus’ return.”(末日時鐘指向12點3分,我們正在經歷世界上的人物和戲劇性的發展,這表明我們越來越接近終結的時間和耶穌的迴歸。)

這是翻譯嗎?感覺是在通暗號呢?是不是覺得這機器翻譯訓練來訓練去,都快成精了!不僅會撩妹,還會吐預言!

幸好後來谷歌公司回應道,“這只是將無意義的話放進系統,再產生無意義的話的一種功能。”

潛臺詞是大家別那麼無聊,都散了吧。

 

 

機器翻譯的不足與未來

 

大家還記得幾年前的機器翻譯是如何嗎?生硬、語句不通、無法使用。

後來谷歌在其翻譯工具中增加了神經網路,使得機器翻譯的準確率有了大大的提高。但目前仍不能全然替代人工翻譯。

為什麼呢?

一位譯者表示:目前機翻仍會存在複雜句語法分析錯誤,斷詞錯誤,漏掉關鍵字、詞、定狀補語等。所以平常他們是讓機器做到初翻,再結合人工翻譯。

為什麼迄今為止一直沒有準確的語言翻譯?

Jacksonville大學西班牙語、拉美文學和國際研究副教授豪爾赫·馬吉福(Jorge Majfud)博士回答說:“問題是翻譯技術顧及‘整個’句子的能力還不夠。一個單詞的意思要放在句子中理解,句子的意思則要放在段落中分析,而文字的意思又取決於大背景下的含義,即文化和說話人意圖等。”

那為什麼機器翻譯如此艱難,但谷歌、微軟、百度、阿里、騰訊等大公司仍不費餘力地發展機器翻譯技術呢?

因為大家都想建造一座技術的“巴別塔”來實現不同語種間的無障礙溝通。例如讓不懂外語的人也能輕鬆出國,這需要翻譯工具;一家中國公司需要在國外開拓市場,也需要在翻譯。人工翻譯成本高、花費時間多,所以搶佔全球化市場迫切需要準確的機器翻譯。

但機器翻譯仍有漫漫的長路要走,畢竟我們人類自己溝通時,有時候也搞不懂對方在想什麼。不然也不會有這樣的送命題:“程式設計師真的覺得寫程式碼比女朋友重要嗎?”

大概在技術人眼裡:“從資料的角度上講,語言是一種野性的東西”,程式設計師的女朋友也是。

最後送大家一句話,試試看翻譯?

သင်သည်ငါ့ကိုကြိုက်ပါသလား?

參考資料:

智慧觀《機器翻譯真達到了專業水平?別慌!聽聽技術專家、語言學家怎麼說》

(本文為AI科技大本營轉載文章,轉載請聯絡原作者)

 

公開課推薦

本週四晚8點

640?wx_fmt=png

推薦閱讀:

                         640?wx_fmt=png

相關文章