AI 白皮書:贏家、輸家

AIBigbull2050發表於2019-10-15



引言:縱觀歷史,對企業界而言改變遊戲規則的始終是技術。製造商取代手藝人,工廠從製造商手裡接過接力棒,自動化和遙測技術取代大部分重複性的人力勞動。從個人計算機到網際網路和移動商務,在過去的30年間,全世界見證了數字經濟的崛起,數字經濟正迅速取代商品經濟。

很顯然,下一個最大的變化來自AI。應用型AI(applied AI)有望徹底改變一切:健康、金融、房地產、運輸及旅遊、製造、營銷及銷售、農業、能源、商業服務、決策乃至政治。它將把歷史分為AI前時代和AI後時代。自主機器人、與人類對話的計算機、自動駕駛汽車以及數百種語言的自動翻譯:人類想象力的這些產品現在變成了現實。


AI 白皮書:贏家、輸家



又由於AI仍處於起步階段,本地化和語言服務專業人員需要準備好在這種環境下工作。大門是敞開的。

本報告包含的資訊

  • 長話短說
  • AI是根本性變革
  • 自然語言處理方面的機會
  • 當心:AI不是必然會成功的道路

長話短說

  • AI是變革性的:
  • AI從未像現在這麼普及——我們目睹機器學習和AI平臺遍地開花。
  • 工程師人數在增加。
  • 大家緊跟AI潮流。
  • 84%的企業在採用AI,因為它們認為AI可以帶來競爭優勢。
  • 自然語言處理:
  • 自然語言處理(NLP)是AI的子領域,涵蓋計算機和人類語言之間的互動。
  • 它包括語音識別、自然語言理解、自然語言生成和機器翻譯。
  • 使用場景從資訊檢索、情緒分析到聊天機器人,不一而足。
  • AI專案失敗的原因:
  • 不切實際的期望、採用方面的高準確度閾值、沒有關注業務目標、缺少高質量資料。
  • 幾個成功因素:
  • 傳達和設定期望的能力、高度關注切合實際的目標和使用場景、多語言資料質量及注重維護以及外包、外包、外包。

AI是當今商業界最重大的根本性變革

每個人都能享用的資源

自2000年代初深度學習問世以來,AI已變得更普及了。現在准入門檻更低。AI和機器學習不再是科學家、程式設計師和深度技術開發人員的範疇,如今已為普通人所用。

這是最近的動向。2015年,亞馬遜推出了Machine Learning,微軟推出了Azure ML。2018年,谷歌推出了AutoML。科技巨頭的這些線上工具提供了訓練定製AI模型的能力。標準化API使得將AI連線到任何軟體或應用程式變得相當簡單。用於試驗的沙盒帳戶通常是免費的,啟動跟註冊一樣容易。較新的版本帶來了構建AI的拖放式介面,因此從理論上講,連孩子也能構建AI。

機器學習和AI培訓課程數量激增,大學、線上學習平臺以及Facebook、谷歌和微軟之類的公司開設課程。培訓計劃的大部分是免費的。有眾多的機器學習會議及程式設計馬拉松、社交媒體組織、幫助網站以及當地社群,很容易獲得幫助。這意味著機器學習工程師的人數將在3至5年內從2017年的估計30萬人增加到數百萬。這是科技巨頭應對人才短缺這個難題的方法之一。

對於不希望依賴科技巨頭、更喜歡自己動手做的人來說,神經網路程式碼已經開源。最好的工具包可在Github上免費下載。使用者要了解程式設計,並能夠區別卷積神經網路和生成式對抗網路。不過,這與從頭開發機器智慧不一樣,它更像是樂高積木。

日益普及意味著AI現在是任何人的寶貴資源,而不是專供高高在上的常春藤聯合會名牌大學的學生和谷歌天才使用。對於從事語言服務業的人來說,這個訊息令人振奮。

本地化的機會

今天開發的AI以英語為主。

開發AI的專家通常從單一語言的角度出發。IT工程師和資料科學家使用英語進行技術交流,並將英語帶入到使用者交流。嘗試AI的市場營銷、支援和產品專家專注於在其領域的應用。與往常一樣,本地化是事後才想到的。

實際上,客戶及其資料使用多種語言,在AI開發的早期階段利用本地內容蘊含大好的機會。

AI 白皮書:贏家、輸家

不要等!找到貴公司的AI計劃,在早期階段與領導者合作以新增全球視野。分享功勞。

超越神經機器翻譯

擁有本地化背景的人經常陷入將AI與神經機器翻譯(NMT)劃上等號這個陷阱。一開始,機器翻譯(MT)一直是AI的典型應用,也是最惹眼、最熱議的話題。

AI 白皮書:贏家、輸家

機器翻譯的演變

與其前身一樣,如今NMT是幾乎各種語言服務的驅動力,將來可能更是如此。它對語言服務行業具有深遠的影響,但仍存在一些挑戰。

AI變得日益普及時,NMT仍面臨一道障礙

雖然總的來看,NMT基本上比SMT更勝一籌,並取代了SMT,但在技術要求和操作複雜性方面仍相當昂貴且具有挑戰性,因此大多數客戶無法享用。此外,NMT絕非易事。 NMT不僅需要大量資料,所需的底層基礎架構和知識也非常繁重、充滿挑戰。

因此,迄今為止,NMT舞臺上有一個主角、有兩個配角以及爭取上臺的幾個跑龍套的演員。

NMT效能不可靠

實際上,除了公共基準測試方面顯示優異的效能、部署中迅速採用和穩步改進外,還存在效能不佳的報導,比如系統在資源匱乏的條件下構建,這證實NMT系統在本領域外質量較低。這意味著學習曲線在訓練資料的數量、最重要的是質量方面可能很陡。為了正確處理資料,需要的不僅僅是基本技能,從評估所需的技能入手(評估是一項艱鉅的任務)。對於NLP應用和麵向長尾語言的NMT而言,這一切描繪的場景更黯淡了;如果沒有適當的技能和優秀的大量資料,需求無以為繼。

NMT對使用者(甚至操作員)並不友好

此外,NMT系統仍難以解釋。人工神經網路可能最廣為人知的缺點是黑盒子特性,這意味著你永遠不知道它們如何、最重要的是為何得到某個輸出。這使得任何改進都極其複雜、隨機。

不像你想的那樣受歡迎...

有時語言服務業的每個人似乎都在談論神經機器翻譯,這讓我們相信它已被廣泛採用,但事實未必如此。77%以上的企業並未廣泛使用神經機器翻譯,不過許多企業有興趣試行新計劃。

AI 白皮書:贏家、輸家

上述資料取自對企業本地化經理的行業範圍調查,評估在各自的計劃中如何使用(或不使用)NMT。

有人在晉升

高管們認為,AI是業務驅動力和戰略性差異化因素,是對公司未來的一項關鍵投資。 Statista的調查發現,84%的企業在採用AI,原因是它們認為AI帶來競爭優勢。在這種環境下,許多高管渴望投資於任何有望發揮AI力量的計劃。

這為這些公司的經理們提供了一個新的機會,可以推動個人和團隊目標在所在企業內的實現。通過積極擁抱和引導對AI的這股熱情,經理們將引起高層管理班子的關注,從而讓他們更有機會實現個人和職業目標。

換句話說,AI不僅為企業帶來了戰略性差異化優勢的機會,還為那些企業內的個人帶來了機會。有興趣利用這些機會的專業人員會完全接受這個新現實。

自然語言處理方面的機會

自然語言處理(NLP)是AI的子領域,涵蓋計算機與人類語言之間的互動,尤其是計算機如何處理、解析和理解自然語言。自然語言處理包括語音識別、自然語言理解、自然語言生成和機器翻譯。

結合資訊檢索、機器學習和情感分析等AI技術,NLP為在客戶互動、資訊監控、資料探勘和專家系統等領域創造突破性機會奠定了基礎。NLP讓專業人員得以查詢資訊,並將主題領域的集體知識運用於個別情況。

讓科技巨頭和專業公司應對根本性挑戰,比如使AI易於使用、讓定製和部署更快速更省錢、提高AI的準確性,以及培訓足夠多的機器學習工程師以滿足需求。對於大多數企業而言,它們需要回答一個關鍵的實用問題:如何將AI應用於主題領域。AI的重大承諾是大幅提升效率、發掘新的機會。你該如何實現?

NLP的十種熱門使用場景

AI 白皮書:贏家、輸家

自然語言處理在各行業的示例

機器學習和自然語言處理可應用於各行各業。以下是一些AI初創公司和老牌公司的AI實施專案。

  • 醫療

醫療AI廣泛使用影像識別和註釋進行診斷。如今湧現的預測專家系統可將患者症狀和醫療裝置的測量值相匹配。將資料從紙張和醫院記錄進入到結構化資料庫中以提高藥物效率是NLP面臨的一大挑戰。

AI 白皮書:贏家、輸家

挑戰:內容可以用英語生成並翻譯還是直接以每種語言生成?

  • 金融

金融業是AI應用廣泛的行業,大量使用預測系統。最近的動向包括新聞和社交媒體監聽,以瞭解對股票行情估值的影響。聊天機器人涉足個人理財和銀行業務,以促進自助服務,並提高銀行客戶支援系統的效率。

AI 白皮書:贏家、輸家

挑戰:針對諸多語言和地域,實施AI以加快盡職調查活動。

  • 法律

司法和法律兩個領域大量使用語言AI和機器翻譯。可以用一個資料庫來跟蹤和總結跨多個司法轄的新法規。檢察官掃描硬碟,以查詢多種語言的數字證書,這個過程名為電子資料開示(eDiscovery)。分析和專家系統旨在根據案件材料和法官個性預測法庭結果。

AI 白皮書:贏家、輸家

挑戰:在移 民法院提供自動虛擬口譯。

  • 媒體

媒體的核心內容是語言、語音和視訊。AI驅動的監控系統掃描新聞並進行解讀。字幕系統將口語實時轉換成文字,以進行進一步的分析和翻譯。影像識別系統識別螢幕上的演員和角色以匹配內容和廣告。

AI 白皮書:贏家、輸家

挑戰:電影和紀錄片中自動實現脣型同步。

  • 能源

能源分配和效率是能源行業運用AI來克服的兩大具體挑戰。由於更多的個人發電廠整合到電網中,加上風能和太陽能等間歇效能源,AI可以使能源分配更智慧化,有助於開發電能市場。

AI 白皮書:贏家、輸家

挑戰:使用AI來影響氣候變化。

  • 其他行業

幾乎每個行業都能得益於AI和NLP取得的進步,這些進步可用於跨多種語言的客戶互動、新聞/評論/社交媒體監聽、將零星分散的公司資訊轉換成結構化資料、確保客戶體驗更順暢的資訊檢索和語音UI。

AI 白皮書:贏家、輸家

當心:AI不是必然會成功的道路

並非所有想法都能生存,自然選擇在這裡適用……實際上,AI專案多半失敗。它們表面上看起來不錯,但在實際採用時,這些試驗系統無法提供有意義的結果,結果被丟棄。

據Forrester的調查顯示,去年AI的採用停滯不前。2017年,接受調查的企業中51%使用某種形式的AI,而在2018年這個比例僅增加2%:採用率為53%。因此,現在Forrester稱75%的早期AI專案不堪重負。Gartner給出了類似的預測:85%的AI專案不會為支持者帶來成效。

初創界到處是死亡的AI公司,原因是它們因產品質量低而在市場上沒有立足之處,或者其功能在現實世界中毫無用處。AI界一些最慘重的失敗屬於行業巨頭。

失敗的AI例子

以下是幾個代表性的失敗專案。幸好,這些公司有足夠的資源進行投資,這些失敗有助於將來的成功鋪平道路。

  • IBM的“Watson腫瘤解決方案”

(Watson for Oncology)投資6200萬美元后被取消

Watson AI Health沒有給醫生留下深刻的印象。一些醫生抱怨,它在癌症治療方面給出錯誤的建議,可能導致嚴重甚至致命的後果。據報導,IBM在該專案上花費數年時間、卻沒有重大進步之後,對Watson Health進行了精簡,解僱了該部門一半以上的員工。

  • 自動駕駛汽車首次致人死亡

優步的自動駕駛汽車在亞利桑那州的道路上撞死了一名騎車的人。車上的多個感測器並沒有發現前方的行人,駕駛員又沒有完全注意路況,甚至都沒有減速。自動駕駛計劃此後被暫停,9個月後才恢復。在一次類似的事件中,一輛特斯拉自動駕駛汽車徑直撞上佛羅里達州高速公路上的一輛牽引車掛車,未作任何避開的操作,駕駛員在事故中喪生。

  • 亞馬遜人力資源AI因性別偏見而被拋棄

據報導,亞馬遜人力資源部門在2014年至2017年使用基於AI的招聘軟體,以篩選簡歷、給出建議。然而軟體被發現更偏向男性求職者,這反映了男性在科技行業占主導地位的現狀。儘管投入了大量資金,該軟體還是被拋棄了。聊天機器人和其他形式的對話式AI存在類似的性別和種族偏見。

  • 翻譯耳機Waverly Labs和Google Pixel Buds獲差評

這些翻譯耳機被譽為是《星際迷航》中的那種通用翻譯器,使用者發現機器翻譯的準確性仍不足以與說另一種語言的人進行對話,它們在釋出後遭到了大量的負面批評。

為何AI專案成功和失敗。提示:環顧周圍。

具有諷刺意味的是,AI方面做到出眾的最大障礙是獲取人力資本的難易程度。

在企業方面,沒有足夠的領導人來運用機器智慧、識別使用場景、設定和管理期望以及可靠地執行AI專案。一些問題包括:

○不切實際的期望

人類方法和預測已發展了幾十年,而AI只學習了幾年,但高管們期望AI一開始就超越人類。

○採用方面的高準確度閾值

在允許人類失敗的地方不允許AI失敗。只有AI系統的質量超過接近人類的準確度閾值,AI系統才開始被廣泛採用。機器翻譯與人工翻譯相比就是個典型的例子。人工翻譯的平均編輯率為11%,而機器翻譯的準確度有望達到100%。

○沒有關注業務目標

AI專案常常先收集所有可用資料,然後尋找使用方式。問題在於,大多數資料中只有一小部分有價值。

○缺少高質量資料

所有先前的因素最終影響資料。AI模型的準確度和輸出質量、勝過人類並滿足業務目標的能力取決於資料集的大小和整潔度。專案啟動時,通常有太多的一般資料來自公共資料來源、來自網際網路上的解析網站、來自公司儲存的記錄,但無法保證這批資料裡面沒有汙染資料集的任何資訊。自動化測試可以檢測部分壞資料,但仍需要人來仔細檢查結果,並向機器饋送訓練資料,以調整機器、提高效能。

在生產方面,當今本地化方面的AI就是人力:通過標記、評估、收集和整合資料來訓練引擎。這些任務需要專案和供應商管理能力,市場營銷、支援和產品等部門的軟體工程師和中級經理常常缺乏這些能力。成功常常取決於能否有效地管理數百人組成的團隊,按時按預算地完成任務。

成功因素

1. 傳達和設定期望的能力

雖然機器學習的支持者主要是工程師,但他們也需要是外交官、有說服力的推銷員,與主管和客戶一起建立切合實際的時間表和質量方面的期望。

2. 高度關注切合實際的目標和使用場景

AI專案應努力解決實際的業務問題。建立在現有資料上或試圖建立市場可能導致尋找問題的解決方案:這種解決方案令人好奇,但商業上不可行。瞭解受眾及使用場景是關鍵。此外,著眼早期價值的專案比雄心勃勃的長期計劃有著更高的成功率。

3. 多語言資料質量和注重維護

永遠沒有足夠的高質量資料,有太多的壞資料。為了達到85%至90%的準確度,需要人工和仔細檢查。在整個專案期間致力於資料清理和維護。就像你處理翻譯記憶庫那樣。

外包、外包、外包

國際業務團隊知道如何外包——這就是本地化的本質。本地化中AI的未來是將人工任務外包給語言服務生態系統。



https://www.toutiao.com/a6747594074263388676/



來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69946223/viewspace-2659977/,如需轉載,請註明出處,否則將追究法律責任。

相關文章