在業務領域中產生重大影響的5種人工智慧技術

AIBigbull2050發表於2020-06-17

企業需要了解影像識別、語音識別、聊天機器人、自然語言生成、情感分析如何改變其業務的運營方式。

人工智慧技術正在將其自身融入業務的各個方面。重要的一些人工智慧技術包括影像識別、語音識別、聊天機器人、自然語言生成和情感分析。

需要明確的是,每種型別的人工智慧技術都代表廣泛的類別,通常包括數十個甚至數百個基礎元件。反過來,通常將這些元件重組為更復雜的應用程式,為企業創造價值。

例如,百貨商店人工智慧機器人可以在工作中使用影像識別、影片和語音識別技術。影像識別軟體將使其能夠檢查貨架上庫存的位置、價格和數量;影片將幫助其避免遇到任何障礙,並確定其在商店中的位置;語音識別元件將使其能夠引導和娛樂客戶。

為了取得這種成就,這些業務中的人工智慧技術通常結合了針對整個任務的特定部分量身定製的各種演算法和技術。它們包括符號處理、統計分析、神經網路等等。

以下是對五種人工智慧技術的深入闡述,這些技術隨著時間的推移而發展,從而極大地改變了企業處理、分析和生成資料的方式。




1.影像識別

企業使用影像識別的各種方式包括:在工廠生產線上進行自動檢查,在保險中生成損壞估計,在影像中識別物體,對人員進行計數,控制製造過程,檢測諸如顧客進入商店等事件以及生成真實世界的模型。

人工智慧技術必須找到一種方法,採用各種人工智慧演算法可以處理的數字來描述世界。在視覺方面,研究人員發現瞭如何將一張圖片劃分成一個畫素網格,這樣每個畫素都可以表示為一個數字。在早期,採用一個數字來描述每個畫素的亮度。後來,人們發現可以用三個或更多的數字來描述每個畫素中不同顏色的亮度。

20世紀60年代,研究人員開始探索如何使用原始形式的光學字元識別(OCR)技術的軟體影像識別功能來識別數字文件中的字元。其他研究人員開始探索基於影像的場景解釋技術,試圖從二維影像重建三維影像。多年來,這些技術已成為機器視覺行業工具包的一部分。

後來,研究人員發現可以將影像識別組織為一個分層過程,以使其更易於解釋日益複雜的現象。例如,黑色和白色畫素可能被識別為線條和曲線,而線條和波浪形又被識別為數字的一部分。訓練演算法來學習基於這些曲線圖案而不是每個畫素的亮度來解釋字元的方法要容易得多。類似地,更容易根據影像是否包含兩隻眼睛和適當形狀的耳朵來確定影像是否是貓,而不是根據每個畫素中顏色的原始亮度來確定。


這種處理方式有望推進影像識別領域。然而直到2012年左右,隨著AlexNet(一種設計用於支援影像識別的八層卷積神經網路)的發展,研究人員才發現如何擴大這個過程以識別成千上萬種不同型別的物體。

諸如AlexNet之類的深度學習技術的優點在於,該模型可以自動學習以不需要人類以程式設計方式指定每個步驟的方式來執行各種影像識別任務。研究人員指出瞭如何將神經網路應用於不同型別的問題,該功能也促進了深度學習在其他型別的應用程式中的使用。

如今,影像識別用於識別貨架上的產品、圖片或影片中的人物,生產流水線上的缺陷以及自動駕駛汽車在街道上遇到的物體。隨著冠狀病毒疫情的出現,很多企業正在開發應用程式以監視社交距離的規則。

對於企業領導者來說,一個關鍵的見解是,通常有可能透過在應用程式中使用多種型別的影像識別來創造更多的價值。例如,智慧文件處理和文件智慧結合了一組人工智慧技術,其中包括自然語言處理和機器學習,以捕獲難以識別的格式中的資料並將其分類。與光學字元識別(OCR)結合使用,智慧文件處理可以分析文件的視覺佈局,以確定哪個部分代表產品、發票金額或銷售條款,並將該資訊提供給其他業務應用程式。

值得注意的是,企業中大多數影像識別應用程式都是高度場景相關的。供應商和研究人員經常宣傳新的影像識別改進,例如在識別腫瘤方面擊敗了醫學專家的軟體。但是在實踐中,僅當影像以正確的角度捕獲時,人工智慧才可以使用一組特定的裝置來處理這些放射線影像,而人類則善於分析從許多不同角度捕獲的各種影像。

研究人員還發現,在這些影像識別應用程式的一些實現中也潛藏著偏見。為了減少偏見,專家建議對這些應用程式進行資料訓練,這些資料代表將要處理的特定型別的影像。

2.語音識別

需要多種演算法將語音轉換為文字並準備進行數字處理。儘管語音識別系統變得越來越好,但是即使是當今比較好的語音識別系統也仍然容易出錯,因此在安全關鍵型應用(例如醫療資料捕獲)中需要進行一些驗證。

貝爾實驗室的研究人員於1952年開發了首個用於識別單個數字的語音識別系統。到1962年,IBM公司推出了Shoebox機器,該機器可以理解16個單詞。到1980年代中期,研究人員開始使用統計技術(例如隱馬爾可夫模型)來開發可以理解2萬個單詞的應用程式,但其單詞之間會有停頓。第一款消費者聽寫產品Dragon Dictate於1990年釋出,可以根據語音自動鍵入文字。然後,AT&T公司推出了一種語音識別應用程式,該程式無需人工即可路由呼叫。這些早期的系統或者具有適合特定環境的小型詞彙表,需要由單個聲音進行大量訓練。



研究人員從2010年開始發現了將深度神經網路應用於語音識別的方法。這一增長的主要推動力之一是需要找到更好的方法來代表不同型別智慧音響的聲音特徵。這要求探索出更好的方法,將原始音訊資料轉換為人類習慣於收聽的獨特聲音(稱為音素)(例如,“汽車”一詞中的“c”)。

研究人員還將基本的語音識別結果與更好的場景結合起來,以區分同音異義詞(bear/bare)。雲端計算服務現在提供了各種核心的語音轉文字服務,開發人員隨後將其融入各種企業工作流程中。

基本的語音識別功能透過雲端計算服務(如微軟Cortana、谷歌Now和蘋果Siri)嵌入到現代智慧手機和電腦中。亞馬遜公司利用語音識別技術推出了一種新的方式,透過Alexa語音服務在智慧手機之外連線網際網路。這些服務通常在雲平臺中完成繁重的工作。最近,谷歌公司透過開發更有效的演算法來提高標準,這些演算法可以在其Pixel手機上本地執行語音識別應用程式。

語音識別技術在企業中的使用正在增加。一些供應商還開始開發用於自動記錄電話會議和現場會議的應用程式,以達到合規目的或更好地記錄決策過程。自動化語音識別還可以幫助監視呼叫中心的活動,以確保工作人員遵循正確的程式,從而使管理人員不必聽到每個呼叫。語音識別應用程式也正用於為國際旅行者自動進行語言翻譯。這項人工智慧技術的其他商業應用包括家庭自動化、影片遊戲互動以及將影片編入索引的自動隱藏式字幕。

3.聊天機器人

對話式人工智慧技術允許應用程式以自然的方式與人類互動。第一個聊天機器人Eliza於1964~1966年在MIT人工智慧實驗室開發。最早的聊天機器人在詞彙量和可以允許的互動型別方面受到限制。這些應用程式使用決策樹,該決策樹根據查詢或使用者對問題的答案沿各種路徑進行操作。在20世紀80年代到90年代,這些技術擴充套件到了自動電話應用程式,在其中,透過使用IVR技術的撥號音響應或簡單詞彙來控制互動。

最近,由於用於解釋和響應文字查詢的更好的自然語言處理技術,以及與其他服務的更好整合,使得企業能夠更容易地自動設定能夠響應常見問題的聊天機器人,聊天機器人的應用程式激增,接受命令或自定義對給定使用者的響應。最近聊天機器人可應用程式的一個關鍵見解是開發用於表示使用者意圖和適當響應的應用程式程式設計框架。

面向外部的聊天機器人可以幫助實現客戶互動的許多方面的自動化。它們還允許企業以一種更具吸引力的方式跨各種社交媒體渠道(例如Facebook)進行推廣。


企業的應用程式開發和部署方面已經看到了使用聊天機器人技術的爆炸式增長,該技術將聊天機器人與可自動配置應用程式和基礎設施並生成報告的操作工具結合在一起。聊天機器人整合使團隊可以記錄其流程,從而更輕鬆地應對重複出現的問題,或者確定過去特定流程的執行方式。

聊天機器人工具開始進入業務的其他方面,以幫助記錄部門內部或部門之間的各種通訊,特別是隨著越來越多的公司採用Slack和Microsoft Teams等訊息傳遞應用程式。財務部門可以使用聊天機器人來生成和跟蹤重要業務指標的狀態。銷售團隊可以使用聊天機器人收集有關關鍵客戶的資料。

聊天機器人還可以幫助促進其他型別的內部互動。例如,員工可能會詢問人力資源聊天機器人,以詢問有關其福利狀態的問題或要求休假。企業還使用聊天機器人來自動化與IT系統管理的互動,以處理簡單問題或自動分類更復雜的問題。

4.自然語言的產生

隨著資料量的增長,可能很難為員工或客戶確定正確的資訊優先順序。自然語言生成(NLG)應用程式可以幫助查詢、組織和總結給定使用者的最適當見解。

根據業務用例的不同,這種人工智慧技術有不同的風格。自然語言生成開始作為商業智慧和分析應用程式的前端新增,作為Gartner公司創造的一個新的應用程式類別的一部分。這些技術結合瞭解釋純文字查詢和生成純英語分析的適當摘要的能力。例如,美國航空航天局(USAA)構建了一個自然語言生成(NLG)應用程式,以改進它向商業使用者提供的關於不同保險產品銷售情況的答案。

這種人工智慧技術的另一個特點是改進了向使用者展示產品資訊的方式。在這些型別的應用程式中,自然語言生成引擎可以根據使用者的偏好自定義產品的描述。例如,可能會向更多的技術使用者深入介紹諸如新手機耳機之類的產品的技術特性,而會向注重時尚的買家提供有關其外觀和感覺的審美描述。自然語言生成(NLG)還可以幫助改善將內容翻譯到新市場的方式。

Trulia公司正在使用自然語言生成(NLG)自動生成用於房地產列表的社群描述。自然語言生成(NLG)還被用於為美聯社製作基本的新聞文章。Esquire Singapore公司甚至精心製作了一本特刊,裡面刊載了人工智慧應用的故事。然而,這項人工智慧技術還處於起步階段,專家提醒企業和醫療等關鍵任務應用需要新型的質量控制。

儘管如此,企業仍可能會受益於自然語言處理框架的各種最新改進。新的自然語言處理指標正在出現,以幫助企業評估給定框架的效用並改善自然語言生成(NLG)應用程式的這些實現。


5.情緒分析

人們在撰寫有關事件、品牌、政客和其他事物的文章時,通常會表達出不同的情感型別和強度。情緒分析領域始於20世紀50年代,當時市場營銷人員分析了書面檔案的語氣。但這是一個非常人工的過程。不過,現在幾乎每個人都在社交媒體、部落格、新聞評論、評論、支援論壇和與公司的通訊中留下了情感的數字痕跡。

包括自然語言處理、機器學習和統計在內的各種人工智慧技術都用於分析這些數字足跡的情感基調。這些工具有助於跟蹤產品或服務的更改如何影響客戶,而無需直接詢問人們。它也有助於密切關注競爭對手的產品和活動。

情緒分析的另一個用例可以識別所謂的品牌影響者,從而使企業與個人建立更牢固的關係,他們可以就如何改善服務或產品提供更好的建議。

情緒分析還可以幫助確定有關客戶或潛在客戶可能感興趣的事物的重要趨勢,以便企業可以改善其當前產品或建立新產品以滿足這些需求。企業還可以使用情緒分析來確定其品牌可能受損的特定原因,例如等待時間長、質量差或構思不佳。

企業在內部也在業務中使用這項人工智慧技術來幫助理解和提高員工計程車氣和福利。在這個用例中,情緒分析可以分析員工的職位,以幫助理解重要的問題或管理人員的變化可能對他們產生的影響。

更復雜的情感分析應用程式使用人工智慧來理解聲音和麵部表情所傳達的情感。該分析可以幫助識別支援電話期間的情緒變化,或評估顧客對商店貨架上新產品的看法。Netflix甚至嘗試使用面部表情情感分析來改進電影預告片。然而,一些研究人員警告說,情緒分析的這些應用可能會受到可靠性、特異性和概括性問題的影響。


【編輯推薦】







來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69946223/viewspace-2698907/,如需轉載,請註明出處,否則將追究法律責任。

相關文章