不斷被取代的傳統職業:快速發展的智慧互動

火鍋小仙女發表於2019-05-13

前記

我們身邊有很多鮮為人知的職業,有些你可能知道,有些你可能不知道,更有一些,你或許聽過,卻從不明白它到底是做什麼的。

速錄師,就是這樣的一個職業。很多人覺得這個職業簡單,只要會打字就行,其實不然。要做一名合格的速錄師,不僅需要具備文化素質、心理素質、速度素質,更需要經過考核。心理和能力的考核+300字/分的速度+97%以上的準確率,再加上考慮口述言語間的邏輯關係,這樣加起來的速錄,你還會覺得簡單麼?

現在,類似速錄師這樣你還尚未了解的職業已經在被逐步取代。以速錄領域最艱深的律法行業為例,浙江高院早已在司法語音大資料解決方案的幫助下取代了傳統的書記員。庭審現場,記者親測系統同步記錄延遲不超過500毫秒,並能不時進行自動糾錯,準確率達97%以上。那麼,究竟是什麼產品才具有這樣強悍的實力?

應用場景

阿里雲智慧語音互動 是基於語音識別、語音合成、自然語言理解等技術,賦予產品“能聽、會說、懂你”式的智慧人機互動體驗。目前,阿里雲智慧語音互動已在庭審速記、線路檢測、智慧客服、語音質檢、直播字幕等場景落地。

庭審速記 :法庭庭審全程實時記錄,已覆蓋300+法院。
例:浙江省全省法院。

線路檢測 :全量通話轉文字,發現可能存在的電話詐騙。
例:智檢雲SaaS產品。

智慧客服 :傳統客服向智慧客服轉型。
例:螞蟻金服95188熱線、智慧客服機器人。

語音質檢 :語音轉文字後對服務過程進行質檢。
例:阿里集團客服、合眾人壽。

直播字幕 :實時直播字幕與監控。
例:雲棲大會實時字幕;奧點雲的落地合作。

不斷被取代的傳統職業:快速發展的智慧互動


語言模型自學習工具

語言模型自學習 是阿里雲智慧語音互動在全球首創的智慧語音自學習平臺,是能夠幫助使用者零基礎訓練業務的專屬語音模型。

在業務領域內通常會有一些特有的詞,預設識別效果較差時候可以考慮使用 泛熱詞/類熱詞 ,根據不同的業務場景具體選擇。透過將這些詞新增到詞表,就可以達到改善這部分詞的識別結果。

如果在領域已經積累了比較豐富的歷史資料,那麼就可以使用這些歷史資料對語言模型做定製的最佳化。透過使用語音自學習工具,可以透過可操作的介面上傳訓練語料文字,並選擇對應領域的語言基礎模型,透過對訓練語料做模型訓練,可以有效提高該場景的語音識別率,尤其是專有名詞和文字中的高頻詞彙,有較好的最佳化效果。

不斷被取代的傳統職業:快速發展的智慧互動 不斷被取代的傳統職業:快速發展的智慧互動


智慧互動大屏

智慧語音互動的一大應用是包裝成在各類公眾空間可實現人機互動的智慧大屏。其最大的特色是在強噪聲環境下的語音識別,同時具備免喚醒、長句子流式理解的能力。2018年3月,全球第一臺地鐵語音售票機正式落地上海南站和漢中路地鐵站,在地鐵真實嘈雜環境下,語音識別準確率超過96%,在解放人手的情況下完成了10秒完成取票的操作,而正常情況下人工取票一般需要30秒。目前,智慧互動大屏的其主要適用場景有:

  • 大交通 :地鐵售票、問詢,機場、景區、火車站問詢;
  • 新零售 :點餐、試衣鏡、試裝鏡,商超導覽導購;
  • 政企大廳 :政務、運營商、銀行、保險大廳問詢;
  • 其他 :醫院分診掛號和科室導航,圖書館找書。

寫在結尾的話

阿里雲智慧語音互動 獨有的語音模型訓練自學習平臺,加上其豐富的介面型別,及在電話、App、政法會議領域的經驗沉澱,給開發者在智慧人機互動開發上提供了莫大的助力。


原文連結

本文為雲棲社群原創內容,未經允許不得轉載。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69922229/viewspace-2644199/,如需轉載,請註明出處,否則將追究法律責任。

相關文章