語音識別技術竟然發展如此迅速
語音識別是指機器/程式接收、解釋聲音,或理解和執行口頭命令的能力。隨著人工智慧和智慧助手的崛起,語音識別已經得到了廣泛應用。
語音識別系統使消費者只需透過與之交談即可與技術進行互動,從而實現擴音請求、提醒和其他簡單任務。
語音識別的工作原理
計算機上的語音識別軟體要求將模擬音訊轉換為數字訊號,稱為模數轉換。計算機如要解密訊號,必須具有單詞或音節的電子資料庫或詞彙表,以及用於將該資料與訊號進行比較的快速手段。語音模式儲存在硬碟上,並在程式執行時載入到記憶體中。比較器依據A/D轉換器的輸出檢查這些儲存的模式,是模式識別的動作。
實際上,語音識別程式的有效詞彙量的大小與安裝它的計算機的隨機存取儲存器容量直接相關。如果將整個詞彙表載入到RAM中,與搜尋硬碟驅動器中的某些匹配項相比,語音識別程式的執行速度要快許多倍。處理速度也很關鍵,因為它會影響計算機在RAM中搜尋匹配的速度。
雖然語音識別技術起源於個人電腦,但它在移動裝置和智慧家產品的商業領域都獲得了認可。智慧手機的普及開啟了向消費者口袋新增語音識別技術的機會,而家庭裝置,如Google Home和Amazon Echo,將語音識別技術帶入了客廳和廚房。語音識別與日益穩定的物聯網感測器相結合,為以前缺乏智慧功能的許多消費產品增加了技術優勢。
隨著語音識別技術的使用變得更頻繁,以及更多使用者與之互動,有語音識別軟體的公司將擁有更多的資料和資訊,以供給支援語音識別系統的神經網路,從而提高語音識別產品的功能和準確性。
怎樣使用語音識別
隨著人工智慧、機器學習和消費者接受度的提高,語音識別的用途也迅速增長。從谷歌到亞馬遜,到蘋果的家庭數字助理都應用了語音識別軟體,以便與使用者進行互動。消費者使用語音識別技術的方式因產品而異,但可以包括將語音轉錄為文字,設定提醒,搜尋網際網路以及回答簡單的問題和請求,例如播放音樂、或共享天氣、交通訊息。
語音識別的優缺點
語音識別使消費者可以透過直接與他們的Google Home,Amazon Alexa或其他語音識別技術工具交談,以實現多工。透過使用機器學習和複雜的演算法,語音識別技術可以快速將您的口語轉換為書面文字。
雖然準確率正在提高,但所有語音識別系統和程式都會出錯。背景噪音可能產生錯誤輸入,可以透過在安靜的房間中使用該系統來避免。單詞聽起來也有問題,但拼寫不同,含義不同-例如,“hear”和“here”。有一天,使用儲存的上下文資訊可以在很大程度上克服這個問題。但是,這將需要比個人計算機中更多的RAM和更快的處理器。
語音識別的歷史
在過去的五十年中,語音識別技術呈指數級增長。最早可以追溯到1976年,那時計算機只能理解1000多個單詞。隨著IBM繼續開發語音識別技術,在20世紀80年代單詞理解量躍升至大約20,000。
消費者適用的第一款揚聲器識別產品於1990年由Dragon推出,名為DragonDictate。1996年,IBM推出了第一款可識別連續語音的語音識別產品。
21世紀下半葉推出智慧手機後,谷歌在iPhone上推出了語音搜尋應用程式。三年後,Apple推出了Siri,著名的語音識別助手。在過去的十年中,其他幾位技術領導者也開發了更多功能的語音識別軟體,亞馬遜的Alexa和微軟的Cortana-兩者都擔當了響應語音命令的個人助理。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/29829936/viewspace-2641917/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 語音識別技術
- 語音識別技術發展漸入佳境 AI企業奮力前行AI
- Google Brain推出語音識別新技術、面部表情識別助力商業再發展|AI一週學術GoAI
- 區塊鏈為何發展如此迅速 區塊鏈技術開發公司哪家好區塊鏈
- 百分點感知智慧實驗室:語音識別技術發展階段探究
- 語音識別技術有哪些應用場景?
- 科普丨一文看懂語音識別的技術原理
- Python是如何火起來的 為何發展如此迅速Python
- 馬志強:語音識別技術研究進展和應用落地分享丨RTC Dev Meetupdev
- 語音識別技術與政務資訊系統結合
- 2021車牌識別相機技術發展現狀
- 語音識別模型模型
- OCR識別技術—增值稅發票識別
- 自動識別技術的發展及應用領域
- 低延遲流式語音識別技術在人機語音互動場景中的實踐
- C# 10分鐘完成百度語音技術(語音識別與合成)——入門篇C#
- 聽懂未來:AI語音識別技術的進步與實戰AI
- 【Recorder.js+百度語音識別】全棧方案技術細節JS全棧
- Interspeech 2019 | 從頂會看語音技術的發展趨勢 01
- 歷經27年,人臉識別技術如何發展至識別精度達99.5%以上
- 語音情感識別--RNNRNN
- JavaScript的語音識別JavaScript
- 聲紋識別技術五大發展趨勢總結
- 從不溫不火到炙手可熱:語音識別技術簡史
- 影片美顏SDK工具中人臉識別技術的發展歷程
- 谷歌再獲語音識別新進展:利用序列轉導來實現多人語音識別和說話人分類谷歌
- 重磅公開!阿里語音識別模型端核心技術,讓你「聽」見未來阿里模型
- 重磅公開!阿里語音識別模型端核心技術,讓你“聽”見未來阿里模型
- 影像識別技術
- OCR識別技術
- 表格識別技術
- 樹莓派語音互動--語音輸入識別樹莓派
- InnoDB併發如此高,原因竟然在這?
- 深度瞭解語音識別之發音詞典及語音資料採集標註
- 人工智慧技術走向成熟,AI語音行業迎來廣闊發展前景人工智慧AI行業
- ASR-使用whisper語音識別
- 人工智慧 (08) 語音識別人工智慧
- Swift-語音識別、翻譯Swift