• 正文
  • 相關推薦
  • 電子產業(yè)圖譜
申請入駐 產業(yè)圖譜

ai語音功能是什么

2021/07/20
1184
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

硬件型號:天貓精靈 X5

系統(tǒng)版本:智能音箱系統(tǒng)

AI語音,即智能語音技術,以語音識別技術為開端,是實現人機語言的通信,包括語音識別技術(ASR)和語音合成技術(TTS)。

(圖片來源于互聯網

語音識別技術是指機器自動將人的語音轉成文字的技術,又稱Automatic Speech Recognition,即ASR技術。

語音識別是近幾年來發(fā)展最快的技術之一,隨著數據處理技術的進步以及深度學習技術的不斷發(fā)展,語音識別技術得到了質的飛躍,已廣泛運用于智能手機、語音智能交互等各個領域。

目前常用的語音識別技術方法主要有四種:(1)基于語言學和聲學的方法(2)隨機模型法(3)利用人工神經網絡的方法(4)概率語法分析,其中最主流的方法是隨機模型法,如動態(tài)時間規(guī)整(DTW),隱馬爾科夫模型(HMM)理論和矢量量化(VQ )技術等。

(圖片來源于互聯網)

語音合成(Text-To-Speech)計算機將機器內部的文字信息轉變?yōu)榭陕牰伊骼恼Z言輸出的技術。簡單來說,語音識別技術是人對機器的輸入,而語音合成則是機器的輸出過程。

人工智能領域,AI語音是最重要的入口之一。智能音箱并不是唯一的語音入口,語音交互能力正逐步向物聯網終端全面擴散。

語音交互作為人與機器進行交互方式的第三代,相比于前兩代(第一代通過按鍵來實現交互,第二代通過觸摸屏來交互)將會更加的智能與便利。未來在智能家居領域,AI語音被視為最適用的人機交互入口。

遠場語音識別應用方興未艾,行業(yè)龍頭搶占先機前景廣闊。語音技術的應用主要分為近場識別以及遠場識別。

目前主流所運用的語音技術主要是近場識別技術如手機智能語音等,技術相對成熟。遠場識別由于受到距離、噪音等因素的影響,是現階段語音技術的挑戰(zhàn)方向,包括智能家居、智能車載語音、智能音箱等。

(圖片來源于互聯網)

相關推薦

電子產業(yè)圖譜