圖片來源: 

Google

日前,Google推出旗下雲端語音辨識API(Cloud Speech API)正式版(GA),Google雲端語音辨識服務能夠即時辨識80種以上的語言,轉換成文字,連正體中文也可以辨識。

Google在2016年夏天釋出雲端語音辨識API公開測試版,現在終於推出正式版,提供雲端開發人員使用。

而雲端語音辨識API採用與Google Now、Google搜尋及Google Assistant相同的語音辨識技術,根據Google,雲端語音辨識API是幾款預先訓練機器學習模型(Pre-Trained Machine-Learning Model)的其中之一,可以用來執行如影像分析、圖像分析、文字分析和動態翻譯等常見的任務。

在正式版的雲端語音辨識API,Google加強了長度較長的音訊檔案轉錄精準度,以及新增支援WAV、Opus和Speex檔案格式。Google也聲稱,新版語音辨識API比舊版的批次處理速度快3倍。

另外,目前已有廠商採用Google雲端語音辨識API,根據Google官網,美國德州的電話語音SaaS開發商InteractiveTel採用Google雲端語音辨識服務,透過即時的語音轉文字,來分析業者與顧客在電話中的互動,以協助業者提升銷售業績。


Advertisement

更多 iThome相關內容