AWS在2016年的re:Invent大會上,發布了文字轉語音服務Amazon Polly,用戶只需要呼叫API,就能夠將文字轉為逼真的語音,現在AWS更新了這項服務,增加了神經文字轉語音(Neural Text-To-Speech,NTTS)以及新聞播報員風格功能。

Amazon Polly是一個完全託管的雲端服務,使用深度學習技術將文字流暢的轉成語音,並且也提供即時串流功能,當用戶將文字透過API傳送給Amazon Polly後,音訊會以串流的方式回傳,讓開發者以簡單的方式,就能在應用程式中加入語音功能。目前Amazon Polly共支援29種語言以及59種聲音。

現在AWS使用新的機器學習方法,釋出NTTS新功能以提升合成語音的品質,AWS提到,NTTS改善了兩個讓語音聽起來更加真實的兩個關鍵要素,除了語音更加自然之外,而且聲音表現更富有表現性,目前NTTS能以即時或批次的方式,將文字轉成11種聲音,分別為3種英國英語以及8種美國英語。

而透過NTTS技術,AWS在語音合成上加入了新聞播報員風格,而這能夠讓新聞或是部落格文章,以更真實的語音呈現。目前新聞播報員風格支援兩種美國英語的聲音。目前這些新功能在美東北維吉尼亞、美西奧勒岡以及歐洲愛爾蘭提供。


Advertisement

更多 iThome相關內容