Google AI語音服務大更新,不僅降價還新增7種語言和31種聲音

為了擴展AI語音服務的市場,Google除了加強語音辨識模型、語言支援數量和聲音種類之外,也調整了語音服務的價格

2019-02-22

Alexa現在能用播報員的講話風格唸新聞了

Amazon智慧音響搭載的語音助理Alexa現在可以像新聞播報員唸新聞給用戶聽了,語音助理的語音輸出是透過文字轉語音的技術,將單詞序列轉換為仿真人的聲音,自2014年推出Alexa後,Amazon就不斷地優化機器學習模型,讓語音聽起來更加自然。

2019-01-17

Google結合TTS和語音生成技術,為年度熱搜議題打造測驗遊戲

Google近日為2018年度熱門搜尋趨勢打造了第一個測驗遊戲Game of the Year,遊戲將會問玩家20道關於熱門搜尋的問題,最後會根據回答正確率給予分數,該測驗遊戲結合了Google Cloud多項技術,包含文字轉語音、語音生成技術WaveNet。

2019-01-16

Amazon新一代文字轉語音模型,要讓Alexa說話更有風格

現在市面上的語音助理說話風格總是一成不變,Amazon為了讓語音助理更貼近真人,近日發表了最新的文字轉語音系統,透過生成神經網路,經過幾個小時的錄音檔訓練,就能學會新聞播報員的說話風格。

2018-11-20

Google發表雲端文字轉語音服務,人聲發音更好、更自然

開發者現在可以將雲端文字轉語音服務用在語音回應系統,像是呼叫中心(IVRs),也能在電視、汽車或是機器人等物聯網裝置,建置語音回應功能,或是在以文字為主的媒體上,將文章與書轉成音訊。

2018-03-28

Google發表二代文字轉語音技術,讓AI講話不再有機械腔、自然程度媲美人聲

Google發布新一代文字轉語音Tacotron 2,結合原版Tacotron和音頻生成模型WaveNet,採用序列到序列模型,並使用語音範例和相對應的文字文本,來訓練Tacotron 2系統,讓新版Tacotron能夠發出媲美真人的發音。

2017-12-20

Google音頻生成系統WaveNet,能用AI模仿男聲、女聲或樂曲

DeepMind發布原始音頻生成模型WaveNet的相關論文,WaveNet是一套具備神經網路技術的真人語音模擬系統,能產生如女人、男人、音樂等多種音訊,也能學習人類說話時的呼吸、嘴唇動作等,還能加入情感或口音來增加語音多樣性。

2016-09-12