文字轉語音

OpenAI推出新語音模型，增強語音辨識準確度與語氣控制能力

OpenAI新一代語音轉文字與文字轉語音模型，透過強化學習與語音資料預訓練提升辨識準確度，並支援語氣控制功能。新模型在多語言環境中表現優異，有助於開發更自然且個人化的語音應用

2025-03-21

Spotify收購模擬《捍衛戰士》「冰人」聲音的AI公司

串流音樂平臺Spotify買下發展人聲模擬的AI公司Sonantic，以發展文字轉語音服務

2022-06-15

AI趨勢周報第186期：盲胞新選擇！微軟結合3D環繞音效和電腦視覺助盲胞與人互動

微軟發表一項AI原型系統PeopleLens，結合聲音和影像辨識來幫助全盲和弱視的青少年認識環境、與同儕互動；自己的錄音也能用！Google文字轉語音API支援自定義語音；知名飯店用RPA加速帳務處理作業，節省近8成人力成本；SAS臺灣：今年產品策略聚焦法遵科技和AutoML維運。

2022-03-19

Coqui釋出零樣本文字轉語音模型YourTTS，較傳統TTS模型使用更少訓練資料集

YourTTS模型能夠在多語言、多說話者和零樣本學習中，產生良好的結果，還可用於跨語言的語音轉換，並且使用比傳統TTS模型更少的訓練資料集

2022-01-05

| Custom Neural Voice | Azure | 文字轉語音 | TTS

微軟限量開放測試AI文字轉語音高階服務

自訂神經網路語音（Custom Neutral Voice）是Azure文字轉語音服務最頂級方案。標榜可因應不同使用情境，產生具有不同說話風格和情緒聲調的語音服務或是對話互動介面，像是有聲書或語音助理等

2021-02-04

| 臉書 | TTS | 語音助理 | 文字轉語音

臉書最新TTS系統可只用CPU即時生成語音

過去需要在GPU或是專用硬體，才能即時生成語音，臉書新的文字轉語音（TTS）系統只要用CPU，就能在不減損音質的條件下即時生成語音

2020-05-19

| AWS | Amazon Polly | 機器學習 | 文字轉語音

AWS文字轉語音服務Amazon Polly提供更真實的人聲發音

Amazon Polly使用新的機器學習技術，除了能提供更高品質的語音外，也新增新聞播報員風格語音

2019-08-01

| google | 語音轉文字 | 文字轉語音

Google AI語音服務大更新，不僅降價還新增7種語言和31種聲音

為了擴展AI語音服務的市場，Google除了加強語音辨識模型、語言支援數量和聲音種類之外，也調整了語音服務的價格

2019-02-22

| Alexa | AWS | 講話風格 | 文字轉語音

Alexa現在能用播報員的講話風格唸新聞了

Amazon智慧音響搭載的語音助理Alexa現在可以像新聞播報員唸新聞給用戶聽了，語音助理的語音輸出是透過文字轉語音的技術，將單詞序列轉換為仿真人的聲音，自2014年推出Alexa後，Amazon就不斷地優化機器學習模型，讓語音聽起來更加自然。

2019-01-17

Google結合TTS和語音生成技術，為年度熱搜議題打造測驗遊戲

Google近日為2018年度熱門搜尋趨勢打造了第一個測驗遊戲Game of the Year，遊戲將會問玩家20道關於熱門搜尋的問題，最後會根據回答正確率給予分數，該測驗遊戲結合了Google Cloud多項技術，包含文字轉語音、語音生成技術WaveNet。

2019-01-16

Amazon新一代文字轉語音模型，要讓Alexa說話更有風格

現在市面上的語音助理說話風格總是一成不變，Amazon為了讓語音助理更貼近真人，近日發表了最新的文字轉語音系統，透過生成神經網路，經過幾個小時的錄音檔訓練，就能學會新聞播報員的說話風格。

2018-11-20

| google | WaveNet | 文字轉語音

Google發表雲端文字轉語音服務，人聲發音更好、更自然

開發者現在可以將雲端文字轉語音服務用在語音回應系統，像是呼叫中心（IVRs），也能在電視、汽車或是機器人等物聯網裝置，建置語音回應功能，或是在以文字為主的媒體上，將文章與書轉成音訊。

2018-03-28

iThome 研討會

IT EXPLAINED 數位轉型攻略 VIII

GenAI 加速企業創新落地，更需要全新 IT 戰略

日期: 即日起~01/27

DevOpsDays Taipei 2026 即刻開放徵求講者

DevOpsDays 不只是一場技術研討會，更是一個讓技術知識流動、社群共好的平臺。在技術百鍊成鋼的路上，你的實踐經驗就是最珍貴的寶藏！立即報名成為講者，讓我們一起推動臺灣 DevOps 走得更遠！

日期: 2026 年 6 月 25-26 日（四 - 五）