AT&T利用微軟自訂神經網路語音服務搭配AR和5G技術,在體驗店部署了一個真人大小的兔寶寶互動服務,它會呼叫消費者姓名來歡迎他們,並要求消費者幫忙尋找金蘿蔔。

微軟昨(3)日宣布AI技術為基礎的自訂神經網路語音(Custom Neural Voice)服務開放限量測試。

這項服務是Azure文字轉語音(text-to-speech,TTS)服務的一部份,提供200多種聲音及50多種語言選擇,並提供速度、聲調、發音、停頓等細部微調控制,可以將文字轉成生動自然的語音。微軟表示,自訂神經語音服務可讓App或品牌業者因應不同使用情境,產生具有不同說話風格和情緒聲調的語音服務,或是對話互動介面,像是有聲書或語音助理等。

微軟強調開發商或企業可以慣用程式語言來開發,且可選擇將這項語音服務以容器部署在雲端或邊緣網路上。

目前已經有瑞士電信(Swisscom)以這個文字轉語音服務,開發支援英、法、德及義大利文的語音助理。此外,AT&T也在達拉斯的體驗店,利用這項服務搭配擴增實境(AR)和5G技術,部署了一個真人大小的高解析度兔寶寶(Bugs Bunny)互動服務,它會呼叫消費者姓名來歡迎他們,並要求消費者幫忙尋找金蘿蔔。

自訂神經網路語音(Custom Neutral Voice)是Azure文字轉語音服務最頂級方案。目前除了它提供限量測試外,其他等級TTS服務皆已正式上線,費用以轉成語音的文字字元計算。針對Azure 用戶,以最基礎的1名共同連線用戶計算,標準等級每月前500萬個字元免費。20名共同連線用戶則為100萬字元4美元起跳。

熱門新聞


Advertisement