微軟為Azure媒體服務(Media Services)加入即時語音轉錄文字的服務,開發者可以選擇在任何的即時事件,啟用即時轉錄功能,將音訊中的口語,即時地轉換成文字,強化影音串流資訊與觀眾的觀看體驗。

Azure媒體服務能被用來打造直播應用程式,開發者可以使用API來擷取、轉碼和動態封裝和加密即時影音,加上結合CDN服務,便能支援數百萬觀眾同時觀看直播。而現在新加入的語音轉錄功能,是Azure媒體服務第三版API加入的預覽功能,可為用戶的影音直播,加入即時的字幕。

語音轉錄文字是一個可選功能,開發者可以在任何Azure媒體服務的即時事件(Live Event)中啟用。微軟解釋這個功能的運作過程,即時的影音串流在送到Azure媒體服務後,該服務會擷取串流中的音訊,並且進行解碼,接著呼叫Azure認知服務語音轉文字API來轉錄語音,之後將產生的文字打包成適合交付的格式,格式將根據開發者使用的媒體串流協定而有所不同。

使用者能以用2.3.3或更高版本的Azure Media Player播放影片,觀眾也能在各種裝置的各式瀏覽器上播放,在行動裝置支援的部分,iOS的原生播放器已經支援該播放串流,而開發者要在Android上建置可以接受轉錄串流的應用程式,則可以使用影片播放NexPlayer SDK。目前這項服務僅在West US 2地區開放預覽。


Advertisement

更多 iThome相關內容