AI趨勢周報第86期:微軟發表文字轉語音新成果,只要少數樣本就能訓練出準確度99.84%的模型

微軟發表一款文字轉語音AI,只用共20分鐘長的200個音頻樣本及其文字檔,就開發出準確度達99.84%的模型。另一方面,三星近日發表一項AI研究,只需幾張臉部表情的影像,就能讓靜態的人物肖像開口說話。此外,日本平價眼鏡連鎖品牌JINS宣布引進JINS Brain AI智慧判讀服務至臺灣分店,來幫臺灣消費者「挑眼鏡」。

2019-05-29

Google AI語音服務大更新,不僅降價還新增7種語言和31種聲音

為了擴展AI語音服務的市場,Google除了加強語音辨識模型、語言支援數量和聲音種類之外,也調整了語音服務的價格

2019-02-22

AWS自動語音辨識服務Transcribe推出即時語音轉文字功能

最近AWS公布自動語音辨識服務Transcribe,推出即時語音轉文字功能Streaming Transcription,讓使用者上傳一段語音到服務中,就能回傳即時辨識的文字稿

2018-11-21

Google為影片、電話和虛擬助理量身打造語音辨識模型,提高語音轉文字準確性

Google最近更新了語音轉文字的服務,為影片、電話和虛擬助理的語音互動模式,打造專屬的語音辨識模型,要讓語音轉文字服務更加準確,此外,還加入了自動下標點符號的功能

2018-04-10

微軟用語音辨識將講課內容即時轉成文字,讓聽力受損學生學習無障礙

聽力受損的學生現在上課也有新的輔助工具了,微軟透過自動語音辨識技術,將教授於課堂上講述的內容,即時轉為文字,幫助學生更有效率學習

2018-04-09