Google更新即時語音轉字幕App,新增聲音事件和儲存文本功能

針對聽力受損者的需求,Google準備更新安卓系統的即時語音轉字幕應用程式,新增顯示聲音事件、在裝置端複製和儲存字幕3天等功能

2019-05-17

IBM研究院發布自動為新聞播報生成字幕的AI模型

IBM研究院利用長短期記憶網路和聲學神經網路模型,搭配輔助的語言模型,開發出自動為新聞播報生成字幕的模型

2019-05-15

AWS利用喚醒詞語音資料過濾背景音,使Alexa辨識錯誤率降低15%

AWS透過喚醒詞聲音快照,並將接隨後的語音與之比對,接收到的語音若與喚醒詞吻合,則將該語音視為Alexa要接收的語句

2019-04-23

AWS研究團隊找到改善Alexa語音和聲音辨識的新方法

AWS最近發表了兩篇改善Alexa語音和聲音辨識的論文,透過機器學習處理Alexa語音辨識的問題

2019-04-19

AWS針對吵雜環境場景,用半監督式學習提升語音辨識模型準確度

AWS運用半監督式學習方法,讓語音辨識系統即使在吵雜環境依然能準確辨識大量詞彙的對話

2019-03-21

Google直接在手機部署機器學習模型,離線也能使用語音輸入文字

傳統語音辨識引擎使用的模型過於龐大,無法放在行動裝置上,Google參數化模型並在最佳化之後,能壓縮模型到只剩80MB

2019-03-14

Mozilla公開全球最大公共領域轉錄語音資料集

Mozilla共享了語音群眾外包計畫Common Voice最新的結果,一個包含42,000人共18種語言的1,400小時語音片段資料集。

2019-03-01

協助聽力受損用戶溝通, Google推出即時提供字幕和聲音增強App

Google在Android系統推出即時提供字幕應用程式Live Transcribe和聲音增強應用程式Sound Amplifier

2019-02-05

微軟正申請「無聲」語音輸入專利,悄悄話也能辨識

該語音輸入解決方案就能捕捉以極低的音量所發出的話語訊號,除了說話時的氣流方式可能需要練習之外,其它的說話方式就如同耳語一般

2019-01-07

AI趨勢周報第70期:韓研究員開發圖像轉換系統InstaGAN,讓照片人物長褲換短裙

韓國研究員用生成對抗網路(GAN)開發一套圖像轉換系統InstaGAN,可將照片中人物穿著的褲裝,轉換為短裙,或將風景照中的羊群,變成一群長頸鹿。

2019-01-03

臉書開源第一個使用卷積神經網路技術的端到端語音辨識系統

臉書的語音團隊釋出第一個全卷積的語音辨識系統,系統的可學習部分能僅由卷積層組成,而且效能可以與循環架構相當。

2018-12-26

AWS用新方法改良自然語言模型,讓Alexa語音辨識錯誤率降低15%

正確理解用戶所說的話,是語音助理服務致勝的關鍵,AWS最近透過新方法來改良自然語言模型,使Alexa的語音辨識錯誤率降低15%

2018-12-14