AWS研究團隊找到改善Alexa語音和聲音辨識的新方法

AWS最近發表了兩篇改善Alexa語音和聲音辨識的論文,透過機器學習處理Alexa語音辨識的問題

2019-04-19

AWS針對吵雜環境場景,用半監督式學習提升語音辨識模型準確度

AWS運用半監督式學習方法,讓語音辨識系統即使在吵雜環境依然能準確辨識大量詞彙的對話

2019-03-21

Google直接在手機部署機器學習模型,離線也能使用語音輸入文字

傳統語音辨識引擎使用的模型過於龐大,無法放在行動裝置上,Google參數化模型並在最佳化之後,能壓縮模型到只剩80MB

2019-03-14

Mozilla公開全球最大公共領域轉錄語音資料集

Mozilla共享了語音群眾外包計畫Common Voice最新的結果,一個包含42,000人共18種語言的1,400小時語音片段資料集。

2019-03-01

協助聽力受損用戶溝通, Google推出即時提供字幕和聲音增強App

Google在Android系統推出即時提供字幕應用程式Live Transcribe和聲音增強應用程式Sound Amplifier

2019-02-05

微軟正申請「無聲」語音輸入專利,悄悄話也能辨識

該語音輸入解決方案就能捕捉以極低的音量所發出的話語訊號,除了說話時的氣流方式可能需要練習之外,其它的說話方式就如同耳語一般

2019-01-07

AI趨勢周報第70期:韓研究員開發圖像轉換系統InstaGAN,讓照片人物長褲換短裙

韓國研究員用生成對抗網路(GAN)開發一套圖像轉換系統InstaGAN,可將照片中人物穿著的褲裝,轉換為短裙,或將風景照中的羊群,變成一群長頸鹿。

2019-01-03

臉書開源第一個使用卷積神經網路技術的端到端語音辨識系統

臉書的語音團隊釋出第一個全卷積的語音辨識系統,系統的可學習部分能僅由卷積層組成,而且效能可以與循環架構相當。

2018-12-26

AWS用新方法改良自然語言模型,讓Alexa語音辨識錯誤率降低15%

正確理解用戶所說的話,是語音助理服務致勝的關鍵,AWS最近透過新方法來改良自然語言模型,使Alexa的語音辨識錯誤率降低15%

2018-12-14

蘋果如何用AI讓HomePod上的Siri聽得到你說什麼?

智慧音響HomePod置於家中任一位置,使用者可從遠處呼叫Siri,再加上家中的背景噪音,蘋果要如何去除背景噪音,讓HomePod聽清楚使用者的指令?

2018-12-05

Google開源可準確辨識不同人聲的AI演算法,即時辨識多人對話挑戰賽中平均100句只錯7句

這個模型可以解決多人對談中的大難題,「誰在什麼時間說了什麼話」的語音辨識挑戰,在 NIST SRE 2000 CALLHOME基準測試中的最低錯誤率只有7.6%

2018-11-13

捐出你的聲音! Mozilla開源語音資料專案Common Voice開始募集正體中文音檔

Mozilla開源語音資料庫專案Common Voice目前已收集超過900個小時的語音資料,其中以英語居多,並已釋出英文語音資料集的第一個版本供外界使用,6月開始該專案開始募集德語、法語的語音資料,並在6月底開始募集正體中文語音資料。

2018-07-19