協助聽力受損用戶溝通, Google推出即時提供字幕和聲音增強App

Google在Android系統推出即時提供字幕應用程式Live Transcribe和聲音增強應用程式Sound Amplifier

2019-02-05

微軟正申請「無聲」語音輸入專利,悄悄話也能辨識

該語音輸入解決方案就能捕捉以極低的音量所發出的話語訊號,除了說話時的氣流方式可能需要練習之外,其它的說話方式就如同耳語一般

2019-01-07

AI趨勢周報第70期:韓研究員開發圖像轉換系統InstaGAN,讓照片人物長褲換短裙

韓國研究員用生成對抗網路(GAN)開發一套圖像轉換系統InstaGAN,可將照片中人物穿著的褲裝,轉換為短裙,或將風景照中的羊群,變成一群長頸鹿。

2019-01-03

臉書開源第一個使用卷積神經網路技術的端到端語音辨識系統

臉書的語音團隊釋出第一個全卷積的語音辨識系統,系統的可學習部分能僅由卷積層組成,而且效能可以與循環架構相當。

2018-12-26

AWS用新方法改良自然語言模型,讓Alexa語音辨識錯誤率降低15%

正確理解用戶所說的話,是語音助理服務致勝的關鍵,AWS最近透過新方法來改良自然語言模型,使Alexa的語音辨識錯誤率降低15%

2018-12-14

蘋果如何用AI讓HomePod上的Siri聽得到你說什麼?

智慧音響HomePod置於家中任一位置,使用者可從遠處呼叫Siri,再加上家中的背景噪音,蘋果要如何去除背景噪音,讓HomePod聽清楚使用者的指令?

2018-12-05

Google開源可準確辨識不同人聲的AI演算法,即時辨識多人對話挑戰賽中平均100句只錯7句

這個模型可以解決多人對談中的大難題,「誰在什麼時間說了什麼話」的語音辨識挑戰,在 NIST SRE 2000 CALLHOME基準測試中的最低錯誤率只有7.6%

2018-11-13

捐出你的聲音! Mozilla開源語音資料專案Common Voice開始募集正體中文音檔

Mozilla開源語音資料庫專案Common Voice目前已收集超過900個小時的語音資料,其中以英語居多,並已釋出英文語音資料集的第一個版本供外界使用,6月開始該專案開始募集德語、法語的語音資料,並在6月底開始募集正體中文語音資料。

2018-07-19

Computex創新應用直擊:智慧應用更多元,農業、家居、寵物、減肥、刷牙都能用

Computex臺北國際電腦展其中有一區InnoVEX新創特區,展示許多新奇的智慧應用,包括智慧農業預測系統,藉由感測器數據分析和AI技術、智慧寵物玩具球,以及鼓勵兒童運動的智慧手錶、以Wi-Fi連線的智慧牙刷、不用寫程式的機械手臂教導系統,還有可離線執行的Deep Force影像辨識和snips語音辨識系統等。

2018-06-11

Build 2018:微軟認知服務大更新,提供企業更多將產品AI化的工具

微軟最近針對自家旗下的認知服務進行一系列的更新,推出不少新功能,像是語音服務、Bing視覺搜尋、客製物體偵測模型等,要讓企業更容易將AI技術帶入自家產品中

2018-05-09

Google AIY專案推新款語音及影像識別套件,鼓勵使用者自造聲控喇叭、視覺辨識應用

Google人工智慧自造者專案AIY推出語音辨識套件Voice Kit及視覺套件Vision Kit,售價分別為49.99美元及89.99美元,內含軟硬體,可供使用者打造聲控喇叭、視覺辨識裝置。

2018-04-18

降低Siri被意外喚醒的機會,蘋果用機器學習強化Hey Siri語音辨識能力

蘋果近日發布用機器學習技術來加強Hey Siri語音命令的辨識,為了解決這個Siri有時會辨識錯誤的問題,蘋果透過機器學習來改善Hey Siri的辨識模型

2018-04-18