Google AIY專案推新款語音及影像識別套件,鼓勵使用者自造聲控喇叭、視覺辨識應用

Google人工智慧自造者專案AIY推出語音辨識套件Voice Kit及視覺套件Vision Kit,售價分別為49.99美元及89.99美元,內含軟硬體,可供使用者打造聲控喇叭、視覺辨識裝置。

2018-04-18

降低Siri被意外喚醒的機會,蘋果用機器學習強化Hey Siri語音辨識能力

蘋果近日發布用機器學習技術來加強Hey Siri語音命令的辨識,為了解決這個Siri有時會辨識錯誤的問題,蘋果透過機器學習來改善Hey Siri的辨識模型

2018-04-18

雞尾酒效應挑戰達成,Google打造出在吵雜環境能辨識特定人聲的模型

最近Google用深度學習建立了一套可以辨識特地對象聲音的語音辨識模型,在有許多聲音的複雜環境下,也能夠將特定人聲分離,單獨辨識每個人的聲音

2018-04-14

Google為影片、電話和虛擬助理量身打造語音辨識模型,提高語音轉文字準確性

Google最近更新了語音轉文字的服務,為影片、電話和虛擬助理的語音互動模式,打造專屬的語音辨識模型,要讓語音轉文字服務更加準確,此外,還加入了自動下標點符號的功能

2018-04-10

微軟用語音辨識將講課內容即時轉成文字,讓聽力受損學生學習無障礙

聽力受損的學生現在上課也有新的輔助工具了,微軟透過自動語音辨識技術,將教授於課堂上講述的內容,即時轉為文字,幫助學生更有效率學習

2018-04-09

大幅擴充機器學習平臺,AWS推出建模、影片辨識、多國語言翻譯、語意理解等多項服務

AWS在今年的全球用戶大會,擴增多種機器學習的平臺與應用服務,透過提供開發者更容易使用的環境,以及支援多種深度學習框架與介面,瞄準實際應用需求已然起飛的AI領域

2017-11-30

微軟語音辨識技術再突破!辨識能力超越專業聽打記錄員

去年10月微軟才宣布,語音辨識技術運用業界常用的電話對話錄音測試集Switchboard,錯誤率成功降至5.9%,與人類的辨識水準相當,近日又再突破,錯誤率已經降至5.1%,並且正式超越專業的聽打紀錄人員

 

2017-08-22

Google 公開測試2項雲端機器學習API

開放測試的自然語言API可對不同語言的文本結構及意義進行分析,目前支援英語、日語、西班牙語三種語言,而同樣開放測試的語音辨識API,使用與Google Now及Google搜尋相同的語音辨識技術,支援80多種語言,可用於App或物聯網裝置上。

2016-07-21