蘋果如何用AI讓HomePod上的Siri聽得到你說什麼?

智慧音響HomePod置於家中任一位置,使用者可從遠處呼叫Siri,再加上家中的背景噪音,蘋果要如何去除背景噪音,讓HomePod聽清楚使用者的指令?

2018-12-05

Google開源可準確辨識不同人聲的AI演算法,即時辨識多人對話挑戰賽中平均100句只錯7句

這個模型可以解決多人對談中的大難題,「誰在什麼時間說了什麼話」的語音辨識挑戰,在 NIST SRE 2000 CALLHOME基準測試中的最低錯誤率只有7.6%

2018-11-13

捐出你的聲音! Mozilla開源語音資料專案Common Voice開始募集正體中文音檔

Mozilla開源語音資料庫專案Common Voice目前已收集超過900個小時的語音資料,其中以英語居多,並已釋出英文語音資料集的第一個版本供外界使用,6月開始該專案開始募集德語、法語的語音資料,並在6月底開始募集正體中文語音資料。

2018-07-19

Computex創新應用直擊:智慧應用更多元,農業、家居、寵物、減肥、刷牙都能用

Computex臺北國際電腦展其中有一區InnoVEX新創特區,展示許多新奇的智慧應用,包括智慧農業預測系統,藉由感測器數據分析和AI技術、智慧寵物玩具球,以及鼓勵兒童運動的智慧手錶、以Wi-Fi連線的智慧牙刷、不用寫程式的機械手臂教導系統,還有可離線執行的Deep Force影像辨識和snips語音辨識系統等。

2018-06-11

Build 2018:微軟認知服務大更新,提供企業更多將產品AI化的工具

微軟最近針對自家旗下的認知服務進行一系列的更新,推出不少新功能,像是語音服務、Bing視覺搜尋、客製物體偵測模型等,要讓企業更容易將AI技術帶入自家產品中

2018-05-09

Google AIY專案推新款語音及影像識別套件,鼓勵使用者自造聲控喇叭、視覺辨識應用

Google人工智慧自造者專案AIY推出語音辨識套件Voice Kit及視覺套件Vision Kit,售價分別為49.99美元及89.99美元,內含軟硬體,可供使用者打造聲控喇叭、視覺辨識裝置。

2018-04-18

降低Siri被意外喚醒的機會,蘋果用機器學習強化Hey Siri語音辨識能力

蘋果近日發布用機器學習技術來加強Hey Siri語音命令的辨識,為了解決這個Siri有時會辨識錯誤的問題,蘋果透過機器學習來改善Hey Siri的辨識模型

2018-04-18

雞尾酒效應挑戰達成,Google打造出在吵雜環境能辨識特定人聲的模型

最近Google用深度學習建立了一套可以辨識特地對象聲音的語音辨識模型,在有許多聲音的複雜環境下,也能夠將特定人聲分離,單獨辨識每個人的聲音

2018-04-14

Google為影片、電話和虛擬助理量身打造語音辨識模型,提高語音轉文字準確性

Google最近更新了語音轉文字的服務,為影片、電話和虛擬助理的語音互動模式,打造專屬的語音辨識模型,要讓語音轉文字服務更加準確,此外,還加入了自動下標點符號的功能

2018-04-10

微軟用語音辨識將講課內容即時轉成文字,讓聽力受損學生學習無障礙

聽力受損的學生現在上課也有新的輔助工具了,微軟透過自動語音辨識技術,將教授於課堂上講述的內容,即時轉為文字,幫助學生更有效率學習

2018-04-09

大幅擴充機器學習平臺,AWS推出建模、影片辨識、多國語言翻譯、語意理解等多項服務

AWS在今年的全球用戶大會,擴增多種機器學習的平臺與應用服務,透過提供開發者更容易使用的環境,以及支援多種深度學習框架與介面,瞄準實際應用需求已然起飛的AI領域

2017-11-30

微軟語音辨識技術再突破!辨識能力超越專業聽打記錄員

去年10月微軟才宣布,語音辨識技術運用業界常用的電話對話錄音測試集Switchboard,錯誤率成功降至5.9%,與人類的辨識水準相當,近日又再突破,錯誤率已經降至5.1%,並且正式超越專業的聽打紀錄人員

 

2017-08-22