資料集蒐集了數千名使用者唸出的30種語音命令,包括了Yes、No、Up、Down等。

圖片來源: 

Google

Google上周開源了語音命令資料集( Speech Commands Dataset),可望加速開發人員打造支援語音命令的各種應用。

此一語音命令資料集是由數千名不同的使用者唸出30種命令文字,迄今總計蒐集了6.5萬個只有1秒的語音檔。這些文字涵蓋了Yes、No、Up、Down、Left、Right、On、Off、Stop、Go,以及數字等,方便開發人員用來訓練應用程式的基本語音介面。

迄今Google已開源多項人工智慧專案,包含機器學習技術TensorFlow自造者AI專案—AIY,以及用來蒐集語音片段的Open Speech Recording網路程式

此外語音命令資料集是由TensorFlow與AIY團隊共同建立,以用它來增加TensorFlow的訓練與介面樣本程式,Google預期開源後的資料集數量將會持續成長,以帶來更多不同的口音。

熱門新聞

Advertisement