圖片來源: 

AWS

「Alexa,關燈並播放音樂。」當語音助理接收到複雜的行為指令時,該怎麼處理?AWS最近整合了遷移學習和複製機制(copying mechanism),建置能夠聽懂多個意圖指令的語義分析器

傳統上來說,Alexa會根據意圖和slot來解讀用戶請求,舉例來說,若用戶說「Alexa,播放Marvin Gaye的What’s Going On?」,該請求的意圖是播放音樂,而歌曲名和歌手名字會填補slot的資訊,不過,這樣簡單的機制並無法處理含有多個意圖的指令,像是「Alexa,新增花生醬和牛奶到購物清單,並且播放音樂」,要處理像這樣的指令,需要一個能夠分析句子結構和內容的語義分析器。

不過,利用機器學習建置語義分析器是相當困難的,因為訓練資料必須要有複雜的標記,為了解決這項問題,AWS整合了遷移學習和複製機制兩項技術,遷移學習可以減少建置機器學習模型所需的資料量,將現有模型的知識轉移到新模型中,而複製機制則是可以讓模型處理從未見過的字詞,像是特定的歌手名字,這項機制在訓練資料稀疏的情況下是相當重要的。

AWS在兩項任務中測試該語義分析器,分別是自然語言理解和問題回答,在自然語言理解相關的測試中,AWS發現只有複製機制,就能將整體模型的平均正確率提升61%,而加上遷移學習能夠再提升6.4%,而在問題回答的任務中,AWS使用了兩個包含自由格式問題的公開資料集,測試結果顯示遷移學習將模型的表現提升了10.8%。


Advertisement

更多 iThome相關內容