為了讓Alexa聽懂用戶的複雜指令，AWS用新方法開發語義分析器

圖片來源:

AWS

「Alexa，關燈並播放音樂。」當語音助理接收到複雜的行為指令時，該怎麼處理？AWS最近整合了遷移學習和複製機制（copying mechanism），建置能夠聽懂多個意圖指令的語義分析器。

傳統上來說，Alexa會根據意圖和slot來解讀用戶請求，舉例來說，若用戶說「Alexa，播放Marvin Gaye的What’s Going On？」，該請求的意圖是播放音樂，而歌曲名和歌手名字會填補slot的資訊，不過，這樣簡單的機制並無法處理含有多個意圖的指令，像是「Alexa，新增花生醬和牛奶到購物清單，並且播放音樂」，要處理像這樣的指令，需要一個能夠分析句子結構和內容的語義分析器。

不過，利用機器學習建置語義分析器是相當困難的，因為訓練資料必須要有複雜的標記，為了解決這項問題，AWS整合了遷移學習和複製機制兩項技術，遷移學習可以減少建置機器學習模型所需的資料量，將現有模型的知識轉移到新模型中，而複製機制則是可以讓模型處理從未見過的字詞，像是特定的歌手名字，這項機制在訓練資料稀疏的情況下是相當重要的。

AWS在兩項任務中測試該語義分析器，分別是自然語言理解和問題回答，在自然語言理解相關的測試中，AWS發現只有複製機制，就能將整體模型的平均正確率提升61%，而加上遷移學習能夠再提升6.4%，而在問題回答的任務中，AWS使用了兩個包含自由格式問題的公開資料集，測試結果顯示遷移學習將模型的表現提升了10.8%。

熱門新聞