圖片來源: 

AWS

對話中會有不同的領域,同樣的字句在不同領域中,意思也不相同,Amazon近期為了能讓Alexa準確理解用戶所說的話,做出正確的回應,採用了新方法來評估對話中語句的領域和意圖,建立re-ranking系統,讓每個領域的模型,獨立產生自己的權重,Amazon也將這次的研究成果,發表於今年的IEEE口語技術(Spoken Language Technologies)研討會中。

「Alexa,播放歡樂滿人間(Mary Poppins)。」當用戶對語音助理Alexa說出這類的指令時,系統必須快速且正確地判斷用戶指的是書、電影,還是音樂,Alexa有幾個核心的領域,像是書籍、影片、電影等,這些領域都有各自的自然語言理解模型,來評估用戶請求的意圖,不過,這些模型是用不同的資料訓練,因此,各個模型的評估的結果可能不相容,要以哪一個模型的判斷來當作決策,就是一個問題。

針對這項問題,一般的方法是訓練一套機器學習系統,透過權重機制,比較多個領域的模型,來判斷最佳的可能性,但是Amazon採用了不同的方法,Amazon稱之為re-ranking,讓每個領域的模型,獨立產生自己的權重,這項方法的好處在於每個領域可以更新自己的權重系統,且多個領域模型能夠平行展示更新,讓處理流程更有效率,Amazon目前已將這個方法導入產品中。

Amazon的re-ranking方法收集了特定領域假設的排名清單,根據自然語言理解模型給予信心評分,並用權重的學習資料集重新排名,這些權重不只可用於領域分類的概率,Alexa的自然語言理解模型也需要分類語句的意圖和行為,舉例來說,在音樂的領域中,若系統接收到「播放Thriller」的指示,會連接到PlayMusic意圖,而不是CreateList意圖,但是滿足執行意圖的條件所輸入的參數Slot,則是可能會將Thriller分類成AlbumName和SongName,在訓練特定領域re-ranker的過程中,Amazon不只輸入每個語句領域的分類概率,還加入了可能的意圖和slot假設,因為在重新排名的過程中,無法確定領域評分和意圖評分哪一個比較重要,這些系統會在訓練的過程中學習,並針對領域、意圖和slot,產生獨立的權重。

在實驗中,Amazon利用多項評估標準或是損失函數(Loss Function),來訓練re-ranker 模型,第一個損失函數仰賴語意錯誤(semantic error)指標,該指標會結算分類假設的錯誤,並將其結果用意圖和slot正確的分類來區別,舉例來說,如果一個語句有一個意圖和兩個slot,評估結果產生1個正確意圖和1個正確的slot,則語意錯誤分數是1/3。

第一個損失函數稱為預期語義錯誤(expected semantic error),針對語義錯誤的高低來排名,第二個損失函數是交叉熵(cross-entropy)函數,該函數避免相對較細微的語義錯誤測量,標記給定的假設結果是否是真實質,不過,該函式有獎懲機制,對獲得高信心度分數的錯誤假設,會給予嚴厲的懲罰,而給予獲得高信心度分數的真實假設大量的獎勵。Amazon透過這兩個函數來調整跨域的評估分數,用權重來校正過度自信的分數,再用獎懲制度分辨真實假設的能力如此奢侈,也可以防止過度補償(overcompensation)的問題。

此外,在第三個損失函數中,Amazon整合了前面兩個函數,用3種損失函數訓練系統,並比較其結果,在所有三種損失函數上訓練的系統與根本不使用特定於域的權重的系統進行比較,研究結果顯示,損失函數的組合能夠產生最佳校準效果,目前Amazon在產品中即是使用組合的損失函數,來提供用戶最佳使用體驗。

熱門新聞

Advertisement