解決ML訓練資料不平衡問題，AWS用新法提高聲音辨識系統正確度

圖片來源:

AWS

AWS研究團隊發表了一項用於解決訓練資料不平衡的新技術，在研究實驗中，AWS用新技術來處理辨識特定聲音的問題，像是玻璃打破的聲音或是嬰兒的哭聲，實驗結果顯示，相比一般常用的神經網路聲音辨識方法，新方法將錯誤率降低了15%～30%，AWS也將在5月舉行的IEEE 訊號與資通訊科技國際會議中，發表用新技術修正訓練樣本不平衡的問題。

AWS指出，大多數現代的機器學習系統都是分類器，系統將輸入資料分類到不同的種類中，像是特定動物的照片，理想上來說，當一個系統被訓練來辨識多個種類，每個種類的訓練樣本數量大致上要差不多，像是貓、狗和馬，若訓練樣本數量沒有大致相等，系統的辨識結果可能會偏向較多訓練樣本的種類。

訓練資料不平衡的問題有時候難以避免，但是必須在訓練的過程修正該問題，解決該問題標準的方法是增加代表性不足樣本的權重，也就是在訓練過程中，於目標函數中增加特定類別權重，另外還有一項更進階的方法是訓練一個神經網路來產生能夠抓取不同類別之間差異的向量空間，不過，對學習向量空間而言，資料不平衡也是一個問題，在訓練的過程中，若任何資料類別比其他的資料類別大，該類別的資料會分成多個群，來與最小的類別的大小相匹配。

為了解決這個問題，AWS開發了一套會持續計算每個資料群向量空間重心的演算法，該重心為將所有群中心點的平均距離最小化的點，透過每個新計算出來的向量，AWS的演算法能夠計算重心到各個群的距離，將向量網路訓練後，AWS用訓練後生成的輸出資料當作新分類器的訓練資料，來解決訓練資料不平衡的問題。

熱門新聞