微軟AI研究團隊近日於官方的部落格中表示,微軟的AI機器翻譯系統可以將中文的新聞文章翻譯成英文,透過雙語專業人員評估,AI機器翻譯系統的表現與人類相當,微軟表示,中文和英文有較充足的詞彙資料庫,透過新聞的常見詞彙搭配深度學習演算法,再加入新方法模仿人類翻譯的流程,不斷地調整,讓機器翻譯系統產出的結果更加準確。

特別的是,微軟的研究團隊在AI機器翻譯系統中,加入雙重學習(Dual learning)的機制,也就是說,系統將中文的新聞文章翻成英文後,會再將英文的翻譯結果翻成中文,重新比對兩者的相似性,並讓系統從錯誤中學習。除此之外,該AI機器翻譯系統還加入了審議網路(Deliberation network),系統會學習研究員翻譯句子的過程,模擬人類一次次編修文字的過程。

而為了確保翻譯結果的準確性,微軟加入聯合訓練方法(Joint training),透過中翻英和英翻中2個系統交互學習,英翻中的系統可以提供新的中文句子,與原文的中文句子形成一組資料集,增加訓練集的資料量,中翻英也是如此,將2個系統互相學習時,即可以改善各自的準確率。

另外,微軟也嘗試採用一致性正規化(Agreement regularization)的方法來加強翻譯結果的準確性,簡單來說,AI機器翻譯系統從左到右,或是從右到左閱讀語句,翻譯出來的結果必須一致,微軟相信,系統若產生相同的翻譯結果,是比較準確的。

在微軟負責語音、自然語言和機器翻譯的技術團隊成員Xuedong Huang表示,這項成果是自然語言處理任務中,非常重要的里程碑,機器翻譯達到人類的水準一直是團隊的目標,他表示,沒想到這麼快就能實現。

過去幾十年來,機器翻譯一直是研究員想要解決的問題之一,許多語言專家也認為機器翻譯不可能達到人類的水準,這項成果雖然是重要的里程碑,但是不代表機器翻譯的問題已經解決,微軟亞洲研究院副院長周明表示,還有許多挑戰和問題,像是在即時新聞上測試機器翻譯系統,他期待,這項成果可以應用在不同的語言,甚至是不同的AI研究領域中。


Advertisement

更多 iThome相關內容