圖片來源: 

微軟

微軟最近在Build大會上展示智慧助理管理用戶行程的應用場景,並發布未來對話式AI的願景,微軟的下一代智慧助理技術,將會利用去年收購的Semantic Machines公司,在對話AI和機器學習的技術,創造出能夠理解上下文、更加智慧化的對話式AI語音助理,該技術也會應用在更多微軟的產品和服務中,來增進對話體驗,這項技術將來也會在微軟Bot框架中推出。

微軟認為,雖然現今的智慧語音助理有各式各樣的技能,能夠查看天氣預報、回報交通狀況和運動賽事,還能播放音樂、翻譯、算數、講笑話以及傳送訊息等,但是現今的語音助理無法用上下文意來協助用戶做決定,舉例來說,語音助理不會在安排戶外區的會議之前,先確認天氣預報。

自然語言介面技術的目標是使人類與電腦,能夠用像人類之間對話的方式來溝通,微軟的自然語言介面就是要讓用戶可以用自然的方式表達,不需要理解AI語音助理是如何運作的,而現在的智慧語音助理,像是Cortana是用機器學習從用戶的指令中,理解用戶的意圖,再根據意圖,來觸發預先設定好的一系列動作。

由於回應指令的規則是手動設計的,開發者必需針對每一個使用場景,預測所有會用到的技能,來為每個使用場景撰寫腳本,但人類能夠設想的應用場景和腳本有限,因此,這樣的方式限制了語音助理能處理的領域和功能。

Semantic Machines的對話系統是使對話AI學習上下文和概念,將機器學習技術擴大使用,不僅針對意圖辨識,而是整個系統的運作,也就是系統可以從自身的資料中學習,該系統能夠學習如何將人類的詞語,與運算步驟連結,來執行用戶請求的任務,例如,系統會透過大量的文句範例,學習如何擷取運動比賽分數,此外,機器學習技術還能使系統從已知的內容,產生出新的內容,用更多方式來學習做更多事。

另外,Semantic Machines的對話系統能夠記錄對話上下文,還能同時講話和聆聽,Semantic Machines稱之為full duplex capability。

熱門新聞

Advertisement