Google釋出積極問答ActiveQA套件，能反覆合成新問題追求最佳解答

Google開源了其研究論文Ask the Right Questions: Active Question Reformulation with Reinforcement Learning之中，主動問答（ActiveQA）系統的TensorFlow套件，能被用於訓練增強學習人工智慧代理人重新設計問題。ActiveQA結合問答系統以及自然語言，能重新設計問題以更多問題進行搜尋，最後取得比傳統問答系統更好的答案。

在傳統的問答系統中，使用監督式學習技術結合標記資料，來訓練能夠回應任意問題的系統。Google表示，這在某種程度上是有用的，但最重要的是，這種方式缺乏人類處理不確定性問題的能力，無法重新理解並設計問題，進行更廣泛的搜尋，以獲得綜合評估和匯總回答。

受人類「問對的問題」的想法啟發，Google在ActiveQA在中加入了反覆諮詢的問答系統，這個人工智慧代理會多次重新合成原始問題，以便能搜尋到最佳的可能答案。Google之所以稱這個問答系統為積極的（Active），正是因為人工智慧代理人會與QA系統進行動態互動，以提高最終答案的品質。

以「特斯拉何時出生？」這個問題為例，代理人會以兩種不同的方式提出問題「特斯拉的生日是什麼時候？」以及「特斯拉哪一年出生？」，根據兩個問題的答案，系統最終會決定回傳「1856年7月10日」作為答案。

Google提到，ActiveQA系統的特點就是能學會提出可以獲得更好答案的問題。但是要訓練人工智慧提問並不容易，由於包含原始問題還有更好的替代問題，這樣形式的問題對（Question Pairs）訓練資料取得並不容易，因此ActiveQA採用了強化學習，以便人工智慧代理人可以和環境互動的同時，採取能獲得最大化獎勵的行動。

ActiveQA代理人在與問答系統互動時，根據答案的品質來評估問題重新設計的好壞，而這便形成了獎勵行為，當答案是好的，那學習演算法便會調整模型參數，以便再次產生更有可能獲得好答案的問題。Google以更佳的提問，訓練出比傳統問答系統還要好的結果，Google提到，這是一個重要的研究，因為問答系統已經透過監督系統訓練，而ActiveQA的人工智慧代理則可以學習複雜，但仍然可以解釋的重新制定策略。

Google這次釋出的ActiveQA TensorFlow套件由三個主要元件組成，其中包含了訓練和執行ActiveQA代理人所有必須程式碼。Google表示，他們致力於全球資訊普遍可用，而ActiveQA則是實現這個使命重要的一步，ActiveQA能助Google設計出更好可解釋的問答系統，同時也能幫助其他人開發以自然語言互動的系統。

熱門新聞