「誰是阿凡達的導演的老婆的丈夫?」這種一般搜尋引擎很難辨識的問題,對於以自然語言處理技術為基礎的英庫問答引擎而言,要找到精確的答案並不難。如圖中的搜尋結果,英庫問答給予卡麥隆最高的相關性。

在以搜尋引擎尋找答案時,我們早已習慣將問題轉換為關鍵字,例如想要找阿凡達電影的導演,大多數人都會在搜尋框輸入「阿凡達」與「導演」,而不會以一般講話的方式詢問‥「阿凡達電影的導演是誰?」

關鍵字搜尋的便利與限制
對於簡單的問題,關鍵字搜尋就能有效找到解答,而且打幾個字就能找到答案,在文字輸入操作上更是方便。然而若面對複雜的問題,例如想知道阿凡達導演的老婆是誰?又或是更複雜的問題:阿凡達導演的老婆的老公是誰?只靠關鍵字搜尋,若電腦無法完整理解問題的意思,搜尋結果往往就不盡理想。

內容搜尋還有另一個問題,在於答案會變動。以「誰是阿凡達電影的導演?」這個問題來說,它有個標準答案,就是卡麥隆。只要搜尋電影知識庫,任誰都能正確回答這個問題。然而,若問的是阿凡達電影的導演的老婆是誰?又或是阿凡達電影的導演的老婆的老公是誰?那麼可能就沒有一個永遠不變的答案,因為人們有可能會離婚,亦有可能會再婚。

以自然語言技術理解問題的語意
為了讓人們可以使用自然語言,像平常問話一樣用電腦找答案,微軟亞洲研究院的科學家開發出一個名為「英庫問答(Engkoo Answer)」的通用問答引擎。

英庫問答具有深入分析自然語言的能力,讓使用者可以使用一般問話的方式,對電腦提出問題。例如:阿凡達電影的導演是誰?又或是需要一些推理能力、較為困難的問題:阿凡達的導演的老婆是誰?這些都難不倒英庫問答。

負責開發英庫問答的微軟研究員表示,英庫問答以自然語言技術來理解問題,接著從知識庫、網際網路的資源,以及問答網站取得候選的答案及證據,再利用自動推理、答案排序、可信度預估等步驟,找出最精確的答案。

電腦要理解人類的語言,更困難的是超過兩個層次以上的推理問題,例如阿凡達電影的導演的老婆的老公是誰?如此需要多層次推理的問題,目前英庫問答的技術也有辦法找到準確的答案。

回答出阿凡達的導演是卡麥隆,對一般人而言並非難事,但對電腦來說就很困難了。因為至少就有三部電影都取名阿凡達,而電腦可不像人類溝通有聰明的認知能力,能夠立刻知道對方可能指的是哪一部電影。電腦必須要能夠判斷這三部阿凡達電影中,最有可能的是哪一部電影,接著才能再找出該部電影的導演、導演的老婆及老婆的丈夫。

把全球知識當成大腦
要找到最精確的答案,不只是搜尋知識庫,還必須搜尋整個網路上的即時資訊,才能保證找到正確的答案,而這一切必須採取好幾種方法才行。

英庫問答的成果其實是一連串的研究,研究者先後研究雲端辭典、機器翻譯、語言學習、自動對聯和詩詞、輸入法等,最後才發展至問答。不過,目前這套系統仍處於微軟亞洲研究院內部研發,尚未對外開放。

熱門新聞

Advertisement