IBM所展示的這個「人性化的文書處理器」可以接受使用者多樣化的輸入方式,使用者經由語音輸入一篇文字後,可透過鍵盤、手寫板,或是利用口語化的命令,來變更或修改它。這套技術的核心是「自然語言理解」(NLU,Natural Language Understanding)。

IBM在今天(10/29)創新科技研討會中,也發表了兩款軟體方面的新技術,分別是「人性化的文書處理器-多樣化資料輸入方式」,及「 Clever聰明搜尋演算法」。

為了讓電腦的操作更方便,IBM公司一直努力加強語音辨識軟系統的功能。到目前為止,市面上的語音辨識軟體都只能接受數目有限的命令式指令,但IBM所展示的這個「人性化的文書處理器」(HCWP,Human- Centric Word Processor),可以接受使用者多樣化的輸入方式,使用者經由語音輸入一篇文字後,可透過鍵盤、手寫板,或是利用口語化的命令,來變更或修改它。

這套技術的核心是「自然語言理解」(NLU,Natural Language Understanding),可允許使用者透過正常的交談方式,下命令給HCWP 文書處理器;不再只限於使用特定的命令辭彙,只要用一般說話的方式就能要求系統去執行一些命令或工作。

舉例而言,要把一篇文字中某個字加底線,可以對電腦說「underline xx」,也可以用滑鼠或手寫板的筆指到這個字上,對電腦說「underline this」。就像日常生活中,一個意思可以用不同的句子來表達,NLU技術讓電腦也可以理解這些不同的句子都指示同一個動作。

HCWP文書處理器提供了兩種工作模式,第一種稱為直譯模式(Dictation),就是將使用者說的每一句話都直接轉換成文字模式,輸入到文書處理器。第二種是命令模式(Command),就是把使用者的話轉換為要求系統執行的命令。目前的設計是使用者必須透過硬體開關來切換上述兩種工作模式,IBM未來的研究方向,則是要讓系統能根據使用者說的話,自動判斷、進而決定該啟動哪一種工作模式。

這種自然語言理解技術,讓使用語音輸入軟體能夠藉著設計良老的自然語言對話界面獲益,也讓學習電腦變得更容易。當然,看起來人與電腦的關係,離科幻電影中那種直接跟電腦對話的情景,也越來越接近了。

所謂「聰明搜尋演算法」則是一項資料搜尋技術,讓使用者可指定搜尋條件,並且從大量的文件當中,過濾出最切合主題得資料,進而加強網際網路搜尋引擎的運算效能。

目前大多數商業網站都是以人工判斷的方式,針對不同的主題,對網頁進行整理歸類,以便提供類似「主題關聯性判斷」的功能。

至於聰明搜尋演算法,則採用IBM艾爾瑪登研究實驗室發展的「超文字歸納式主題搜尋」,HITS(Hypertext-Induced Topic Search)運算法,會先利用一般的文字搜尋引擎,找出一群符合查詢主題的網頁;接著會在找出與這些網頁連結的其它網頁。找出所有網頁後,HITS 演算法將依網頁間的連結關係,進行分析、過濾,並重新組織這些網頁,然後找出最佳的資訊,為搜尋者提供真正相關資訊的網站。

這兩項產品目前尚未產品化,不過據IBM研究中心表示,已有幾個知名搜尋網站與IBM洽商合作。

熱門新聞

Advertisement