根據New Scientist的報導,Google正以自動化的爬梳技術建置全球最豐富的知識資料庫Knowledge Vault,且計畫在下周於紐約舉行的「發現知識與資料採礦」(Knowledge Discovery and Data Mining)會議上發表。

以搜尋技術起家的Google現為全球最受歡迎的搜尋引擎,為了強化搜尋系統對關鍵字的處理能力並改善搜尋結果,Google在2012年發表了「知識圖表」(Knowledge Graph),這是一個以結構化知識為基礎的資料庫,汲取了來自Wikipedia、CIA的世界概觀(World Factbook),以及協作知識網站Freebase的內容,當時彙整了5億個條目及35億種的事實描述。

然而,以眾包模式聚集知識的速度太慢,使得Google決定自動化蒐集知識的程序,重新打造了Knowledge Vault,自動爬梳網路上的內容並利用機器學習把資訊集結成知識,迄今已取得16億種的事實描述。

雖然目前Knowledge Graph的知識內容仍多過Knowledge Vault,但Google期望藉由自動化蒐集與創造知識的Knowledge Vault成長速度將會大幅超越Knowledge Graph,使其成為全球最豐富的知識資料庫。

有了正確的知識庫將能最佳化使用者的搜尋結果,也可應用在諸如Google Now等各種Google服務中,甚至是基於既有的知識與現象預測未來。(編譯/陳曉莉)

 

熱門新聞

Advertisement