財星100大公司有超過75家企業使用的熱門圖資料庫Neo4j,推出了一項名為向量搜尋(Vector Search)的新功能,能夠快速搜尋上下文相關的資訊,找出隱藏在資料點中的隱藏關係,官方提到,透過向量搜尋所找到的資料不是單純比對關鍵字,而是能進一步理解單詞背後的意義,因此使用者可以從生成式人工智慧中獲得更豐富的資訊。

結合Neo4j所提供的知識圖譜和向量搜尋功能,使用者能夠以Grounding技術,進一步改善大型語言模型回應的精確度。Grounding在語言模型中的意義,是將模型的知識或回答,與具體且可信的資料相關聯,Grounding可以視作一個橋樑,將大型語言模型和資料庫或是知識圖譜相連接,以提供基於事實,並且與上下文相關的回應。

開發者可以利用特定的機器學習模型,將各種資料型態,像是文件、影片、音訊和圖像編碼成向量,接著以Neo4j創建向量索引,選擇使用餘弦相似度或是歐幾里德相似度,快速執行近似K-近鄰演算法(KNN),找到與特定向量相似的向量。

官方提到, Neo4j提供了一種新的分層可導航小世界(Hierarchical Navigable Small World,HNSW)演算法,能夠很有效率地找到相似的向量。在Neo4j圖資料庫中,用戶可以在節點屬性中,利用非結構化資料的嵌入表示來創建向量索引。

使用Neo4j進行語言模型的Grounding,可以提升人工智慧應用的精確度,像是強化詐欺偵測,透過向量搜尋捕捉尚未建模的隱藏關系,增加詐欺偵測的廣度,而個人化推薦方面,向量搜尋則會考慮用戶查詢和偏好,因此能夠推薦更相關的項目。

熱門新聞

Advertisement