微軟宣布釋出其文字分析認知服務(Text Analytics Cognitive Service)中的命名實體識別功能(Named Entity Recognition)公開預覽版

命名實體識別功能針對採用自由格式的文字,以識別其內容包含的人員、位置和組織等實體的能力。使用者現在透過簡單的呼叫API,就能使用文字分析認知服務中的命名實體識別功能,以機器學習模型在任何文字檔案中查詢和分類20多種實體。

由於許多企業都會以客戶回饋、企業文件或是社交媒體等各種形式收集大量非結構化文字,但是要從這些龐大的文字中萃取出特定訊息,對於企業來說極具挑戰性。文字分析認知服務提供了關鍵短語提取、情感分析和語言偵測等功能,讓企業能以各種角度理解這些文字,而命名實體識別功能則增加了另一種處理文字的方法。

文字分析認知服務中新的實體API(Entities API)綜合了命名實體識別以及實體鏈結(Entity Linking)功能,能從非結構化文字中極大化提取出結構化的訊息。實體鏈結具有識別以及消除文字歧義的能力,提供像是Mars同時具有火星以及羅馬戰神的意義連結,這樣的結果需要Bing和維基百科等知識庫。相對的,命名實體識別則能辨識非結構化的實體,與知識庫中的實體無關。

熱門新聞

Advertisement