根據研究機構 Forrester Research 報告,全球多達 54% 資訊工作者,經常礙於費時搜尋訊息、見解與答案,屢屢打斷工作節奏;追根究底,只因現實世界的數據相當紊亂,時常跨越文字檔、PDF 文件、圖像、資料庫等等眾多媒體類型且不斷變化,單憑基於關鍵字的傳統搜尋引擎,確實無法快速擷取知識價值。

因此企業急需引進新一代的認知搜尋與知識探索解決方案,藉由自然語言處理(NLP)、機器學習等人工智慧(AI)技術,從眾多數據源當中擷取、理解、組織與查詢所需內容。為此微軟以 AI 技術為架構打造 Azure 搜尋服務,並在其中提供「認知搜尋」(Cognitive Search)解決方案,內建 NLP、圖像處理等多項認知技能,且允許用戶量身自製專屬技能,搭配成為技能組合,藉以建構索引管線(Indexing Pipeline),針對存放於 Azure Blob 儲存體、Azure 表格儲存體、Azure SQL Database 或 Azure Cosmos DB 等來源的各式文件,擷取其中的見解與結構化資訊,為原始資料豐富化(Enrich)並帶入結構,最終編製索引,方便用戶進行全文檢索,享有資料探索的全新體驗。

改以 AI 審查合約,工時從 36 萬小時急降為數秒

AI 為當今的熱門顯學,它之所以深具價值,在於能將資料化為行動,先將資料轉變為有價值的見解,分析這些見解以進行預測,再根據預測來採取行動,最終藉由行動而實現商業利益。

因此無庸置疑,立基於 AI 的認知搜尋應用,將是協助各行各業敲開致勝致富大門的利器,相關成功案例,正在不斷地累積。

譬如在運輸業領域,荷蘭的鹿特丹港為歐洲最大港口,每年貨物吞吐量達 4,415 億公噸,而一家以鹿特丹港為營業重心的物流公司,每天需手動處理發票、訂單與貨物清單等數千份 PDF 文件;之所以仰賴人工處理,實在因為不同客戶的表單樣式差異過大,迫使該公司必須動員大量人力與冗長時間,才能藉由大量單據識別出產品、目的地等資訊。

因此物流公司急需建立高效率的自動化流程,於是在 Azure 上建立 Python 函式,搭配運用自然語言處理、隨機梯度下降法等技能,藉此解析 PDF 內容,得以有效確認文件類型,並擷取產品相關訊息(包括數量、價格、重量、目的地等),準確度高達 97% 。經由這般轉變,該公司處理文件的時間大減 98% 、錯誤率降低 6%,每年因而節省 400 萬美元成本。

在金融業,應用案例也在不少數,比方說摩根大通(JPMorgan Chase),從前每年透過律師、信貸人員審查平均 12,000 頁合約文件,共計耗費長達 36 萬小時,促使該公司決定以機器學習技術發展「COIN」合約分析軟體,成功將處理時間大幅縮減到短短幾秒鐘,成效極為驚人。由此可見,金融業除了可運用 AI,實現大家較常聽聞的反洗錢、生物辨識認證等應用外,其實增進工作效率方面,還有莫大的發展空間,例如透過認知搜尋技術加速契約文件處理,或者用於財報追蹤。

屬於資訊服務產業的 Icertis 軟體公司,一向專注建構全球合約管理平臺,並運用 Azure 的 AI 與認知搜尋技術,快速從各種型式儲存的大量資料中萃取價值,成功將靜態合約轉變為動態的戰略資產。

根據 Icertis 的觀察,以往許多企業面對大量 Office 檔案、SharePoint 檔案、圖表,及合約的 PDF 掃瞄檔案,往往無力處理;如今企業只需在 Icertis Contract Management 平臺創建合約,都會歷經光學字元辨識 (OCR) 程序,再進入一個因應合約管理而量身建立的 Icertis AI 技能管道,迅速識別合約所內含的條款類型,同時擷取續訂日期、採購價格等關鍵屬性,再將這些結果編製為索引,便於客戶針對合約進行複雜提問,譬如查看所有關於 GDPR 的合約條款,藉由前所未有的方式挖掘合約的價值與風險。

1/9 ~ 1/10 實境秀,認知搜尋技術大公開

另一個能夠彰顯認知搜尋效益的經典場景,在於2017年解密的「甘迺迪(JFK)」文件。有多達 500 餘萬來自聯邦調查局、中情局的檔案,皆是甘迺迪遇刺後相關的訪談、錄音、電報等資料,由於數據量體過於龐大,假使一個人想從頭到尾看完全部文件,估計得花上數十年時間;然而藉助微軟的認知搜尋技術,最快在短短幾分鐘內,即可消化大量內容,並依據使用者設定的洞察方向,萃取相關訊息並納入搜尋索引。

我們只需要將想解析的資料內容放上 Azure,便能透過幾下點擊,輕易運用內置在 Azure 搜索服務當中的認知技能,快速進行內容理解,從而展示相關訊息。以 JFK 文件為例,藉由 OCR 、電腦視覺及自定義實體鏈結(Entity Linking)等認知技能組合,即可快速註釋所有檔案,建立可搜尋的標籤索引,甚至根據所有實體鏈結製作為可視化地圖,清楚顯示每一個標籤與資料之間的關聯,幾分鐘內釐清兇嫌 Lee Harvey Oswald 與各種人事物之間的關係脈絡,而不需要花費數年、甚至數十年時間。

不管是 JFK 文件,或者是成千上萬頁的合約、工程計畫,都可藉由 AI 技能組合,輕鬆釋放其中的潛在價值,幫助各行各業大幅提升發現洞見的效率、準確性。

 

 

任何企業 IT 經理人或開發人員,若想進一步探索微軟認知搜尋解決方案的奧妙之處,可利用 1 月 9 日、10 日兩天上午時間,收看認知搜尋的 Live Show 。經由第一天課程,學員一方面可了解如何運用 Azure AI 技術,從非結構化資料中擷取洞察與知識,另一方面則可深入理解 Azure 認知搜尋的技術內涵,知道如何編程式來建立數據源、索引、索引器(Indexers)、技能組合、自定義技能組合。

● 立即觀看 Part 1
● 立即觀看 Part 2

熱門新聞

Advertisement