微軟宣布在其資料控管服務Azure Purview,支援Azure SQL資料庫動態資料處理歷程擷取(Dynamic Lineage Extraction)功能,使用戶更容易追蹤資料操作歷程,包括生成來源和轉換過程等資訊。

無論是技術還是業務領域的資料使用者,皆須仰賴資料處理歷程,來進行根本原因分析、影響分析、資料品質追蹤和各種資料治理操作,微軟提到,在當前的資料環境中,資料散布於本地和雲端部署,能自由地跨資料平臺和應用程式轉移,因此掌握資料處理歷程也就越來越重要。為此,微軟發布了動態資料處理歷程擷取功能。

傳統系統執行靜態程式碼分析,藉由解析資料轉換腳本來找出資料處理歷程,微軟表示,這種方法只能能夠應用在簡單的用例中,像是當使用SQL腳本藉由連接兩個資料表,生成目標表格時。不過,在許多實際使用情境,資料操作都複雜得多,因為腳本可以包裝在預存程序中,而預存程序可能包含判斷式,在運作時執行不同的腳本,又或是在執行時發生資料交易失敗。

官方提到,有許多用例,都需要以動態分析更有效地分析資料處理歷程,而且靜態資料處理歷程分析,不會將資料和程序與執行時的後設資料相關聯,反之,動態資料處理歷程能夠掌握資料執行者身份、執行時間、用於執行的伺服器等資訊,如此能使用戶進一步管理隱私,並且遵守法規要求。

預存程序通常用於下游應用程式,在SQL表格中執行資料轉換和聚合操作,而微軟現在於Azure Purview提供的Azure SQL資料庫動態資料處理歷程擷取功能,透過使用Azure Purview Data Map元件,用戶可以獲得更豐富的資料處理歷程,包括執行狀態、受影響行數、使用者資訊等各式操作細節。

Azure Purview Data Map連結SQL引擎的檢測框架,直接擷取執行時日誌以聚合動態歷程,同時執行時日誌還提供在SQL引擎中實際執行的查詢,藉由使用Azure Purview便可以映射資料歷程,以及收集詳細的出處資訊。

熱門新聞

Advertisement