
Google將Gemini資料工程代理(Data Engineering Agent)引入BigQuery Pipelines。這個第一方代理針對資料工程用例,把工作管線建置、維護與疑難排解等重複性工作交由系統處理,使用者可在BigQuery Studio與Dataform介面透過Ask Agent按鈕啟用。
根據Google說明,Data Engineering Agent支援以自然語言生成與修改資料工作管線。使用者只需描述需求,系統便會自動生成符合資料工程最佳實務的SQL與工作管線設計,例如載入資料、轉換格式、去除重複值與輸出至指定資料表。當用戶想調整既有管線,代理也能分析程式碼結構,提出修改建議供審核,並可自動產生對應的文件與欄位說明,方便後續維護與交接。
Data Engineering Agent同時整合Dataplex的Universal Catalog目錄服務,能從中擷取商業詞彙表與資料概況(Data Profile),用以改善新表格的中繼資料品質與整體效能。在資料準備階段,代理可從Cloud Storage匯入原始檔案,自動進行清理、去重複與格式標準化,並依據Dataplex定義的規則產生資料品質斷言(Assertion),或對含有個資的欄位自動加密,也能以自然語言生成星型結構(Star Schema)或Data Vault等資料模型結構,減少人工撰寫與測試的時間。
在疑難排解方面,代理與Gemini Cloud Assist深度整合,當管線發生錯誤時,可自動分析執行記錄,指出失敗原因並提出修正建議。這樣的診斷流程有助於快速恢復運作,降低人工檢查日誌的負擔。針對資料平臺現代化的需求,Data Engineering Agent也支援將現有或專有格式的資料流程,自動轉換為BigQuery原生工作管線。
Google指出,這項代理目前處於預覽階段,未來將持續擴展功能,包括主動式除錯、整合開發環境支援,以及在Cloud Composer中進行管線調度。Gemini的導入讓BigQuery從資料倉儲工具進一步發展為能協助自動生成、維護與最佳化資料流程的平臺。
熱門新聞
2025-12-24
2025-12-23
2025-12-22
2025-12-19
2025-12-23
2025-12-23
2025-12-22