程式碼託管服務GitLab釋出資料科學團隊的解決方案Meltano,可用於處理資料的提取、載入和轉換等工作。Meltano並沒有與GitLab原本的服務綑綁在一起,而是成為一個單獨產品,目的在於填補通用資料應用在不同部門間的鴻溝,讓企業達成客戶支援、產品團隊、銷售與行銷等工作。

GitLab提到,他們遇到跟大多數企業一樣的問題,在工程部門擁有大量的資料,但是要將這些資料應用在實際解決業務問題,仍有一大段距離。於是GitLab開發了Meltano來克服這個難題,Meltano解決方案提供建模、提取、載入、轉換、分析、筆記本與協作等功能,也就是說整個資料科學的生命週期,都是Meltano的支援範圍。

GitLab資料分析團隊從外部資源取得了大量資料,並轉換成可用格式,提供給公司內的其他業務部門使用者,並最終根據資料進行結果預測。GitLab表示,與多數資料團隊相同,他們目前還是透過一系列的步驟與各自獨立的工具來完成這個目標,整個流程並不順暢也沒有達到足夠穩定的水準。

他們希望可以使用最佳實踐的方法,來進行資料分析的工作,所有工作都使用開源工具,並能夠進行版本控制,還可以對資料到視覺化的分析工作管線進行追蹤。GitLab提到,Meltano的最終目標就是要讓企業內每個人都可以輕易上手,並著手進行資料分析,而不僅是資料科學家。

GitLab資料分析師Emilie Burke提到,許多中小型企業無法進行資料分析的工作,是因為他們團隊中缺乏工程師,只能透過現存的工具產生報告,但是在依賴這些孤立的資料時,也就代表無法進行跨功能的分析。他舉例,像是店家進行促銷活動,接收到了許多帳號申請的郵件,但是卻無法與Shopify的資料交叉比對,知道那些申請者有在Shopify購買商品,除非後端的資料能夠串接起來。

Meltano作為一個開源工具,企業不需要投入太多的資源來建立資料分析團隊。目前Meltano還只支援Postgres,而Snowflake正在開發中,但是Meltano需要能夠支援更多資料庫類型,因此GitLab團隊邀請有意願的貢獻者可以加入開發Meltano的行列。
 

 


Advertisement

更多 iThome相關內容