SnapLogic宣布推出機器學習生命周期視覺化自助服務解決方案SnapLogic Data Science,支援資料採集、資料準備、特徵工程、訓練、驗證以及部署等機器學習的各階段。

由於機器學習專案涉及多個階段與多種工作,職務包括資料工程師、資料科學家以及DevOps人員等。SnapLogic認為,當這些工作缺乏自動化的情況下,可能會在過程產生自定義編碼、冗餘的工作以及手動試錯等不必要過程。像是資料工程師可能需要花費數天進行整合的動作,收集、清理和轉換資料,又或許最後軟體開發團隊,需要將機器學習模型轉換成另一種語言,才能投入生產。

這些工作都會不斷消耗團隊資源,SnapLogic利用自身開發機器學習推薦引擎的經驗,將自助服務整合進機器學習生命周期中,SnapLogic Data Science能簡化資料清理的工作,提高模型開發效率,並讓模型在開發完成後立即進行產品部署。

SnapLogic Data Science加速並簡化機器學習生命周期四個階段,分別是資料採集、資料探索和準備、模型訓練和驗證,以及模型部署。SnapLogic Data Science可以讓資料工程師快速的存取訓練資料集的原始資料,透過拖拉操作就能進行檢視並處理,能整合關聯和NoSQL資料庫、雲端應用、資料湖泊以及JSON文件等。

另外,在模型訓練以及驗證階段,資料科學家可以使用SnapLogic Data Science配置模型,進而減少編寫腳本的工作。即便開發者想要從頭開始建構模型,也可以在Jupyter Notebooks使用Python,並發布到SnapLogic工作管線中操作。

SnapLogic提到,部署模型是一個緩慢且繁瑣的過程,在許多情況下,為了讓模型可以在實際產品階段中運作,開發人員必須將模型轉換使用另一種程式語言。SnapLogic Data Science則能免去這個過程,讓工程師在模型完成後,立即進行部署提供API。

SnapLogic Data Science為各規模的企業提供端到端的機器學習解決方案,以提高建構、訓練、驗證並部署高效能模型。


Advertisement

更多 iThome相關內容