圖片來源: 

Google雲端加入一個稱為Tecton的功能平臺,可自動執行生產環境中,建置和管理機器學習特徵的步驟,Tecton是一個全託管特徵建置和調度服務,可完整管理機器學習特徵生命周期,降低組織建構、管理和共享機器學習特徵的障礙,並提高模型效能和可靠性,控制機器學習應用程式的開發和維護成本。

目前不少企業開始將機器學習功能整合進應用程式中,但是機器學習模型需要高品質的資料,經過轉換建立機器學習特徵,才能做出精準預測,而Google提到,建置和管理生產環境機器學習特徵資料工作管線並不容易,這些工作管線的資料來自批次處理或是串流傳輸等不同來源,在將這些資料轉換成為機器學習特徵之後,才能用於訓練和服務上。

而Tecton的目標是要能自動處理機器學習特徵的建置、處理、共享和供給工作,資料團隊可以使用Tecton的宣告式框架,將特徵定義為程式碼,在底層會由Tecton調度轉換與實現機器學習特徵所需要的實際工作管線。透過Google Cloud Build這類CI/CD工具,開發者可以將Tecton特徵當作程式碼進行管理,集中管理程式碼方便共享和協作,就像是管理基礎設施即程式碼,或是模型即程式碼一樣。

Tecton可自動連接和維護Google雲端批次處理和串流服務的新資料,同時Tecton也支援來自包括Redshift、Snowflake和Apache Kafka等非GCP的資料。Tecton在Google雲端上,會使用Databricks或Dataproc分散式運算平臺聚合和轉換資料,將傳入的資料轉換成為特徵,放到線上與離線特徵商店中。資料特徵存放在Tecton低延遲線上儲存,服務即時供給需求,同時也會存放在離線儲存,以用於產生訓練資料集和離線推理用途。

熱門新聞

Advertisement