圖片來源: 

攝影/王若樸

Google上周五在臺舉辦Next 2019大會回顧,揭露數項AI和大數據分析產品的新進程,包括AutoML將推出損失函數(Loss function)設定功能,以及BigQuery BI Engine將整合試算表、提供進階BI功能和API,更計畫於明年初整合SQL介面。

AutoML為Google Cloud上的機器學習服務,目的是要減少開發機器學習模型時,使用者所面臨的資料詮釋困難,比如資料準備、特徵工程、架構選擇、調參數、模型評估等。

進一步來說,AutoML可自動化處理上述問題,包括建模前的資料和預期目標定義、分析輸入特徵等,在模型訓練過程中,還可自動進行特徵工程、模型選擇、調整超參數;模型訓練好之後,還會評估模型表現,並部署模型。在訓練階段時,AutoML會自動從Google的模型庫中尋找合適模型類型,比如線性模型、Feedforward DNN、Wide and Deep NN、GBDT、整合學習(Ensemble Learning)工具AdaNet等,其中,YouTube就是用Wide and Deep NN模型來進行使用者影片推薦。

雖然AutoML可自動訓練模型,但使用者仍無法手動進行細部的參數微調。Google Cloud雲端顧問Isaac Tsai表示,Google Cloud在與Google Brain的合作下,計畫將AutoML新增2大功能,第1是自動進行資料預處理,再來是Loss Function Selector,也就是說,將來使用者能進一步細部調整損失函數,可自行選擇損失函數或其型式。該功能的好處是,「當使用者做到98分,這個功能可幫助做到99分。」

然而,AutoML並非適合所有ML應用場域(如下圖,藍色為AutoML表現值),但AutoML好處是可以快速試錯。計價方式可分為3部分,在模型訓練(Training)部分以小時計算,預測部分(Prediction)則是以運算時數來計價,部署(Model Deployment)部分則是以使用的GB時數來計算。

此外,Google臺灣也於現場展示今年新推出的AutoML Tables。AutoML Tables是一套機器學習服務,特點是可用結構化資料,來簡單地建置客製化模型。AutoML Tables包括了6個步驟:輸入資料、選擇訓練目標、分析、訓練、評估、預測。其中,在分析階段,系統可顯示缺失的資料,以及資料間關聯性等;而預測階段則分為Batch Prediction和Online Prediction,皆能以API型式使用。

BigQuery BI Engine將發布正式版,也計畫整合試算表、提供API功能

BigQuery BI Engine是一套基於資料倉儲BigQuery的Google Cloud大數據分析引擎,特點包括了快速查詢、可橫向擴充,以及可即時串流寫入資料。BI Engine的架構簡單,因為建於BigQuery之上,只要使用現有儲存即可;不須管理BI伺服器、ETL工作流程等。

BigQuery BI Engine目前為Beta版,可免費使用至7月。Google Cloud客戶工程師Edward Chuang表示,BigQuery BI Engine將於今年第四季發布正式版(GA),也將整合試算表、提供進階BI功能和API功能,更計畫於明年初整合SQL介面。至於計費方式,他指出,Google預計今年第三季開始計費,計費方式分為隨選(On-demand)和定額(Flat-rate)。隨選最小記憶體使用單位為1GB,最大為10GB,每小時以美金0.0416/GB來計算;定額的計算金額則未揭露。

BigQuery ML新功能

BigQuery ML為Google今年5月發布正式版的機器學習服務,特點包括了不須搬移BigQuery中的資料,就能執行機器學習任務,此外,使用者只要透過SQL語法,就能完成機器學習任務,可加速開發過程。另一方面,BigQuery ML還能自動執行常見的模型訓練任務,比如整合特徵前處理和超參數調整等。

隨著今年5月GA後,BigQuery ML也新增了一系列測試中的功能,包括k-平均演算法(K-means clustering)、矩陣分解(Matrix factorization)、TensorFlow深度神經網路、特徵預處理,以及可匯入TensorFlow模型至BigQuery來進行預測任務等。

其中,TensorFlow深度神經網路為Alpha版,該功能可讓使用者選擇要用多少隱藏層或隱藏單元(Hidden units),或是dropout和batch_size參數的設定等。不過,Alpha版尚未提供自動調超參數的功能。至於匯入TensorFlow至BigQuery的功能,一樣為Alpha版,目的是要讓使用者用TensorFlow打造出非結構化資料的模型後,可至BigQuery進行預測。不過,Alpha版有2項限制:模型大小須為250MB,以及不支援RNN和LSTM。文◎王若樸


Advertisement

更多 iThome相關內容