Google在臺揭露AutoML新功能，今年底還將正式推出BigQuery BI Engine

圖片來源:

攝影／王若樸

Google上周五在臺舉辦Next 2019大會回顧，揭露數項AI和大數據分析產品的新進程，包括AutoML將推出損失函數（Loss function）設定功能，以及BigQuery BI Engine將整合試算表、提供進階BI功能和API，更計畫於明年初整合SQL介面。

AutoML為Google Cloud上的機器學習服務，目的是要減少開發機器學習模型時，使用者所面臨的資料詮釋困難，比如資料準備、特徵工程、架構選擇、調參數、模型評估等。

進一步來說，AutoML可自動化處理上述問題，包括建模前的資料和預期目標定義、分析輸入特徵等，在模型訓練過程中，還可自動進行特徵工程、模型選擇、調整超參數；模型訓練好之後，還會評估模型表現，並部署模型。在訓練階段時，AutoML會自動從Google的模型庫中尋找合適模型類型，比如線性模型、Feedforward DNN、Wide and Deep NN、GBDT、整合學習（Ensemble Learning）工具AdaNet等，其中，YouTube就是用Wide and Deep NN模型來進行使用者影片推薦。

雖然AutoML可自動訓練模型，但使用者仍無法手動進行細部的參數微調。Google Cloud雲端顧問Isaac Tsai表示，Google Cloud在與Google Brain的合作下，計畫將AutoML新增2大功能，第1是自動進行資料預處理，再來是Loss Function Selector，也就是說，將來使用者能進一步細部調整損失函數，可自行選擇損失函數或其型式。該功能的好處是，「當使用者做到98分，這個功能可幫助做到99分。」

然而，AutoML並非適合所有ML應用場域（如下圖，藍色為AutoML表現值），但AutoML好處是可以快速試錯。計價方式可分為3部分，在模型訓練（Training）部分以小時計算，預測部分（Prediction）則是以運算時數來計價，部署（Model Deployment）部分則是以使用的GB時數來計算。

此外，Google臺灣也於現場展示今年新推出的AutoML Tables。AutoML Tables是一套機器學習服務，特點是可用結構化資料，來簡單地建置客製化模型。AutoML Tables包括了6個步驟：輸入資料、選擇訓練目標、分析、訓練、評估、預測。其中，在分析階段，系統可顯示缺失的資料，以及資料間關聯性等；而預測階段則分為Batch Prediction和Online Prediction，皆能以API型式使用。

BigQuery BI Engine將發布正式版，也計畫整合試算表、提供API功能

BigQuery BI Engine是一套基於資料倉儲BigQuery的Google Cloud大數據分析引擎，特點包括了快速查詢、可橫向擴充，以及可即時串流寫入資料。BI Engine的架構簡單，因為建於BigQuery之上，只要使用現有儲存即可；不須管理BI伺服器、ETL工作流程等。

BigQuery BI Engine目前為Beta版，可免費使用至7月。Google Cloud客戶工程師Edward Chuang表示，BigQuery BI Engine將於今年第四季發布正式版（GA），也將整合試算表、提供進階BI功能和API功能，更計畫於明年初整合SQL介面。至於計費方式，他指出，Google預計今年第三季開始計費，計費方式分為隨選（On-demand）和定額（Flat-rate）。隨選最小記憶體使用單位為1GB，最大為10GB，每小時以美金0.0416/GB來計算；定額的計算金額則未揭露。

BigQuery ML新功能

BigQuery ML為Google今年5月發布正式版的機器學習服務，特點包括了不須搬移BigQuery中的資料，就能執行機器學習任務，此外，使用者只要透過SQL語法，就能完成機器學習任務，可加速開發過程。另一方面，BigQuery ML還能自動執行常見的模型訓練任務，比如整合特徵前處理和超參數調整等。

隨著今年5月GA後，BigQuery ML也新增了一系列測試中的功能，包括k-平均演算法（K-means clustering）、矩陣分解（Matrix factorization）、TensorFlow深度神經網路、特徵預處理，以及可匯入TensorFlow模型至BigQuery來進行預測任務等。

其中，TensorFlow深度神經網路為Alpha版，該功能可讓使用者選擇要用多少隱藏層或隱藏單元（Hidden units），或是dropout和batch_size參數的設定等。不過，Alpha版尚未提供自動調超參數的功能。至於匯入TensorFlow至BigQuery的功能，一樣為Alpha版，目的是要讓使用者用TensorFlow打造出非結構化資料的模型後，可至BigQuery進行預測。不過，Alpha版有2項限制：模型大小須為250MB，以及不支援RNN和LSTM。文◎王若樸

熱門新聞