Google強化其雲端資料倉儲BigQuery的機器學習功能,推出新BigQuery機器學習推理引擎,讓用戶可以直接在BigQuery匯入外部訓練的模型,藉由縮短模型與資料之間的距離,加速機器學習運算。此外,用戶也能夠將資料指向遠端託管在Vertex AI的模型,以更靈活地方式執行模型推理任務。

Google讓用戶無縫地在將資料預測分析整合至資料倉儲中,消除了資料移動帶來的成本和風險,用戶還能使用熟悉的SQL語法來操作各種機器學習功能。而BigQuery的無伺服器的特性,使得用戶不需要在執行機器學習預測時自己配置基礎設施。

過去,用戶在BigQuery中匯入機器學習模型的功能僅限TensorFlow模型。但Google現已擴充支援的模型格式,新增加TensorFlow Lite、XGBoost和ONNX。如此一來,用戶便能夠將PyTorch和scikit-learn等常用框架轉換成ONNX,並將其匯入到BigQuery中。現在用戶可以在BigQuery使用在其他地方訓練的模型,而不需要移動資料,BigQuery的分散式推理引擎能夠批次執行推理工作,以提高推理執行效能。

對於一些需要特殊基礎設施,以處理低延遲請求和大量參數的模型,用戶可以選擇將模型託管在機器學習平臺Vertex AI端點,以獲得GPU運算加速,Vertex AI也提供預建置容器、自定義容器等服務。用戶現在可以選擇直接從BigQuery內部,遠端使用這些位於Vertex AI的模型進行推理。BigQuery會將資料送向遠端Vertex AI進行推理,待推理完畢後的結果再送回BigQuery。

BigQuery機器學習遠端模型推理,也支援圖像等非結構化資料,用戶可以使用Vertex AI上的圖像、文字理解和翻譯預訓練模型進行推理。在BigQuery機器學習推理引擎中,這些模型可以使用特殊的預測函式,將文字和圖像當作輸入,並結果以JSON資料類型輸出。

熱門新聞

Advertisement