Google Kubernetes引擎開始支援雲端TPU服務

自今年2月Google推出雲端TPU Beta版服務後，該公司旗下不同的雲端服務也陸續整合TPU，像是雲端機器學習引擎也能結合TPU運算服務，加速訓練成效。而TPU服務也推出先占模式，比起隨需使用模式，價格更便宜7成。

而近日Google又加強TPU與其他產品線整合，現在Google Kubernetes服務已經支援雲端TPU，讓企業可以在Kubernetes環境調度TPU資源。比照TPU計價模式，在Kubernetes環境導入TPU服務，Google也有提供先占模式，讓企業可以用便宜的價格，嘗試該功能。

結合Google Kubernetes引擎的原生功能，使用者可以通管部署在Kubernetes環境的TPU資源。例如，根據即時流量，自動擴充TPU叢集。再者，Google也有提供原生的API，讓維運人員可以擴充Kubernetes Pods以及雲端TPU規模。

自2016年Google首度揭露TPU以來，現在雲端TPU已經發展至第三代。目前處於穩定版本的雲端TPU第二代，每單位可以提供180TFLOPS的運算力，並且搭配64GB的高頻寬記憶體。至於最新的第三代，現在還處於Alpha階段，相比第二代效能有相當進步，可以提供420TFLOPS的運算力，以及128GB的高頻寬記憶體，以應付更複雜的機器學習模型。

在Google內部其中的一個應用案例，就是使用雲端TPU服務，執行圍棋引擎Minigo。Google解釋，Minigo專案是來自Google員工執行的Side project。借力神經網路架構的Minigo，其系統專注於解決棋局中碰到的兩個問題。

第一個是預測下一步最有可能出現的棋路，第二個問題，則是計算兩方誰的勝算較大。結合神經網路架構及增強式學習模型，Minigo可以不斷提升自己的棋力。每一次完成一次棋局，Minigo會記錄結果，並且分析每一步。接著，Minigo會更新網路模型，改善棋局的勝率。

一開始Google是結合GPU資源，將Minigo部署於Kubernetes環境運作。後來，選擇結合TPU資源，並將Minigo部署在Kubernetes環境執行，搭配640個TPU組成的運算叢集，Minigo每秒鐘可以完成20至30個棋局。

熱門新聞