自今年2月Google推出雲端TPU Beta版服務後,該公司旗下不同的雲端服務也陸續整合TPU,像是雲端機器學習引擎也能結合TPU運算服務,加速訓練成效。而TPU服務也推出先占模式,比起隨需使用模式,價格更便宜7成。

而近日Google又加強TPU與其他產品線整合,現在Google Kubernetes服務已經支援雲端TPU,讓企業可以在Kubernetes環境調度TPU資源。比照TPU計價模式,在Kubernetes環境導入TPU服務,Google也有提供先占模式,讓企業可以用便宜的價格,嘗試該功能。

結合Google Kubernetes引擎的原生功能,使用者可以通管部署在Kubernetes環境的TPU資源。例如,根據即時流量,自動擴充TPU叢集。再者,Google也有提供原生的API,讓維運人員可以擴充Kubernetes Pods以及雲端TPU規模。

自2016年Google首度揭露TPU以來,現在雲端TPU已經發展至第三代。目前處於穩定版本的雲端TPU第二代,每單位可以提供180TFLOPS的運算力,並且搭配64GB的高頻寬記憶體。至於最新的第三代,現在還處於Alpha階段,相比第二代效能有相當進步,可以提供420TFLOPS的運算力,以及128GB的高頻寬記憶體,以應付更複雜的機器學習模型。

在Google內部其中的一個應用案例,就是使用雲端TPU服務,執行圍棋引擎Minigo。Google解釋,Minigo專案是來自Google員工執行的Side project。借力神經網路架構的Minigo,其系統專注於解決棋局中碰到的兩個問題。

第一個是預測下一步最有可能出現的棋路,第二個問題,則是計算兩方誰的勝算較大。結合神經網路架構及增強式學習模型,Minigo可以不斷提升自己的棋力。每一次完成一次棋局,Minigo會記錄結果,並且分析每一步。接著,Minigo會更新網路模型,改善棋局的勝率。

一開始Google是結合GPU資源,將Minigo部署於Kubernetes環境運作。後來,選擇結合TPU資源,並將Minigo部署在Kubernetes環境執行,搭配640個TPU組成的運算叢集,Minigo每秒鐘可以完成20至30個棋局。


Advertisement

更多 iThome相關內容