一位Google雲端平臺的用戶,在部落格表布了以「為什麼你不該使用Google雲端(Why you should not use Google Cloud)」為題的文章,抱怨他們執行在GCP上用於產品階段的服務,被無預警關閉,該用戶還表示,Google完全沒有給他們解釋機會,就讓他們的服務停止運作了幾個小時,雖然經過搶救取回了部分資料,但還是損失了約一個小時的資料。

該作者提到,他們在GCP上建構用於監控遍及8個國家,包含數百個風力發電機以及太陽能發電廠的服務,在他們的控制中心有一大面牆的螢幕,全天候顯示著電廠狀態的監控儀表板,資產管理人員便用這些儀表板,監控風力發電機以及太陽能發電板的健康狀況,並在需要時即時請求維護。他們的開發以及預測團隊還使用GCP的BigQuery,運作演算法來控制電力的生產,而這些動作都與營收直接相關。

作者提到,他們操作的風能與太陽能,是屬於易衰敗的商品,也就是說過度生產不只浪費成本,且無法銷售與儲存,而生產不足的話,還會被罰款。因此他們需要一整天對這些設備進行監控,依照電網的需求以及購電合約進行追蹤調整。

但就在6月28日凌晨,他們收到監控服務Uptime Robot的通知信,警告他們整個網站的服務都已經停止了。同時也收到了來自Google的信件表示,Google發現他們服務存在一些潛在的可疑活動,因此逕行將所有服務關閉。這包括網站、應用程式引擎,連資料庫都無法存取,Firebase上的使用權限也被降級。

事件發生當下,所有直接聯絡Google的管道都沒有,線上客戶服務關閉也沒有電話可以打。他們收到一封電子郵件,要求填寫驗證表格以修正違規行為,並需上傳信用卡照片以及身分證明文件,以證明支付工具的所有權,否則將在3天內刪除整個專案。所幸服務付款人是他們的財務長,緊急填寫完表格後,Google在20分鐘內恢復所有服務,不過這時已經讓他們的系統停止運作了數個小時。而這是他們第一次遇到這樣的問題,獲得幾乎一個小時的資料空白。

作者提到,好險他們的財務長當時沒有休長假,否則可能整個專案都完蛋了,後果則是數百萬美元的損失。他提到,過去他們的專案皆使用AWS的服務,也從沒有發生這樣的事件,AWS會給他們時間解釋,而這個專案是他們第一個用於GCP的服務,Google霸道的終止他們的服務,並且要求立即解釋。

這個事件在網路論壇RedditHackernews上引發熱烈討論,多數的網友皆認為Google的作法太過強硬,也有網友認為即便他們公司付出了高額的支援費用給Google,但是獲得客服品質仍不盡理想。


Advertisement

更多 iThome相關內容