迪士尼財務部門每個月都會製作這一張雲端預算執行追蹤總表(此為示意圖非真實數據),彙整了全集團各事業部門雲端費用執行情況,提供給高層每月檢視之用。(圖片來源/迪士尼集團)

迪士尼集團是全球最大的娛樂媒體集團,也是高度雲端化的企業。早在十年前就積極展開數位轉型,發展各種數位應用和產品,全集團一年相關軟體支出超過11億美元(約臺幣330億元)。隨著數位服務和產品占比越高,暴漲的雲端費用,成了迪士尼營運團隊近2年來越來越頭痛的挑戰。

光是2017年推出的影音串流服務Disney+,統計到2022年底,在AWS上的資料量超過20PB,開了上百個AWS帳號,使用超過50項雲端服務,來支援超過1.6億訂戶的影音串流所需。迪士尼開發者生產力團隊所打造的雲端容器部署平臺,光在2017到2020年間,就為了串流平臺部署了超過7百隻AP。2020年底時,每個月部署次數近2萬次,平均一天6百多次,天天要啟動4萬個ECS容器服務任務。

不只影音串流服務上雲,迪士尼集團旗下還包括了全球各地的主題樂園和酒店、生產相關周邊商品和活動的體驗與消費品事業,提供影視內容的媒體和娛樂發行部門,像是ESPN運動頻道、abc電視臺、國家地理頻道、漫威電影工作室、迪士尼動畫工作室、遊戲等。各事業部門也大力倚重雲端。而且不只用一朵雲,例如迪士尼就和微軟簽了5年合約,要用Azure來創作和派送各種多媒體和影音內容。

除了事業群,迪士尼集團旗下設有不同企業部門來支援不同事業群的營運,例如雲端數據轉型工程團隊,就是負責支援各事業群順利取得和運用各種雲端資源和工具,從簽約、付費到優化對外提供的服務,也會與不同事業群各部門的工程師跨部門合作。

迪士尼集團雲端數據轉型工程團隊資深產品工程師Alee Whitman,日前就分享了過去一年,迪士尼推動FinOps的經驗。

FinOps(Cloud Financial Operations的簡稱)是這幾年興起的雲端費用管理優化新浪潮,隨著上雲企業越來越多,用量越來越大,國外甚至有企業一年上雲費用高達10億美元之多,如何節省上雲開銷成了雲端維運的新顯學。

Alee Whitman原本是AWS旗下打造雲端維運費用儀表板CUDOS的團隊成員之一,一年前進入了Disney集團擔任FinOps工程師。

Alee指出,想要知道能不能省錢,第一步要掌握數據,「數據就是力量,但也往往代表了複雜度。」

迪士尼是一家跨雲組織,雲端費用和各種使用行為資訊,分散在不同的公雲平臺上。

迪士尼雲端帳務資料處理流程

迪士尼有一套雲端帳務資料的處理流程,在收集階段,包括兩類資料搜集流程,第一類是外部雲端費用和使用數據,會將不同雲端供應商上不同帳單帳戶的費用資料,以及產生這些費用背後的使用紀錄,集中到物件儲存資料庫中。

第二類資料則是內部資料,將迪士尼集團內部大量與上雲帳務有關的資訊整合。內部資料還可再細分為兩個子類,第一子類是雲端帳戶經理需要的資料,包括了內部雲端資源的調度紀錄、相關治理資訊、管理紀錄、各種雲端相關的分類定義等。Alee強調,這一類資料需要進行迪士尼化(Disney-ified)。

「所謂的迪士尼化,是將這些雲端供應商的費用和使用數據,轉換成迪士尼的費用和使用數據,讓數據具有迪士尼特質,但不對數據進行任何修改。」她解釋。

以娛樂事業團隊來舉例,得讓這個團隊可以看到他們自己完整、詳細的雲端供應商的費用和使用數據,讓團隊成員按照自己的業務需求,重新劃分和組合這些資料,這就是將資料迪士尼化,讓自己的團隊重新定義資料,Alee和雲端數據轉型工程團隊也會和業務團隊成員一起進行這個重新定義的過程。

第二種內部資料子類,則是用於迪士尼產品定價或帳務計算時用的數據。這一類數據需要即時提供給其他系統,而且會因為定價策略或分帳規則的改變,需要事後調整分類或帳務認列方式,重新產生新的帳單報表。這一類資料則會寫入到物件資料庫中方便再利用。

將雲端帳務相關的外部與內部資料集中後,接著會進行正規化轉換,迪士尼會將這些雲端帳務資料,按照資料品質分為三級,搜集整合後的原始資料屬於銅級資料,這包括了歷史資料的紀錄。第二集則是銀級資料,這些是在數據層級進行篩選處理後的乾淨資料,甚至需要補強(例如修正錯誤或補齊資訊)的資料。最後一級金級資料,這些是依據業務目的或需求重新彙整或分類後的資料,具有更明確的業務價值或意義的資料。將不同來源和類型的雲端相關費用資料集中和分級處理之後,就可以建立一個統整的迪士尼雲端資料來源。

「建立雲端資料單一來源,才能實際了解真正的成本,也才能思考如何找出省錢節費的機會。」Alee表示。

經費節省的三種定義

Alee剛開始推動FinOps時發現,工程團隊與財務部門,雙方對於「節省」的理解有很大的不同,這也讓他們重新思考這個詞的定義。

Alee更進一步細分出三種「節省」概念,第一種是真的「省錢」,這是指實際支出和預算的差額,也就是手上預算沒用完後,而剩下來的金額,如果沒有預算,也無法省錢。

第二種是「減少開銷」的節省。這是指因為採取了優化作為,可以降低費用或降低運轉率(run rate)。不是所有的開銷減少都能省錢,工程團隊口中的「節省」,多半就是指這種採取了種種改善、優化作為之後,讓費用比原本更低的情況。可是,對財務團隊來說,這個開銷減少後的費用,可能跟預算相當,而沒有真正省到錢。

第三種則是成本避免(Cost Avoidance),這是指因為採取行動而避免了產生這些成本,如果不行動就需要負擔。這是一種未來式的成本。「如果一開始就做對了,就不需要負擔這一類可避免的成本。」Alee解釋。

舉例來說,有團隊在部署時,配置了過多的雲端資源,很快就發現且修正了配置,可能只增加了幾天費用,但是不是一個月或1年的費用,不會看到成本的降低,但的確避免了不必要的成本開銷。

這是三種迪士尼實踐FinOps時思考節省的思維,而迪士尼高層希望先聚焦在第一種的「省錢」,因此,先從雲端預算的訂定著手。

省錢效果來自預算的落差,預算浮報的省錢,不是真的節省,迪士尼編列雲端預算時,會深入分析過往的使用趨勢,從計費數據中了解每一個雲端帳戶實際情況,也要掌握這些數據所代表的營運意義。

掌握過往趨勢後,Alee指出,確定業務優先目標是預算編列的關鍵,還得確定工程團隊知道這些優先目標,也清楚這些目標在業務面實際的意義。

訂定預算還得找來正確的人員,例如除了工程團隊主管,還得找來SRE主管,了解一項新服務的實際成本,尤其大規模部署後的成本。

迪士尼會從四個角度來思考雲端預算的編列,包括了增加必要性、減少必要性、季節性影響、運轉率(run rate)。

增加必要性例如新建置的成本,執行的成本,業務目標變動後帶來的預算追加需求,用戶規模成長的影響等。而減少必要性則像是,AP淘汰、雲端帳戶關閉、計畫精簡等。另外,季節性因素也會大大影響迪士尼的業務,不能忽略每個時期各種節慶活動的影響,尤其要觀察是否出現新的季節性因素。

最後一項,Alee指出,迪士尼最重要的預算編列考量面向是運轉率的思考。運轉率是一種財務管理術語,是指用一年尺度來計算費用的作法。若一個月平均用量10萬元,一年運轉率就是120萬元,若平均用量20萬元,一年運轉率就提高到240萬元,以此類推。迪士尼會每個月檢視當前花費,所代表的整年度運轉率的變化。

高層每月檢視省錢追蹤總表

在迪士尼,由各事業單位先編列出各自未來一年的雲端預算之後,彙整到財務部門,再由高層統一訂出省錢目標(不是先訂省錢目標再編預算),統一訂出要「減少多少百分比花費」作為年度省錢目標,將各部門預算按這個比例來計算該部門得想辦法達成的減少額度,例如不分部門今年要節省5%預算,相當於百萬元預算就要減少5萬元開銷。

為了確保營運過程可以落實這些節省,迪士尼財務部門會製作一張雲端預算執行追蹤總表,彙整了全集團各事業部門的雲端費用執行情況,提供給高層每月檢視之用。

這張表主要提供四類數據,一開始的年度雲端預算,表定省錢額度(今年目標要減少多少開銷),目前執行狀態(預估可節省的金額),和最終實際節省的金額。

其中目前執行狀態會提供兩個數據,一個是目前運轉率(以當前平均花費來預測的整年支出金額),另一個是這個運轉率與預算的落差,也就是按照目前運轉率最後能節省的預估金額(沒有到年底,不「節省金額」,而是用「預估節省金額」來衡量)。

這張總表會按照每一個部門,都列出這四類數據,迪士尼高層每個月都會認真檢視和檢討,每一個部門當前雲端預算的執行情況。

除了第一類的「省錢」,迪士尼也很重視第二類因為優化而「減少開銷」的成果,另外還有一張追蹤優化專案的成效表,來掌握每項優化專案帶來對運轉率的影響,了解每個團隊的優化進展,目前在迪士尼有高達數百項優化專案正在進行。更關鍵的是,這些優化成效的紀錄,是由負責優化專案的每一個工程團隊負責記錄,最後再從優化專案列表中,找出戰略性專案的運轉率數據,提供給高層,而不是將所有數據都列出。

從過去一年FinOps經驗中,Alee認為,省錢不需要做到每一件事,而要聚焦。更要找出企業自己對「省錢」的定義和期望,最後是保持開放態度,正面看待犯錯的可能性。

 相關報導 

熱門新聞

Advertisement