一家發跡於1960年代、轉型為雲原生資料分析和AI生命周期管理的數據分析大廠SAS,不只提供各類資料分析平臺功能,還支援AI模型訓練、部署與維運監測等服務,用戶遍布140多個國家、更是財富500強企業的愛用品牌。
這些用戶中不乏講求高時效的金融巨頭、零售老店、大型醫院或是電信等大型產業業者,如何維持內部平臺和對外服務的穩定,來滿足大型企業顧客即時分析的需求,是SAS資訊長Jay Upchurch從2019年加入SAS之後,每一天都要面臨的挑戰。
維持穩定的關鍵:雲端維運工程
隨著SAS近幾年逐漸將原本的分析工具軟體,發展出一套雲端SaaS服務模式來提供,Jay Upchurch的挑戰也轉向雲端維運。
目前,維運雲端服務的主流方法論是網站可靠性工程(SRE)。這是一套由Google提出的網站維運實踐方法論,提供了一系列用來確保企業系統可靠性的實作、指標和管理做法,後來也成為許多雲端業者和大型企業維運的作法。
SRE的核心理念是要不斷最佳化系統架構和維運流程,比如開發自動化維運機制來提高工作效率,同時確保系統運作可靠,還要兼具擴充性。
在SRE文化中,SRE團隊需要與開發團隊、IT維運團隊一起合作,在開發軟體的同時,整合自動化維運機制,來優化IT維運,甚至像Google做到最極致時,SRE團隊還具備了高級權限,能直接關閉有問題或發生事故的線上服務。
不過,「SAS是一家歷史悠久的企業,不像Google以數位原生方式發展。」Jay Upchurch指出,SRE這種系統維運方法涉及許多改變,比如需拆分現有職責、改變團隊編制,因此「要成立單獨的SRE團隊,對我們而言有點挑戰,因為我們不是(如Google)那樣建立的,」他說。
雖然SAS無法輕易套用SRE這套雲端維運最佳實踐作法,不過,他們自己後來也發展出了一套自己的雲端維運工程(Cloud Operation Engineering),將內部資訊基礎設施、平臺、雲端應用和服務等元件視為一套IT服務來維運。這些維運工作,涵蓋了網路維護、伺服器管理、服務可用性維持、風險管理和災難復原等。
Jay Upchurch進一步說明,在雲端維運工程中,維運工作主要由IT維運工程師和研發工程師分擔,兩者角色相加,就等於所謂的SRE。
比如,研發工程師肩負系統程式優化任務,擁有權限來處理有問題或需要優化的服務、確保服務可用性。而IT維運工程師不只要管理基礎設施,還負責開發與使用自動化工具,來讓工作流程更有效率。
「這兩種角色在SAS內部無縫溝通,就是我們實現SRE的方式。」Jay Upchurch說。
靠基礎設施即程式碼自動管理
與此同時,對SAS來說,具備彈性靈活的基礎設施也相當重要,如此才能大規模提供穩定、快速的AI資料分析服務,給座落全球各地的企業組織使用。
「我們好幾年前就決定,將內部所有基礎設施視為程式碼(Infrastructure as Code,簡稱IaC)。」Jay Upchurch的意思是,SAS幾年前就以程式碼來自動管理基礎設施,包括作業系統、資料庫連結和儲存等,不必人工手動處理。
因為,手動管理基礎設施不僅耗費時間,還容易發生錯誤,尤其是大規模管理時。透過基礎設施即程式碼模式,他們能自行定義所需的基礎設施狀態、自動化管理基礎設施,不必每個步驟都手動一一設置。
不只是提高了效率,另一個更大的效益是,「IaC讓我們以非常經濟的方式來維運基礎設施,」Jay Upchurch強調,當使用者用畢特定基礎設施資源時,就可以自動關閉預留的雲端資源、恢復到合理的供給量狀態,確保使用者只會用到所需的量,進而節省使用成本。
不只內部如此,當SAS提供對外服務時,也採用這種IaC方式。
Jay Upchurch坦言:「我們也會擔心服務延遲,不只是BI儀表板的順暢,也希望所有人的傳輸速度都一樣順暢。」為確保自家平臺足夠靈活、在客戶業務需要時滿足需求,他們也透過IaC作法,自動化處理各種對外服務所用的資訊基礎設施。
延伸內部自動化經驗,發展成對外服務
不只內部應用,Jay Upchurch指出,他們還將累積至今的自動化基礎設施管理經驗,進一步發展成一套產品。
像是SAS在今年產品大會上,也發表了一款雲原生AI開發工具,可用來代管模型和運算基礎設施,像是虛擬機的生命周期,自動調度運算資源,並實現自動配置和自動終止,來大幅降低基礎設施管理需求。
原本SAS只是一家老牌的數據分析軟體商,隨著這幾年積極上雲,將自家數據分析工具轉型,發展出一套套新的雲端分析SaaS服務後,資訊部門將這些產品上雲背後所累積的龐大IT維運經驗商品化,現在也變成了可以對外提供服務的產品。將IT內部經驗產品化,也讓SAS跨入了軟體技術開發工具領域,不只是數據分析商,現在更成了一家開發工具商。
Jay Upchurch透露,SAS自己也用這款AI開發工具,打造了一款內部專用的預防性維護平臺,專門用來監控辦公園區內的一套飛輪電池系統(Flywheel Energy System)的運作狀態。這是一種新興的能源技術,用來儲存機械能的次世代儲能系統,透過提高飛輪的速度,將能量轉換成旋轉動能的形式來儲存,等到需要輸出電力時,再降低轉速,將動能轉化成電能來釋出。美國太空總署已經用於多處太空站,也有汽車公司和UPS業者用來打造新一代電池系統。
當SAS園區服務中斷時,也會啟動這套飛輪電池系統來供電,而不是傳統的電池供電。不過,這種新興的飛輪維護成本相當高昂,為了降低成本,得在發生損壞前及早介入,SAS利用自家的IoT和電腦視覺技術,打造一款AI模型來預測飛輪電池系統的運作狀態。
圖片來源/SAS
CIO新挑戰1:兼顧業務營運
對Jay Upchurch來說,技術不是唯一的挑戰。「在過去十年間,CIO的角色發生重大變化!」他點出,尤其是COVID-19疫情後,許多業務模式轉為純數位化的形式,多數解決方案也改以數位方式交付,就連SAS自己的客戶,也不再要求下載式或光碟式的軟體產品,而是改用數位服務為主。
這也意味著,CIO在企業策略中,扮演了越來越重要的角色。他直言:「當今的資訊長應該在公司業務營運和企業服務間,取得良好平衡。」意思是,CIO也該涉獵到業務營運,培養商業思維,他自己就是如此。Jay Upchurch不只要擔任SAS全球IT團隊的指揮官,還身兼雲端部門執行副總裁,時常參與高層決策、負責雲端營運業務。
不只是他自己跨界IT與業務,他也希望讓IT員工可以與業務單位更融洽的合作,Jay Upchurch推動了一項業務關係經理(BRM)機制,安排IT職員擔任業務關係經理,到各個業務單位中工作,來促進雙方的夥伴關係。
舉例來說,SAS在人資、財務、法務、顧問等部門,就安排幾位業務關係經理,並在分配到的部門學習「他們的語言」,來理解每個部門面臨的挑戰、適時調整業務的IT需求方向,最後運用IT技術來克服這些業務面的挑戰。不只如此,SAS還正將這些業務關係經理累積的建議和經驗,整合到自家系統,同時也用來優化對外服務,兼顧IT治理與創新。
CIO新挑戰2:影子AI
前述的業務模式和使用者需求轉向數位化,不只帶給CIO業務營運的新挑戰,更帶來了影子IT的棘手難題。Jay Upchurch表示,當所有業務和產品都以數位方式交付,公司內部就會出現影子IT行為,不少員工未經核准就使用某些軟硬體或其他系統和服務,而且IT部門往往對這些行為不知情。
隨著AI和生成式AI越來越普及,影子AI的問題也層出不窮。Jay Upchurch本身也負責資安職責,他表示,為確保內部智慧財產和機敏資料安全,SAS制定一套監管和治理措施,來把關職員使用軟硬體或系統服務,盡可能降低影子IT和影子AI風險。
但同時,為了不讓這些監管治理手段遏止創新,他們也組織數據倫理措施等團隊,在符合資安和資訊保護的前提下,鼓勵內部創新。
除了靠內部制度解決CIO挑戰,Jay Upchurch也點出CIO社群的重要性。「CIO的工作並不輕鬆,每位CIO平均在職年份才3到4年,」因此,為讓資訊長工作更順利,他也參與CIO社群,透過同儕交流來學習、因應新狀況。
用技術解決問題,而非發展技術再找出問題
話鋒一轉,許多科技龍頭這兩年的產品戰略紛紛擁抱生成式AI,SAS也不例外,同樣在年會上聚焦生成式AI的相關產品策略或新產品。不過,Jay Uprchurch直言:「我們沒有生成式AI策略,只有商業策略,不論是AI、生成式AI或是BI,都是驅動策略的助力。」
Jay Uprchurch解釋,對CIO來說,職責不是先發展技術,再找出該技術可解決的問題、包裝成商業策略,而是要反過來,先在問題中尋找技術可以派上用場的地方,再來發展使用情境,最後形成商業策略。「這才是CIO該有的心態,」他強調。
CIO小檔案
SAS資訊長暨執行副總裁 Jay Upchurch
學歷:北卡羅來納大學電腦科學系畢業
經歷:曾任AT&T、USinternetworking和Interpath Communications多個管理層職務,後來至系統商MICROS Systems擔任資訊長,直到Oracle併購該廠商,他進入Oracle擔任旅宿與零售雲端副總裁。2019年加入SAS,帶領全球IT也兼任雲端營運部門副總裁
圖片來源/SAS
公司檔案
SAS
●總部:美國北卡羅來納州卡瑞
●成立時間:1976年
●主要業務:提供雲原生資料分析平臺、AI模型生命周期管理平臺、行銷科技工具、IoT數據分析與醫藥開發服務
●員工數:約12,000人
●年營收:32億美元
●創辦人暨執行長:Jim Goodnight
資訊部門檔案
●資訊部門主管職稱:資訊長
●資訊部門主管姓名:Jay Upchruch
IT大事記
●1976年:SAS正式成立,推出第一代數據分析軟體產品Base SAS
●1987年:整套SAS系統以C語言重新改寫,取代IBM PL/1程式語言
●1989年:推出首款Mac專用統計程式包JMP
●2016年:推出SAS Viya雲端資料分析平臺,提供視覺化分析統計、資料探勘和機器學習應用,以及IoT數據整合分析功能
●2019年:發布AutoML自動化工具、開源模型管理工具
●2022年:Viya分析平臺於AWS市集上架、發起負責任創新專案
●2023年:預告整合微軟Azure OpenAI應用,預告AI應用開發工具App Factory與Viya Workbench,在行銷科技工具CI 365新添生成式AI功能;推出韌性評估工具
●2024年:正式推出AI開發工具Viya Workbench、智能開發助理Viya Copilot、合成資料產生器Data Maker,以及AI治理顧問服務
熱門新聞
2024-10-05
2024-10-07
2024-10-07
2024-10-07
2024-10-07
2024-10-07
2024-10-07