對於機房管理工作而言,特別是專業企業IDC機房與ISP,因全年無休之故,有沒有過年,其實都是沒有差別的。當然,過年期間絕不至於發生因機房冷氣過冷,值班人員被迫生火取暖,導致火災燒掉整個機房的爆笑事件,但還是有一些老生常談,值得參考。

確實執行休假前的例行檢查
無論究竟真的有效,還是為了「心安」,都應確實執行例行性的機房及設備檢查工作,清理煙塵毛髮等雜物,尤其像比較容易被忽略的供水系統,就曾經有企業遭遇過休假期間供水系統故障,導致機房空調失效、設備幾乎全軍覆沒的慘劇,此類疏忽都應盡量避免。

其次,可以重新啟動的設備就盡量重新啟動,該更換的老舊設備就應提前更換,該鎖緊的設備就該全部鎖緊,該清理的記憶體及硬碟空間都應盡量清理,以改善基礎設施的穩定性。墨菲定律告訴我們,凡是只要有可能出錯,那就一定會出錯。

眼光不能只放在機房,而是整棟大樓
除了檢查機房之外,千萬別忘了,覆巢之下無完卵,機房所在的大樓環境,更是值得重視、但也容易被忽略的地方。大樓的保全、空調、消防、防漏、能源、水電、通風與緊急逃生設施等,只要一個環節出問題,對機房就可能造成致命性的影響,尤其長假時間整棟大樓可能幾乎空無一人,如果發生意外,將難以處理。

如果企業並無大樓管理權,僅為租用樓層作為機房空間的用戶,別忘記在過年前仔細巡視整棟大樓,看看有沒有明顯的缺失,例如緊急逃生路口是否有雜物堆積、消防器材是否完善、是否有閒雜份子出入等,對大樓的管理階層提出改善建議。

確認緊急聯絡名單,盯緊值班人員的排班
無論是公司人員或支援廠商,都必須事先建立過年期間的緊急聯絡名單,以確保在出事時,可以找到負責問題的人。尤其過年假期較長,有著較多的變數,例如有人爬山結果手機掉到山谷,或著是年夜飯發生食物中毒裡的意外,更應進一步建立職務代理人的緊急聯絡方式,增加第二層保障。

過年畢竟是過年,人力比較吃緊實乃必然,所以部分機房人員值班都會由原本的三班制縮減為兩班制,意味著較長的工作時間。加上過年期間往往事情較少,值班人員的「精神」比較容易散漫,交接遲到、甚至翹班者亦大有人在。所以在這時候,主管就必須經常打電話「查哨」,嚴格要求值班人員確實排班,確保所有值班人員的手機隨時帶在身上,以備不時之需。

不過,對於擁有自有機房的ISP來說,情況又有所不同,因過年期間網路流量較小,所以ISP往往會選擇過年期間進行歲修工程,如升級骨幹路由器的作業系統或更新重要硬體設備等,理論上比較不會有人力不足的問題。

其次,只要辦公環境夠好、員工對公司向心力夠強,往往到大年初二初三時,就會有員工因日子無聊、家裡網路太慢,就自動「回娘家」上班,找同事打連線遊戲或喝茶聊天,變相強化「備援人力」。

這也證明了,只要企業願意在平日提供優良且氣氛良好的辦公環境,自然就可以強化企業對意外事件的隱性抵抗力,反之亦同。就從這個角度而言,如果情況許可,企業也可以考慮購置娛樂器材或健身設備,一方面作為員工福利,另一方面也可排解長假值班的無聊。

配合廠商的歲修
不限於ISP,部分過年期間業務量較少的企業,也可能針對寄放在專業IDC機房中的設備,進行歲修或資料備份的工作,所以專業IDC機房就必須事先配合客戶,制定過年期間的應變計畫。

隱而不現的是,理應該嚴禁吸煙飲食的機房環境,相關規定不見得會被客戶人員所遵守。筆者就曾親眼目睹某知名建設公司的IT人員,在IDC機房中進行例行性資料備分時,相關規定視而無睹,將地板弄得瓶瓶罐罐。

加上過年期間心情較為散漫,行為出軌的機會更高,此時機房值班人員就需要嚴格把關,確實執行機房相關規定,確保機房環境的整潔與安全。當然,更重要的,莫過於機房值班人員的自律,不要因過年氣氛導致心情鬆懈而帶頭違反規定。

保持平常心,戒慎恐懼
人類之所以是萬物之靈,就是因為人類有智慧。也因此,人類的愚蠢也永無止盡,任何愚蠢的行為都會帶來意想不到的後果,這是歷史告訴我們的教訓。

俗語說得好,天才所造成的災難就是「天災」,但這種天災並非無法防範,只要保持與平日一樣的平常心,和平時一樣的戒慎恐懼,除非遇到不可抗力,否則都可事先預防。要記得,事前的預防絕對遠比事後的補救更有效,天底下絕沒有那個正常人希望「應變計畫」真的生效,所以人的心態才是最重要的。如果忘記這點,千萬不要以為在機房生火取暖導致火災燒掉整座機房的爆笑劇情,絕對不會成為晚間新聞的頭條。文⊙劉人豪

>>IT人也是很迷信的
有別於外界認為IT人乃「科技人」的刻板印象,其實很多IT人是很迷信的,尤其是終日在寒氣逼人、震耳欲聾的機房裡,與無數設備朝夕相處者,碰過設備出現「靈異現象」者比比皆是。所以在重要設備上「供奉」一包「乖乖」,過年前機房三柱香防小鬼,在伺服器上掛著從日本購回的「IT御守」、「當機御守」,祈求機器不要出事者,亦大有人在。根據我們的經驗,這並非唯一的特例,實際上不少企業也有著類似的傳統。

某家ISP高階技術主管即表示,根據他們的經驗,乖乖「的確很有效」。他們每年大概會更換兩次乖乖,一次是過年前,另一次則是中元節。

除此之外,重要節日前也會在機房上香,因為「網路裡有鬼,機房容易招小鬼」。某固網高階主管也表示,「你永遠不知道是貓、狗、人,還是鬼在上網」。

那為何不放「旺旺」呢?因為如果設備上放旺旺,往往機器就容易暴走,所以沒有人敢放旺旺。另外一種令人匪夷所思的迷信,莫過於「值班的機房人員不能吃牛肉」。不過,該主管表示,該規定現在已經沒多少人在遵守了。換言之,迷信歸迷信,也得「先講求不傷身體,再講求效果」、員工具備「執行力」,才有貫徹的條件。

所以,如果公司已經建立此種傳統,寧可信其有,千萬別忘記這些「例行公事」,尤其別讓供奉的乖乖給過期了。更重要的是,聽天命之後,更該盡人事,因為天助自助者,只有平時盡好本分,老天才會庇佑你。文⊙劉人豪

其他相關文章
長假IT應變計畫-導論
長假IT應變計畫-建立檢查清單,以防掛一漏萬
長假IT應變計畫-人事篇
長假IT應變計畫-系統維運篇
長假IT應變計畫-資安篇
長假IT應變計畫-辦公室作業應變篇

熱門新聞

Advertisement