| 編者的話 | 資料遺失 | 大當機 | MFA | 帳號安全 | 高中學習歷程檔案遺失 | Atlassian | SRE

能力越大,責任越大

寫著電影《蜘蛛人》經典臺詞:「能力越大,責任越大」的T恤頗受人青睞,這是否也象徵人們對於「力量」、「能力」、「權力」的渴望?同時,也不免讓人聯想「責任」是否成為一種裝飾或是獲得更大能力的藉口,而讓人忽略扛起這個重擔所要付出的代價

2022-06-02

| 封面故事 | 微服務 | Atlassian | 大當機 | SRE | Jira | SaaS

Atlassian四月大當機為何14天才復原?問題出在工程思維DR計畫,缺乏關鍵的顧客視角

Atlassian坦言,過去的DR計畫主要聚焦在基礎架構失敗的復原,或是從備份資料中復原企業所用服務儲存空間的做法,而少了一個關鍵環境,就是以顧客專屬入口網站(網站ID)視角的復原計畫

2022-05-23

| 封面故事 | 微服務 | Atlassian | 大當機 | SRE | Jira | SaaS

【微服務架構弱點,遇上超完整DR計畫盲點,連6年SRE老手都失守】SaaS業界近年最大當機事件追追追

這是一份值得臺灣企業參考的經典SRE事後分析報告,也是SaaS服務維運團隊必須了解的重大當機事件

2022-05-23

| 資安 | 零信任 | Zero Trust | 臉書 | 服務異常 | 大當機 | 稽核工具臭蟲

臉書公布大當機始末報告:日常維護出錯所引發的骨牌效應

臉書工程師在例行性維護時發布了錯誤的命令,但命令稽核工具含有臭蟲而沒能阻止錯誤命令執行的情況下,先導致臉書全球骨幹網路斷線,接著DNS伺服器關閉BGP宣告,讓臉書在全球網路上消失,進而引發臉書內網全斷、內部工具無法使用的骨牌式災難

2021-10-06

| 臉書 | 大當機 | BGP | 服務異常

臉書、IG、WhatsApp全球服務中斷7小時,Cloudflare:可能是BGP惹的禍

Cloudflare發現Facebook的DNS伺服器一度停擺,不只自家1.1.1.1 DNS解析器、連Google的8.8.8.8或其它的公共DNS,也都找不到Facebook、Instagram與WhatsApp

2021-10-05

| Line Bank | 系統超載 | 純網銀 | 大當機

Line Bank開行首日大當機!原因是同一時間瞬間湧入大量用戶造成系統超載

Line Bank對外開行第一天就遇上大當機,從昨日傍晚開始,陸續傳出系統無法使用的問題,主因是用戶開戶踴躍,造成系統超載,雖一度在晚間8點修復,卻因同一時間瞬間湧入大量用戶,所以,造成系統再次壅塞。後來,Line Bank團隊經過內部排解,直到晚間10點,開戶申請流程才恢復正常。

2021-04-23

| Line | 大當機 | 誤關電源 | 資料中心維修出包

Line全球斷線50分鐘原因出爐:竟是資料中心維運商不小心關掉了電源

在維護時理應要接上電源,但該廠商卻錯誤地切斷了數個網路與伺服器的電源,才導致Line發生全球通訊服務大規模停擺的情況。

2021-04-14

| 東京證交所 | 大當機 | 災難復原 | 韌性

【硬體故障、設計錯誤、市場公平性的三難】東證十一大當機教訓的3堂課

為了邁向永不停機的目標,過去20年,東京證券交易所在追求更快的交易速度時,也不斷發展更好的系統復原程序,但這次大當機事件讓他們體會到,還需要考慮第三件事,那就是韌性,在系統當機交易重開後的恢復能力

2020-10-30

| 東京證交所 | 大當機

【一個手冊參數異動資訊沒勘誤,竟讓日本股市交易空白一整天】東證大當機事件過程追追追

2020年10月1日早上7點4分,東證IT突然收到NAS出錯的事件通報,內部交易監控系統螢幕也無法顯示,更有不少券商發現,自己沒有收到東證7點發布的行情資訊,當時,沒人想得到,這會是東證全日交易空白的一天

2020-10-30

| Garmin | 勒索軟體 | 資料威脅 | 災難備援 | 高可用性 | 大當機

雪崩式資料威脅

勒索軟體最大的威嚇,不是對系統直接的傷害,或是龐大的贖金財務損失,更大的風險是不可知的資料損失風險,如果放任不管,讓勒索軟體暗中作亂,災情越滾越大,像是一種雪崩式的資料威脅。

2020-07-30

| Garmin | 飛航導航 | 穿戴式裝置 | 勒索軟體 | 大當機 | WastedLocker | 資安事件

Garmin旗下多項服務陸續恢復正常上線,該公司也鬆口表示是遭受網路攻擊,並提及系統被加密

關於近期的Garmin大當機事件,雖然該公司遲遲沒有揭露遇害細節,不過現在他們更新了公告內容,終於對外證實是遭網路攻擊,且該攻擊在7月23日對他們的系統進行了加密。但Garmin的公告仍未提及勒索軟體。

2020-07-29

| Garmin | 飛航導航 | 穿戴式裝置 | 勒索軟體 | 大當機 | WastedLocker

Garmin服務全球大當機破3天,疑似攻擊程式樣本曝光,官方也終於回應用戶資料無損

Garmin官方網站第二次針對這次事件發布公告指出,伺服器仍舊因系統中斷,而影響了Garmin Connect和Garmin Pilot平臺上的部分服務,但不再承諾修復時間,僅表示還在搶救中,而用戶資料都不受影響

2020-07-26