| CloudFlare | 當機事故 | 全球服務中斷 | 韓國國家資料中心大火 | AWS | 大當機

【釐清事故經過與原因,理解不同服務平臺潛在風險】全面檢視2025全球10大IT當機事件(上)

考慮到大型IT平臺的高度複雜性,難以完全避免意外導致服務中斷,因此事故後處理能力,包括復原速度與資訊透明度,也構成平臺的關鍵能力

2026-01-23

| IT服務事故 | WhatsApp | 服務當機 | Spotify | 音樂串流服務 | Google Cloud | 雲端服務中斷 | 當機事故 | PlayStation Network | Youtube | 服務中斷 | X | Twitter | 大規模服務中斷 | CloudFlare | 全球服務中斷 | 韓國國家資料中心大火 | AWS | 大當機

【重新審視雲端服務的當機風險】盤點2025全球IT服務大當機事件

過去一年多起IT服務平臺的大規模當機事故,尤其是集中大量用戶與服務的大型平臺,服務中斷造成的衝擊格外龐大,促使我們更加正視雲端應用的風險,以及復原能力與替代平臺的重要性

2026-01-23

| AWS大當機 | 大當機 | AWS當機

Downdetector解析AWS大當機災情,超過60個國家與3,500家公司受到影響

在10月19日與20日,公有雲服務AWS的雲端區域US‑EAST‑1發生部分服務故障的狀況,後續導致數千家公司受到影響,網路測速與網路品質分析服務公司Ookla在22日發布報告,具體呈現災情的樣貌。他們根據旗下Downdetector收到1,700萬份通報進行分析,總計影響超過60個國家、3,500家公司

2025-11-12

| AWS | 服務中斷 | 服務異常 | DNS解析 | AWS當機 | 大當機

AWS美東-1服務中斷近3小時,Disney+、麥當勞App及Lyft全停擺

因DynamoDB DNS解析異常,AWS US-EAST-1在臺灣時間10月20日下午發生故障,隨後蔓延成歷時近3小時的大規模服務中斷

2025-10-21

| 大當機 | CrowdStrike | 微軟 | 醫院 | 雙備援

CrowdStrike大當機的省思,臺灣大型醫院學到這2件事

經歷7月19日大當機事件,臺灣一家大型醫院除了自我警惕、更版流程要更嚴謹外,也開始評估雙備援機制的原主機和備援主機,是否應採用不同廠商的防護服務,以免廠商出事、備援主機仍無法作業。

2024-07-29

| CrowdStrike | Windows電腦 | 大當機 | 0719全球大當機 | BSOD | IT重大事故 | EDR

當企業資安與生產力發生火車對撞

一些防毒軟體產品過去也曾引發Windows電腦大當機的事故,但已很久沒遇到這類問題,沒想到2024年竟然再度上演

2024-07-26

| CrowdStrike | Windows電腦 | 大當機 | 0719全球大當機

CrowdStrike說明全球當機事件起於驗證軟體一隻臭蟲

針對7月19日爆發的全球Windows電腦大當機事件,CrowdStrike坦承是該公司某個驗證軟體臭蟲引發的連鎖效應

2024-07-25

| Azure | M365 | 大當機 | 微軟 | 服務中斷 | 0719全球大當機 | Azure故障

微軟美國服務無預警大當機,導致M365在內的眾多Azure雲端服務中斷無法使用

微軟在美國服務在臺灣時間今天上午清晨約6點突然無預警大當機,造成包含微軟旗下的眾多服務,包括 M365 和 Azure 雲端服務均受影響。

2024-07-19

| 編者的話 | 資料遺失 | 大當機 | MFA | 帳號安全 | 高中學習歷程檔案遺失 | Atlassian | SRE

能力越大,責任越大

寫著電影《蜘蛛人》經典臺詞:「能力越大,責任越大」的T恤頗受人青睞,這是否也象徵人們對於「力量」、「能力」、「權力」的渴望?同時,也不免讓人聯想「責任」是否成為一種裝飾或是獲得更大能力的藉口,而讓人忽略扛起這個重擔所要付出的代價

2022-06-02

| 封面故事 | 微服務 | Atlassian | 大當機 | SRE | Jira | SaaS

【微服務架構弱點,遇上超完整DR計畫盲點,連6年SRE老手都失守】SaaS業界近年最大當機事件追追追

這是一份值得臺灣企業參考的經典SRE事後分析報告,也是SaaS服務維運團隊必須了解的重大當機事件

2022-05-23

| 封面故事 | 微服務 | Atlassian | 大當機 | SRE | Jira | SaaS

Atlassian四月大當機為何14天才復原?問題出在工程思維DR計畫,缺乏關鍵的顧客視角

Atlassian坦言,過去的DR計畫主要聚焦在基礎架構失敗的復原,或是從備份資料中復原企業所用服務儲存空間的做法,而少了一個關鍵環境,就是以顧客專屬入口網站(網站ID)視角的復原計畫

2022-05-23

| 資安 | 零信任 | Zero Trust | 臉書 | 服務異常 | 大當機 | 稽核工具臭蟲

臉書公布大當機始末報告:日常維護出錯所引發的骨牌效應

臉書工程師在例行性維護時發布了錯誤的命令,但命令稽核工具含有臭蟲而沒能阻止錯誤命令執行的情況下,先導致臉書全球骨幹網路斷線,接著DNS伺服器關閉BGP宣告,讓臉書在全球網路上消失,進而引發臉書內網全斷、內部工具無法使用的骨牌式災難

2021-10-06