圖片來源: 

ThousandEyes

重點新聞(2021/11/11~2021/11/17)

  網路洞察工具     SaaS故障     監控地圖  

ThousandEyes全球網路洞察地圖添SaaS服務監控,追蹤逾2萬座機房內SaaS運作狀況

思科旗下網路效能監控業者ThousandEyes,近日為自家推出的網路洞察監控工具,添加應用程式故障監控功能,以地圖呈現當前全球各地發生的SaaS故障事件,供IT維運人員掌握應用程式的運作情形。企業除可從ThousandEyes網路故障地圖上,掌握各地網路服務故障事件,現還可監控應用程式故障事件,並從地圖一旁的列表中,了解過去5天發生的SaaS中斷事件,然目前無法點選單一事件來獲得故障狀況的進一步資訊。

這個新功能類似監控網站Downdetector提供的監控工具,但不同的是,新功能的SaaS運作資料是來自,部署在超過2萬座資料中心的ThousandEyes可觀測性套件回傳的資訊,而Downdetector則是仰賴民眾主動通報應用程式故障狀況,以及採用開源方式收集資訊。因此,思科宣稱ThousandEyes地圖提供的資訊,相比其他同質性服務更接近源頭。(詳全文)

  GCP      網路基礎設施     中斷事件   

Google雲端網路基礎設施又發生故障,導致Spotify、Snapchat等多個網站停擺

Google雲端服務在太平洋標準時間11月16日10點左右,又發生大規模故障事件,導致大量仰賴其雲端資源的網站停擺,包含Snapchat、Discord、Spotify、Etsy、Home Depot等網站都受影響,無法提供服務。Google在當日10點10分發布了服務中斷事件公告,提到因網路基礎設施服務Cloud Networking發生故障,導致由對外代理負載平衡器服務的網站,出現404錯誤。

此外,Cloud Networking故障也連帶造成GCP平臺其他服務,包含App Engine、Cloud Functions、Apigee和Cloud Run,暫時中斷。整起雲端服務故障事件,歷經近2小時排除。Google說明,故障發生當下,對外代理負載平衡器的配置更改未生效,使得用戶的網站停擺,經調整,配置已可正常推送,並表示,經內部完整調查後,會對外發布此次事件的分析報告。(詳全文)

  日本政府上雲    AWS    GCP平臺  

日本政府選定AWS和GCP作為首批上雲系統的執行環境,目標統一各機關系統基礎設施減少維運成本

甫於9月正式成立的日本政府數位廳,已在10月底宣布,選定AWS和GCP平臺作為執行全國性行政系統的首批公有雲環境。這項宣布是隸屬在日本政府共用平臺上雲建置工作專案,目的是要統一和標準化各部會和機關自行維運系統的基礎設施,以降低維運人力需求,減少維護成本 。

根據日媒日經新聞的報導,數位廳選擇外部雲端環境時,在安全、資料管理和法遵面,約有350項要求,而經檢核AWS和GCP環境,確認兩者滿足各項需求,會先搬遷數位廳的網站,還有8個市政廳網站上雲,作為試點基礎,進行測試。數位廳計畫鼓勵各地方政府在2025年前,搬遷所有自行維運的系統上政府雲,預估可減少約3成的政府年度IT預算。(詳全文)

  Google雲端    機器學習    工作管線建置  

Google推出機器學習工作管線建置服務,加速機器學習工作流程

Google近日推出機器學習工作管線服務Vertex Pipelines,企業可用來建立機器學習工作管線,加速在內部複製機器學習工作流程,甚至可進一步利用工作管線建立系統,來自動重新訓練和部署模型,實現MLOps。Vertex Pipelines支援Kubeflow Pipelines(KFP)和TensorFlow Extended(TFX)開源函式庫,企業可透過KFP和TFX將工作管線步驟轉換成容器,來封裝機器學習流程,並在Vertex Pipelines上執行。

另外,Vertex Pipelines是一項無伺服器服務,企業上傳和執行KFP或TFX工作管線後,不需處理基礎設施的配置,可專注機器學習作業,由Vertex AI處理配置和擴充基礎設施。Vertex Pipelines與Vertex AI以及其他Google工具緊密整合,企業可在Vertex Pipeline中配置一系列工作管線步驟,包含從BigQuery匯入資料,到使用Vertex AI訓練模型,接著用Cloud Storage儲存工作管線產出物,最後獲得模型評估指標,並且部署模型到Vertex AI端點。(詳全文)

  AWS     應用韌性評估      恢復時間目標  

AWS推出可評估應用程式韌性的Resilience Hub服務,可用來發現應用韌性弱點

針對應用程式的韌性需求,AWS推出應用韌性評估服務Resilience Hub,企業可自行定義、追蹤和管理應用程式的韌性。Resilience Hub的韌性評估功能採用Well-Architected Framework最佳實踐,可發現應用基礎設施不完整或是錯誤的配置,找出潛在的韌性弱點,來評估企業應用程式的韌性。通過Resilience Hub,企業可依自身業務和應用程式的狀況,用秒、分、小時和天為單位,來衡量應用恢復時間目標(RTO),也就是應用從故障中恢復的時間,還有設定應用恢復點目標(RPO),代表故障發生後,經最長多少時間應用可能會丟失資料。

接著,Resilience Hub會根據企業設定的目標,評估應用程式的配置是否滿足要求,提供建議和韌性分數,來追蹤、改善應用程式的韌性。AWS表示,AWS Resilience Hub評估涵蓋的範圍,不僅是應用程式軟體和程式碼,還包括託管應用程式的整個基礎設施堆疊,像是網路、VM和資料庫等。目前新韌性服務已在美國俄亥俄州、奧勒岡州、法蘭克福、新加坡、東京等地區提供,會陸續在更多的地區上線。用戶可以免費試用Resilience Hub服務6個月,之後按追蹤的應用程式數量,每個應用每月15美元來付費。(詳全文)

  Google雲端     資料庫服務     資料清除    

Google Cloud Spanner現在可以設定資料刪除政策,降低清理對資料庫效能造成的影響

Google在分散式資料庫服務Cloud Spanner加入Time To Live(TTL)功能,企業雲端管理員可用來設定政策,來定期清理Spanner資料表中不要的資料,除減少儲存空間降低成本外,也能確保資料庫資料符合資料留存法規。TTL會在Spanner後臺持續運作,管理員可用宣告方式指定資料表列的刪除政策,像是刪除時間點,不需撰寫程式碼,或是使用外部腳本來清理資料。之後,TTL會依照管理員設定的政策,在指定時間清除資料。

TTL因是Spanner的內建功能,具擴充性,可掃描和刪除企業執行實例所有節點的過期資料,即便資料庫規模隨時間推進,越來越大,TTL也會因應自動擴充掃瞄範圍。此外,與執行一次性的資料清理腳本相比,因TTL清除程序會選在系統處低優先需求的時間段,來運作,能夠最大程度減少對資料庫工作負載產生的影響。TTL功能還整合進Cloud Monitoring中,管理員能端到端監控進度和警示,不需建立和維護額外的工作管線。TTL現已經上線,提供所有Spanner用戶免費使用。(詳全文)

  微軟     Azure    DDoS 防護   

微軟推出內嵌式DDoS防護方案,搭配第三方防護使用Azure DDoS服務,提升Azure環境防護力

因應DDoS攻擊複雜性和頻率迅速演變的態勢,微軟近日發布內嵌式DDoS防護方案預覽版,可通過部署了Azure Gateway負載平衡器,以及整合Azure DDoS防護標準服務的合作夥伴網路虛擬設備,來緩解DDoS攻擊。內嵌式DDoS防護結合了Azure DDoS防護標準服務,提供L3至L7的全面防護,來緩解體積型的DDoS攻擊,包含短時間爆發的低量DDoS攻擊,保護企業存放在Azure的資源,且不影響對延遲高度敏感應用的可用性或效能。企業可至Azure市集挑選虛擬設備,來部署網路虛擬設備執行實例,就可以展開內嵌式DDoS防護方案的部署工作。新方案未來將在所有Azure地區提供使用。(詳全文)

  Google雲端    GKE      基礎設施管理   

GKE基礎設施自動管理功能Autopilot現支援競價式Pod,供企業執行不需高可靠度負載省成本

Google為K8s服務GKE的基礎設施自動管理功能Autopilot,添加競價式(Spot)Pod的支援,供企業可以為不需高可靠性的工作負載,選擇更便宜的方式在GKE Autopilot上執行。Google考量企業有些工作負載不需生產等級的可靠性,像是容錯批次處理負載,可使用競價式Pod執行GKE叢集和節點池,來降低使用成本,因而為可自動管理K8s基礎設施的Autopilot,增加競價式Pod的支援。企業使用競價式 Pod執行工作負載時,可以獲得少於定價6成至91%的折扣,然而,當GCP平臺運算資源需求量高時,企業競價式資源可能會被收回。GKE從1.21.4版本開始提供競價式Pod,而Autopilot會將競價式Pod和一般Pod分開,不會落在同一節點上。(詳全文)

圖片來源/ThousandEyes、Google雲端、AWS、微軟

  更多Cloud動態  

1. 臺南市政府採混合雲架構,打造城市動態影像AI感知平臺,辨識重要路口交通情形、景點人流及公共場所防疫狀況(詳全文)

2. 微軟找上剛正式從IBM脫離的基礎架構管理服務商Kyndryl合作,要推進Microsoft Cloud在混合雲市場的發展。(詳全文)

3. AWS發布搭載Nvidia A10G GPU的EC2執行實例G5,機器學習效能達前一代3倍以上(詳全文)

4. Google承諾5年內投資澳洲10億美元,強化當地自家雲端服務設施(詳全文)

資料來源:iThome整理,2021年11月


熱門新聞

Advertisement