數據中心停電後 Cloudflare控制面板和API出現大面積長時間故障


Cloudflare的一次長時間故障導致其許多服務癱瘓,包括最常用的客戶後臺儀表板和用於管理和讀取服務配置的相關應用編程接口(API)都無法使用,不少網站一度無法管理自己的業務(包括cnBeta……)。功能全部或部分受到影響的服務的完整列表包括Cloudflare儀表板、CloudflareAPI、Logpush、WARP/ZeroTrust設備態勢、StreamAPI、WorkersAPI和警報

Cloudflare表示:"這個問題會影響依賴於我們API基礎設施的所有服務,包括Zero Trust, WARP, Cloudflared, Waiting Room, Gateway, Stream, Magic WAN, API Shield, Pages, Workers。"

"使用Dashboard/Cloudflare API的客戶會受到影響,因為請求可能會失敗和/或顯示錯誤"。

客戶目前在嘗試登錄其賬戶時遇到問題,並看到'Code: 10000"身份驗證錯誤,並且在嘗試訪問 Cloudflare 控制面板時出現內部服務器錯誤。

Cloudflare 表示,服務問題不會影響通過 Cloudflare CDN 或 Cloudflare Edge 安全功能進行的緩存文件交付。

Cloudflare_outage.webp

Cloudflare 儀表板故障截屏

儀表盤和 API 問題背後是數據中心停電

主要業務停運兩個小時後,該公司透露,持續的問題是由於多個數據中心停電造成的。

"Cloudflare 正在評估斷電對數據中心的影響,同時服務也出現故障。我們將定期提供更新,直到問題得到解決,在我們努力緩解問題的過程中,感謝您的耐心等待。"

這是 Cloudflare 自本周以來遭遇的第二次大面積故障,第一次是在 10 月 30 日星期一,包括 Cloudflare 站點和服務(Access, CDN Cache Purge, Dashboard, Images, Pages, Turnstile, Waiting Room, WARP, Workers KV)在內的多個產品癱瘓。

正如該公司在兩天後發佈的事後報告中解釋的那樣,周一的故障是由於用於部署新的 Workers KV 版本的工具配置錯誤造成的。

Cloudflare 的 Matt Silverlock 和 Kris Evans 說:"客戶和 Cloudflare 團隊都使用 Workers KV 來管理配置數據、路由查詢、靜態資產捆綁、身份驗證令牌和其他需要低延遲訪問的數據。在此次事件中,由於 KV 使用的新部署工具中的一個錯誤,KV 返回它認為有效的 HTTP 401(未授權)狀態代碼,而不是請求的鍵值對。"

美國東部時間 11 月 02 日 20:12 更新:Cloudflare 發言人透露,此次持續中斷的根本原因是發電機故障導致的區域性電力問題,導致設施脫機。

"我們在俄勒岡州的多個冗餘數據中心運行,為 Cloudflare 的控制平面(儀表盤、日志等)提供電力。一次區域性電力問題影響該地區的多個設施。這些設施一夜之間無法發電。今天上午,多臺發電機發生故障,導致這些設施完全斷電,"發言人說。

"我們已將故障轉移到災難恢復設施,大部分服務已經恢復。這次數據中心故障影響 Cloudflare 的儀表盤和 API,但並沒有影響通過我們全球網絡的流量。我們正在與我們的數據中心供應商合作,調查區域性停電和發電機故障的根本原因。我們預計將根據解到的情況發佈多篇博客,並在博客上線後與您分享。


相關推薦

2023-11-06

“總不能讓我這個上班才1周的新人來背鍋吧?”CloudFlare作為全球最為知名的網絡服務提供商之一,偶爾出現中斷是很常見的事情,一般來說CloudFlare有多種不同的冗餘策略,即便掛影響范圍也比較小。但是前兩天 CloudFlare 出現的

2022-07-09

公司報道,運營商Tbaytel說,羅傑斯的故障是全國性的。Cloudflare網絡雷達圖顯示,今天清晨羅傑斯的流量變化不正常,其負載共享網絡和加拿大羅傑斯之間的通信表現出正常的夜間模式,然後在美國東部時間凌晨3點之前下降到基

2022-09-01

》網站在近日的報道中,列出值得人們警惕的網絡威脅。數據勒索數據勒索指借助勒索軟件使被攻破的計算機的數據無法使用,隨後攻擊者提供一種恢復數據的方法,並索取一筆贖金;或者黑客先創建數據的副本,然後威脅要公

2024-02-29

早在2022年,Cloudflare就宣佈放棄Nginx,轉而使用Rust自行編寫的軟件Pingora。今天,Cloudflare將開源Pingora框架。Cloudflare今天宣佈在Apache2.0許可下開源Pingora。Pingora是一個Rust異步多線程框架,用於構建可編程的網絡服務。Pingora 長期以

2024-01-31

DNSSEC)的技術問題有關,DNSSEC用於確保互聯網協議網絡中數據交換的安全。該部在周二晚些時候表示,問題已經解決,訪問已經恢復。國營運營商 Ria 援引流量監測服務公司 Downradar 的報道稱,包括最受歡迎的本地搜索引擎 Yandex

2022-08-16

底就曾進行過風險提示,八月份開始保證部分重點企業(停電限電影響較大的企業)用電。但用電負荷量的激增顯然超出預期。自今年入夏以來,四川省遭遇60年一遇的大范圍、長時間極端高溫天氣,流域幹旱導致水力發電能力

2022-09-29

iCloud驗證AppleID賬號,從而繞過CAPTCHA驗證方式。而得益於Cloudflare推出的最新TurnstileAPI,幾乎任何網站都可以利用該功能來消除CAPTCHA。Automatic Verification 此前僅限於支持私有訪問令牌的網站和應用程序。不過歸功於 Cloudflare 推出的

2022-12-24

求輪流停電以應對用電量飆升。根據追蹤網站FlightAware的數據,截至美國周五下午,過去兩天的航班取消量達到7000架次,從西北太平洋地區到東海岸的航空樞紐,受到天氣幹擾而取消的航班數量不斷增多。雖然風暴帶來降雪和嚴

2023-11-29

稱,App隻是接口,用戶方面使用,但是App都要去訪問底層數據,從公司層面來說滴滴肯定會在各個業務之間做隔離,如果是所有產品都崩潰,一定指向更底層的問題。截至記者發稿,大部分城市已經恢復滴滴打車功能,不過也有

2023-11-17

iPhone自帶的天氣App因多次出現數據不更新問題,已經被很多用戶吐槽。今日,詞條#蘋果天氣又崩#登上微博熱搜,根據大傢反饋,從昨晚開始,陸續有網友發現iOS、iPadOS等天氣出現長時間未響應狀態,天氣信息不更新。對此,有

2023-11-19

時無法提供服務。阿裡雲發佈故障通報稱,在中國香港的數據中心機房降溫系統出現故障,導致服務器宕機持續超過 12 個小時,而且沒有完善的備用冗餘方案,這被認為是阿裡雲運營十多年來持續時間最長的一次大規模故障。

2022-10-20

,位於韓國京畿道城南市盆唐區三平洞SKC&C板橋數據中心發生火災。據韓國警方消息,起火地點為數據中心A棟地下3層電氣室的鋰電池架附近。電源堆放在五個電池架上,事發時,其中一個鋰電池產生火花並引發火災,

2024-03-06

知名網絡服務提供商CloudFlare今天宣佈推出FirewallforAI,這並不是基於AI技術開發的傳統防火墻應用,而是專門為AI開發的防火墻。這個AI防火墻的主要客戶是企業,即面向那些部署AI模型的企業,在部署之前提供一個保護層,如果

2022-09-29

趕在10月份的Connect大會之前,Cloudflare已於本周雄心勃勃地宣佈一個名為Turnstile的新項目,其旨在取代在全網用於驗證真人(而非機器人)訪問的CAPTCHA圖形驗證碼。一些網站有提供AI支持的驗證碼解決方案,且每千次的驗證成本