2021年10月4日Facebook當機的原因
今天,Facebook 及其附屬服務 WhatsApp 和 Instagram 都已關閉。他們的 DNS 名稱停止解析,他們的基礎設施 IP 無法訪問。初步分析是BGP路由配置錯誤導致!
以下是cloudflare的博文分析:
什麼是BGP
BGP代表邊界閘道器協議。它是一種在 Internet 上的自治系統 (AS) 之間交換路由資訊的機制。 網際網路正常運轉需要大型路由器,這些路由器擁有龐大的、不斷更新的可能路由列表,可用於將每個網路資料包傳送到其最終目的地。如果沒有 BGP,網際網路的路由器將不知道該做什麼,網際網路將無法工作。
Internet網際網路顧名思義就是一個網路的網路,它由 BGP 繫結在一起。BGP 允許一個網路(例如 Facebook)向構成 Internet 的其他網路通告其存在。在這段中斷時間內,Facebook 沒有向其他路由廣播其存在,ISP 和其他網路無法找到 Facebook 的網路,因此它變得不可用。
每個單獨的網路都有一個 ASN:自治系統編號。自治系統 (AS) 是具有統一內部路由策略的單個網路。AS 可以產生字首(比如它們控制一組 IP 地址),以及傳輸字首(比如它們知道如何到達特定的 IP 地址組)。每個 ASN 都需要使用 BGP 向 Internet 通告其字首路由;否則,沒有人會知道如何連線以及在哪裡找到它。
Facebook的BGP路由問題導致DNS解析失敗:
DNS 受到影響
在 UTC 時間1658,我們注意到 Facebook 已停止公佈其 DNS 字首的路由。這意味著,至少,Facebook 的 DNS 伺服器不可用。因此,Cloudflare 的 1.1.1.1 DNS 解析器無法再響應詢問 facebook.com 或 instagram.com 的 IP 地址的查詢。
其直接後果是,世界各地的 DNS 解析器停止解析其域名。
發生這種情況是因為 DNS 與 Internet 上的許多其他系統一樣,也有其路由機制。當有人在瀏覽器中鍵入https://facebook.com URL 時,DNS 解析器負責將域名轉換為要連線的實際 IP 地址,首先檢查它的快取中是否有內容並使用它。如果沒有,它會嘗試從域名伺服器中獲取答案,域名伺服器通常由擁有它的實體託管。
如果域名伺服器無法訪問或由於某些其他原因無法響應,則返回 SERVFAIL,並且瀏覽器會向使用者發出錯誤訊息。
但這還不是全部。現在,人類行為和應用程式邏輯開始發揮作用並導致另一個指數效應。隨之而來的是額外的 DNS 流量海嘯。1.1.1.1處理的查詢比平時多 30 倍,並可能導致其他平臺出現延遲和超時問題。
發生這種情況的部分原因是應用程式不會接受答案錯誤並開始重試,有時是積極的,部分原因是終端使用者也不會接受答案錯誤並開始重新載入頁面,或殺死並重新啟動他們的應用程式,有時還是很積極重試。
其他訊息渠道
其他人認為:Facebook、Instagram、WhatsApp 都是因 BGP 配置錯誤而關閉。
還有人認為:Facebook 當前的中斷是如何由reactjs的合成事件逃逸和堵塞網際網路管道造成的。
有人很生氣:人們拿 Facebook 服務當機開玩笑讓我感到噁心。任何當時使用 Oculus 耳機的人目前都被困在 VR虛擬現實中,他們會像在現實生活中死去。#元宇宙
相關文章
- Facebook, Instagram, and WhatsApp當機事件的原因線索(2021-10-04晚開始)APP事件
- 如何查詢Linux當機的原因?Linux
- Facebook當機事故,暴露了上雲不是唯一的答案
- Facebook、WhatsApp、Instagram出現全球大範圍當機APP
- 伺服器經常當機有哪些原因伺服器
- 伺服器經常當機都有哪些原因伺服器
- 伺服器當機常見原因有哪些伺服器
- 電腦當機重啟的快捷鍵是什麼 導致電腦當機的原因有哪些
- Facebook全球服務中斷,一週當機兩次
- 電腦經常當機是什麼原因 電腦經常當機解決方法
- Facebook當機背後,我們該如何及時發現DNS問題DNS
- 亞馬遜AWS當機十小時,這次是人為原因亞馬遜
- 資料庫伺服器當機2小時之"找不出原因"資料庫伺服器
- 核彈級漏洞、Facebook當機,2021年發生了哪些網路安全大事件?事件
- Facebook遭遇有史以來最嚴重當機事件,罪魁禍首與DNS故障有關?事件DNS
- Facebook、Instagram和WhatsApp全球當機超10小時,自稱與網路攻擊無關APP
- 史上最嚴重:Facebook 遭遇全球當機近 7 小時後重新上線,股價下跌5%
- 揭秘FACEBOOK未來的機器學習平臺機器學習
- JVM當機分析JVM
- 揭祕FACEBOOK未來的機器學習平臺機器學習
- 導致物聯網路卡停機的原因
- Redis的KEYS命令引起當機事件Redis事件
- Redis Cluster 當機引發的事故Redis
- 當「轉型人工智慧」成為一個好公司走向失敗的原因……人工智慧
- Facebook AI指出:CNN的padding機制,存在一大缺陷AICNNpadding
- 智慧雲解析的當機切換是如何實現的?如何有效預防伺服器當機?伺服器
- Redis當機恢復Redis
- mongoDB當機修復MongoDB
- 硬碟開機報錯是什麼原因引起的硬碟
- 搬瓦工香港VPS主機變慢的原因分析
- DRM特性引起的RAC節點當機
- win10右鍵檔案就假當機的原因 win10右鍵點資料夾就卡死解決方法Win10
- 電腦主機聲音大是什麼原因?電腦主機聲音大嗡嗡響的原因和解決方法
- win10經常當機怎麼辦 電腦頻繁卡住當機的解決方法Win10
- SAP CRM Fiori 應用裡無法根據當前文件建立 Followup Opportunity 的原因分析Unity
- 伺服器停機或者崩潰的原因有哪些伺服器
- Facebook 網頁登入基於 Facebook 的 PHP-graph-sdk網頁PHP
- Redis當機 快速恢復Redis