(網(wǎng)經(jīng)社訊)10月20日消息,亞馬遜云計算服務(wù)(AWS)在美國東部地區(qū)的US-EAST-1數(shù)據(jù)中心發(fā)生大規(guī)模故障,導(dǎo)致全球數(shù)千個網(wǎng)站和應(yīng)用程序陷入癱瘓。此次服務(wù)中斷持續(xù)約15小時,是自2024年CrowdStrike系統(tǒng)故障以來全球最大規(guī)模的網(wǎng)絡(luò)中斷事件。
網(wǎng)經(jīng)社跨境電商臺(CBEC.100EC.CN)獲悉,故障起源于亞馬遜位于弗吉尼亞州北部的US-EAST-1數(shù)據(jù)中心區(qū)域,這是AWS運營歷史最悠久、規(guī)模最大的數(shù)據(jù)中心集群之一。技術(shù)分析表明,問題的核心在于“DynamoDB API的DNS解析異?!保瑢?dǎo)致系統(tǒng)無法將DynamoDB數(shù)據(jù)庫服務(wù)的名稱轉(zhuǎn)換為有效的網(wǎng)絡(luò)地址。盡管服務(wù)器本身仍在運行,但由于DNS解析失敗,用戶請求無法被正確導(dǎo)向目標服務(wù)。
據(jù)網(wǎng)絡(luò)監(jiān)測平臺Downdetector統(tǒng)計,全球有超過400萬用戶報告了服務(wù)異常。受影響的服務(wù)范圍廣泛,包括亞馬遜自家的電商網(wǎng)站、Alexa語音助手和Amazon Prime Video,以及金融平臺PayPal旗下Venmo、在線券商Robinhood、游戲平臺Steam、Roblox和社交媒體Snapchat等。英國多家銀行和電信服務(wù)提供商也受到波及。
對于亞馬遜平臺上的賣家而言,此次故障導(dǎo)致后臺管理系統(tǒng)無法正常訪問,商品頁面出現(xiàn)“內(nèi)部錯誤”提示,賬戶余額顯示異常。賣家在故障期間無法處理訂單、調(diào)整廣告或聯(lián)系客服,正值萬圣節(jié)和“黑色星期五”等年終促銷活動前的關(guān)鍵準備期。
這已是過去五年內(nèi)US-EAST-1區(qū)域至少第三次引發(fā)全球性互聯(lián)網(wǎng)癱瘓。專家指出,此次事件凸顯了現(xiàn)代數(shù)字服務(wù)對少數(shù)幾家全球云平臺的深度依賴。薩里大學(xué)計算機科學(xué)系研究主任尼桑·薩斯特里表示:“根本問題在于,幾乎所有大型企業(yè)都在使用同一家底層服務(wù)商,形成了單點故障的風(fēng)險。”
云計算服務(wù)中斷對企業(yè)的財務(wù)影響顯著。保險經(jīng)紀公司McGill and Partners的美國網(wǎng)絡(luò)業(yè)務(wù)負責(zé)人瑞安·格里芬指出:“對大型企業(yè)而言,數(shù)小時的云服務(wù)中斷就意味著數(shù)百萬美元的生產(chǎn)力和收入損失?!北M管發(fā)生嚴重故障,亞馬遜股價在事件后反而上漲1.6%,顯示市場對其長期前景保持信心。
截至美東時間10月20日早上6點,亞馬遜宣布大多數(shù)受影響服務(wù)已恢復(fù)正常運行。然而,此次事件再次引發(fā)了對云計算中心化架構(gòu)穩(wěn)定性的關(guān)注,以及企業(yè)過度依賴單一云服務(wù)商的風(fēng)險。


































