Liv McMahon,technology reporter and
Lily Jamali,North America technology correspondent
Getty Images⚡ बड़े आउटेज से जुड़ा समाचार: Amazon Web Services (AWS) में ख़राबी के बाद Snapchat और बैंक हुए प्रभावित
Amazon Web Services (AWS) ने देर रात सोमवार को कहा कि उसने बड़े पैमाने पर आई उस ख़राबी को दूर कर लिया है जिसने दिन के अधिकांश समय के लिए दुनिया की कुछ सबसे बड़ी वेबसाइटों को ऑफ़लाइन कर दिया था।
स्नैपचैट जैसे सोशल मीडिया प्लेटफॉर्म और लॉयड्स (Lloyds) और हॉलिफ़ैक्स (Halifax) जैसे बैंकों सहित 1,000 से अधिक ऐप्स और वेबसाइटें प्रभावित हुईं। Amazon ने कहा कि ये समस्याएँ क्लाउड कंप्यूटिंग दिग्गज के अमेरिका में स्थित संचालन के केंद्र में थीं।
प्लेटफ़ॉर्म आउटेज मॉनिटर Downdetector ने कहा कि सोमवार को आउटेज के दौरान वैश्विक स्तर पर समस्याओं की उपयोगकर्ता रिपोर्ट 1.1 करोड़ से अधिक हो गई थीं।
Amazon द्वारा अंतर्निहित समस्या को ठीक करने के बाद भी, विशेषज्ञों ने कहा कि इस आउटेज ने यह उजागर किया कि इतनी सारी कंपनियों का एक ही, प्रमुख प्रदाता पर निर्भर होना कितना खतरनाक हो सकता है।
आधारभूत संरचना की परस्पर निर्भरता
सरे विश्वविद्यालय (University of Surrey) के प्रोफेसर एलन वुडवर्ड ने कहा, “इस घटना ने इस बात को उजागर किया है कि हमारी आधारभूत संरचना (infrastructure) कितनी परस्पर निर्भर है।”
“इतनी सारी ऑनलाइन सेवाएँ अपने भौतिक बुनियादी ढांचे के लिए तीसरे पक्ष (third parties) पर निर्भर करती हैं, और यह दिखाता है कि समस्याएँ उन सबसे बड़े तृतीय-पक्ष प्रदाताओं में भी हो सकती हैं। छोटी त्रुटियाँ, जो अक्सर मानव निर्मित होती हैं, उनका व्यापक और महत्वपूर्ण प्रभाव हो सकता है।”
यह समस्याएँ सोमवार को लगभग 07:00 BST (ब्रिटिश समयानुसार) के आसपास शुरू हुईं, जब उपयोगकर्ताओं ने कई प्लेटफार्मों तक पहुँचने में समस्याएँ बताना शुरू कर दिया।
इसमें Fortnite जैसे बड़े ऑनलाइन गेम्स से लेकर Duolingo जैसे भाषा सीखने वाले ऐप तक, विभिन्न प्रकार की साइटें और सेवाएँ शामिल थीं। Downdetector ने दिन की शुरुआत में बीबीसी को बताया कि उसने कुछ ही घंटों में 500 साइटों पर उपयोगकर्ताओं से चार मिलियन से अधिक रिपोर्टें देखी थीं—जो कि एक पूरे सामान्य कार्यदिवस में देखी जाने वाली राशि से दोगुनी से अधिक थी।
उसने कहा कि ये रिपोर्टें बाद में 1.1 करोड़ से अधिक पर पहुँच गईं, क्योंकि Reddit और लॉयड्स बैंक जैसी और सेवाएँ ठीक होने की कोशिश कर रही थीं।
लगभग 23:00 BST पर, Amazon ने कहा कि सभी AWS सेवाएँ “सामान्य परिचालन पर लौट आई हैं।“
लेकिन इससे पहले कंपनी को मूल समस्या का समाधान करने के लिए अपने सिस्टम के कुछ हिस्सों को थ्रॉटल (throttle) करना पड़ा।
नोट्रे डेम विश्वविद्यालय में सूचना प्रौद्योगिकी के प्रोफेसर माइक चैपल के अनुसार, प्रारंभिक आउटेज के बाद “कैस्केडिंग विफलताओं” (cascading failures) की एक नई श्रृंखला उत्पन्न हो सकती है।
मिस्टर चैपल ने कहा, “यह ऐसा है जैसे आपके पास बड़े पैमाने पर बिजली गुल हो गई हो। दल इसे वापस ऑनलाइन लाने की कोशिश में जुट जाते हैं।” उन्होंने समझाया, “बिजली शायद कुछ बार झिलमिला सकती है,” लेकिन यह संभव है कि Amazon ने शुरू में “केवल लक्षणों को संबोधित किया” था, न कि कारण को।
असल में क्या ख़राबी आई?
Amazon ने अभी तक पूरी तरह से यह विवरण नहीं दिया है कि सोमवार के आउटेज का कारण क्या था और न ही इस संबंध में कोई आधिकारिक बयान जारी किया है।
उसने अपने सेवा स्थिति वेब पेज पर एक अपडेट में कहा कि यह समस्या “US-EAST-1 में DynamoDB API एंडपॉइंट के DNS रिज़ॉल्यूशन से संबंधित प्रतीत होती है।“
DNS (डोमेन नेम सिस्टम) को अक्सर इंटरनेट के लिए फोन बुक के रूप में उपमा दी जाती है।
यह प्रभावी रूप से उन वेबसाइट नामों (जैसे bbc.co.uk) का अनुवाद करता है जिनका उपयोग लोग संख्याओं में करते हैं जिन्हें कंप्यूटर पढ़ और समझ सकते हैं। यह प्रक्रिया मूल रूप से इंटरनेट के उपयोग के तरीके को आधार प्रदान करती है, और इसमें व्यवधान से वेब ब्राउज़र उस सामग्री का पता लगाने में असमर्थ हो सकते हैं जिसे वे ढूंढ रहे हैं।
क्लाउडफ्लेयर (Cloudflare) के मुख्य कार्यकारी मैथ्यू प्रिंस ने बीबीसी को बताया कि AWS आउटेज ने उस शक्ति को उजागर किया जो क्लाउड सेवाओं के पास इंटरनेट के काम करने के तरीके पर है।
उन्होंने कहा, “हर किसी का एक बुरा दिन होता है, आज Amazon का बुरा दिन था।“
“क्लाउड के बारे में अद्भुत बातें हैं, यह आपको स्केल करने की अनुमति देता है… लेकिन अगर आपको इस तरह का आउटेज होता है तो यह कई सेवाओं को बंद कर सकता है जिन पर हम निर्भर हैं।”
और फ्यूचर ऑफ टेक्नोलॉजी इंस्टीट्यूट की प्रमुख कोरी क्राइडर ने बीबीसी को बताया कि यह “पुल ढहने जैसा” था। उन्होंने कहा, “अर्थव्यवस्था का एक आवश्यक हिस्सा ध्वस्त हो गया है।“
और क्लाउड कंप्यूटिंग का इतना अधिक हिस्सा Amazon, Microsoft और Google पर निर्भर करता है—जिसका अनुमान लगभग 70% है—उन्होंने कहा कि यथास्थिति “अस्थिर (unsustainable)” है।
उन्होंने कहा, “एक बार जब आपके पास मुट्ठी भर एकाधिकार प्रदाताओं में केंद्रित आपूर्ति होती है, तो जब ऐसा कुछ गिरता है, तो यह अर्थव्यवस्था के एक बड़े प्रतिशत को अपने साथ ले जाता है।”
“हमें मुट्ठी भर अमेरिकी एकाधिकार प्लेटफार्मों पर निर्भर रहने के बजाय अधिक स्थानीय सेवाएँ खरीदने की कोशिश करनी चाहिए। यह हमारी सुरक्षा, हमारी संप्रभुता और हमारी अर्थव्यवस्था के लिए एक जोखिम है और हमें इस तरह के झटकों के प्रति अपने बाज़ारों को अधिक लचीला बनाने के लिए संरचनात्मक अलगाव (structural separations) को देखना होगा।”
कंपनियों की जिम्मेदारी
एक कंप्यूटर विज्ञान विशेषज्ञ का कहना है कि कुछ जिम्मेदारी उन कंपनियों की है जो AWS का उपयोग करती हैं।
न्यूयॉर्क के कॉर्नेल विश्वविद्यालय में कंप्यूटर विज्ञान के प्रोफेसर केन बर्मन कहते हैं, “Amazon का उपयोग करने वाली कंपनियाँ अपने अनुप्रयोगों में सुरक्षा प्रणालियों का निर्माण करने के लिए पर्याप्त सावधानी नहीं बरत रही हैं।”
बर्मन बीबीसी को बताते हैं कि ऐप डेवलपर्स को क्लाउड में रहने वाले मिशन-क्रिटिकल अनुप्रयोगों का बैकअप लेने में निवेश करने का ध्यान रखना चाहिए।
बर्मन कहते हैं, “हम जानते हैं कि इन प्रणालियों को कैसे मजबूत बनाया जाए, और हम जानते हैं कि इसे सुरक्षित रूप से कैसे किया जाए।“
जिम्मेदारी का सवाल अदालतों में भी आ सकता है।
बड़े CrowdStrike आउटेज के एक साल से अधिक समय बाद, डेल्टा एयरलाइंस अभी भी $500 मिलियन से अधिक के नुकसान की वसूली के लिए कंपनी के साथ कानूनी लड़ाई लड़ रही है।
CrowdStrike द्वारा समस्या को ठीक करने के बाद भी, एयरलाइन ने कहा कि उसे 40,000 सर्वरों को मैन्युअल रूप से रीसेट करना पड़ा, जिससे कई दिनों तक प्रमुख उड़ानें विलंबित हुईं।
अतिरिक्त रिपोर्टिंग: एसिलट कार


