नाथन (आस्ट्रेलिया)। इस सप्ताह के अंत में एक सॉफ्टवेयर अपडेट के गलत होने के कारण वैश्विक आईटी आउटेज ने आधुनिक आईटी बुनियादी ढांचे की परस्पर जुड़ी और अक्सर नाजुक प्रकृति को उजागर कर दिया। यह दर्शाता है कि विफलता के एक बिंदु के दूरगामी परिणाम कैसे हो सकते हैं।
यह आउटेज क्राउडस्ट्राइक फाल्कन के लिए स्वचालित रूप से शुरू किए गए एकल अपडेट से जुड़ा था, जो एक सर्वव्यापी साइबर सुरक्षा उपकरण है जिसका उपयोग मुख्य रूप से बड़े संगठनों द्वारा किया जाता है। इससे दुनिया भर के माइक्रोसॉफ्ट विंडोज कंप्यूटर क्रैश हो गए।
क्राउडस्ट्राइक ने अपनी ओर से समस्या का समाधान कर दिया है। जबकि कई संगठन अब काम फिर से शुरू कर पा रहे हैं, आईटी टीमों को सभी प्रभावित प्रणालियों को पूरी तरह से ठीक करने में कुछ समय लगेगा – उनमें से कुछ काम मैन्यूली करना होगा।
ऐसा कैसे हो सकता है?
कई संगठन समान क्लाउड प्रदाताओं और साइबर सुरक्षा समाधानों पर भरोसा करते हैं। परिणाम डिजिटल मोनोकल्चर का एक रूप है। जबकि इस मानकीकरण का मतलब है कि कंप्यूटर सिस्टम कुशलतापूर्वक चल सकते हैं और व्यापक रूप से संगत हैं, इसका मतलब यह भी है कि एक समस्या कई उद्योगों और भौगोलिक क्षेत्रों में फैल सकती है। जैसा कि हमने अब क्राउडस्ट्राइक के मामले में देखा है, यह पूरी दुनिया में भी फैल सकता है। आधुनिक आईटी बुनियादी ढांचा अत्यधिक परस्पर जुड़ा हुआ और अन्योन्याश्रित है। यदि एक घटक विफल हो जाता है, तो यह ऐसी स्थिति पैदा कर सकता है जहां विफल घटक एक श्रृंखला प्रतिक्रिया को टिगर करता है जो सिस्टम के अन्य हिस्सों को प्रभावित करता है।
जैसे-जैसे सॉफ्टवेयर और उनके द्वारा संचालित नेटवर्क अधिक जटिल होते जाते हैं, अप्रत्याशित इंटरैक्शन और बग की संभावना बढ़ती जाती है। एक छोटे से अपडेट के अनपेक्षित परिणाम हो सकते हैं और यह पूरे नेटवर्क में तेजी से फैल सकता है। जैसा कि हमने अब देखा है, पर्यवेक्षकों द्वारा इसे रोकने के लिए प्रतिक्रिया करने से पहले संपूर्ण सिस्टम को ठप किया जा सकता है।
माइक्रोसॉफ्ट कैसे शामिल था?
जब हर जगह विंडोज कंप्यूटर मौत की नीली स्क्रीन संदेश के साथ क्रैश होने लगे, तो शुरुआती रिपोर्टो में कहा गया कि आईटी आउटेज माइक्रोसॉफ्ट के कारण हुआ था। वास्तव में, माइक्रोसॉफ्ट ने पुष्टि की कि उसने मध्य अमेरिका क्षेत्र में क्लाउड सेवाओं में रुकावट का अनुभव किया है, जो गुरुवार, 18 जुलाई 2024 को पूर्वी समयानुसार शाम 6 बजे के आसपास शुरू हुआ। इस आउटेज ने विभिन्न एज्योर सेवाओं का उपयोग करने वाले ग्राहकों के एक उपसमूह को प्रभावित किया। एज्योर माइक्रोसाफ्ट का स्वामित्व वाला क्लाउड सेवा प्लेटफार्म है।
एज्योर आउटेज के दूरगामी परिणाम हुए, जिससे एयरलाइंस, खुदरा, बैंकिंग और मीडिया सहित कई क्षेत्रों में सेवाएं बाधित हुईं। न केवल अमेरिका में बल्कि अंतरराष्ट्रीय स्तर पर आस्ट्रेलिया और न्यूजीलैंड जैसे देशों में भी। इसने पॉवरबीआई, माइक्रोसाफ्ट फैब्रिक और टीम्स सहित विभिन्न माइक्रोसाफ्ट 365 सेवाओं को भी प्रभावित किया। जैसा कि अब पता चला है, पूरे एज्योर आउटेज का पता क्राउडस्ट्राइक अपडेट से भी लगाया जा सकता है। इस मामले में यह फाल्कन स्थापित के साथ विंडोज चलाने वाली माइक्रोसॉफ्ट की वर्चुअल मशीनों को प्रभावित कर रहा था।
इस प्रकरण से हम क्या सीख सकते हैं?
अपने सभी आईटी समाधान एक जगह पर न रखें। कंपनियों को मल्टी-क्लाउड रणनीति का उपयोग करना चाहिए: अपने आईटी बुनियादी ढांचे को कई क्लाउड सेवा प्रदाताओं में वितरित करें। इस तरह, यदि एक प्रदाता काम नहीं कर पाता है, तो अन्य महत्वपूर्ण कार्यों का समर्थन करना जारी रख सकते हैं।कंपनियां यह भी सुनिश्चित कर सकती हैं कि आईटी सिस्टम में अतिरेक का निर्माण करके उनका व्यवसाय संचालित होता रहे। यदि एक घटक नीचे जाता है, तो अन्य लोग आगे बढ़ सकते हैं। इसमें बैकअप सर्वर, वैकल्पिक डेटा केंद्र औरफेल ओवर तंत्र शामिल हैं जो आउटेज की स्थिति में तुरंत बैकअप सिस्टम पर स्विच कर सकते हैं।
नियमित आईटी प्रक्रियाओं को स्वचालित करने से मानवीय त्रुटि का जोखिम कम हो सकता है, जो आउटेज का एक सामान्य कारण है। स्वचालित प्रणालियाँ संभावित समस्याओं की भी निगरानी कर सकती हैं और महत्वपूर्ण समस्याएं पैदा होने से पहले उनका समाधान कर सकती हैं। आउटेज होने पर कैसे प्रतिक्रिया देनी है, इसके बारे में प्रशिक्षण देने वाले कर्मचारी एक कठिन स्थिति को वापस सामान्य स्थिति में ला सकते हैं। इसमें यह जानना शामिल है कि किससे संपर्क करना है, क्या कदम उठाना है और वैकल्पिक वर्कफ़्लो का उपयोग कैसे करना है।
आईटी आउटेज कितना बुरा हो सकता है?
इंटरनेट के बुनियादी ढांचे की वितरित और विकेंद्रीकृत प्रकृति के कारण इसकी अत्यधिक संभावना नहीं है कि दुनिया का संपूर्ण इंटरनेट कभी भी बंद हो सकता है। इसमें कई अनावश्यक पथ और प्रणालियाँ हैं। यदि एक भाग विफल हो जाता है, तो ट्रैफिक को अन्य नेटवर्क के माध्यम से पुन: चलाया जा सकता है। हालाँकि, क्राउडस्ट्राइक आउटेज से भी बड़े और अधिक व्यापक व्यवधान की संभावना मौजूद है। संभावित कारणों की सूची किसी आपदा फिल्म की पटकथा की तरह लगती है। 1859 की कैरिंगटन घटना के समान तीव्र सौर ज्वालाएँ उपग्रहों, पावर ग्रिडों और समुद्र के नीचे केबलों को व्यापक नुकसान पहुंचा सकती हैं जो इंटरनेट की रीढ़ हैं। इस तरह की घटना से महाद्वीपों में कई महीनों तक इंटरनेट ठप हो सकता है।
वैश्विक इंटरनेट समुद्र के नीचे फाइबर ऑप्टिक केबलों के नेटवर्क पर बहुत अधिक निर्भर करता है। कई प्रमुख केबलों को एक साथ क्षति – चाहे प्राकृतिक आपदाओं, भूकंपीय घटनाओं, दुर्घटनाओं, या जानबूझकर तोड़फोड़ के माध्यम से हो – अंतरराष्ट्रीय इंटरनेट यातायात में बड़े व्यवधान का कारण बन सकती है।रूट डीएनएस सर्वर या प्रमुख इंटरनेट एक्सचेंज पॉइंट जैसे महत्वपूर्ण इंटरनेट बुनियादी ढांचे को लक्षित करने वाले परिष्कृत, समन्वित साइबर हमले भी बड़े पैमाने पर रुकावट का कारण बन सकते हैं।
जबकि पूर्ण इंटरनेट सर्वनाश की अत्यधिक संभावना नहीं है, हमारी डिजिटल दुनिया की परस्पर जुड़ी प्रकृति का मतलब है कि किसी भी बड़े आउटेज का दूरगामी प्रभाव होगा, क्योंकि यह उन ऑनलाइन सेवाओं को बाधित करता है जिन पर हम निर्भर हैं।हमारे वैश्विक संचार बुनियादी ढांचे की झटकों को झेलने की क्षमता को सुनिश्चित करने के लिए निरंतर अनुकूलन और तैयारी बेहद महत्वपूर्ण है।