انقطاع واسع للإنترنت يوم 12 يونيو 2025: فشل متسلسل (Cascading Failure) بدأ من Google Cloud
يوم الخميس 12 يونيو 2025، حصل انقطاع كبير في الإنترنت سبب اضطرابات على نطاق واسع في عدد كبير جداً من الـ online services، من ضمنها تطبيقات جوجل نفسها، وCloudflare، وSpotify، وDiscord. تم تحديد الـ root cause بتاع الـ cascading failure ده على إنه عطل كبير في خدمة جوه الـ infrastructure بتاعة Google Cloud، وده بيوضح قد إيه الإنترنت الحديث مترابط ومعتمد على بعضه.
الحادثة بدأت حوالي الساعة 2 الضهر بتوقيت الساحل الشرقي (Eastern Time)، والمستخدمين بدأوا يبلغوا عن مشاكل في مجموعة ضخمة من المواقع والـ applications المشهورة. مواقع تتبع الأعطال (outage tracking sites) زي DownDetector سجلت زيادة ضخمة جداً في البلاغات لخدمات زي Gmail، وGoogle Meet، وGoogle Drive، وYouTube، وSnapchat، وغيرها كتير.
السبب الرئيسي
جوجل اعترفت بالمشكلة على صفحة الحالة بتاعة الـ Cloud بتاعتها (Cloud status page)، وفي الأول بلّغت إن فيه كذا product على Google Cloud Platform (GCP) بيواجهوا مشاكل في الخدمة من الساعة 10:51 الصبح بتوقيت PDT. بعد كده، المشكلة اتنسبت لـ "Identity and Access Management Service Issue"، واللي أثرت على أكتر من 40 مكان و 26 service. الفشل المبدئي ده كان تأثيره كبير، لدرجة إنه أثر كمان على الـ Google Cloud Console، وده منع العملا إنهم يعملوا log in عشان يشخصوا المشاكل في الـ services بتاعتهم.
ورغم إن المهندسين في جوجل حددوا الـ root cause وبدأوا يطبقوا حلول (mitigations)، عملية التعافي مكنتش فورية. الـ region اللي اسمها us-central1 في ولاية آيوا، خدت وقت أطول في التعافي مقارنة بباقي الـ regions. وبحلول المساء، معظم products جوجل والخدمات اللي معتمدة عليها كانت رجعت تشتغل.
تأثير الدومينو (Domino Effect): إزاي باقي الخدمات اتأثرت
العطل اللي حصل في Google Cloud عمل تأثير الدومينو، ووقّع خدمات تانية كتير بتعتمد على الـ infrastructure بتاعته.
شركة Cloudflare، اللي بتعتبر infrastructure حرجة للإنترنت، واجهت انقطاعات كبيرة في خدماتها. الشركة أكدت إن المشاكل كانت نتيجة مباشرة للعطل بتاع Google Cloud، لإن "عدد محدود من الخدمات في Cloudflare بيستخدم Google Cloud واتأثر". تقرير الـ post-mortem بتاع Cloudflare كشف إن سبب العطل كان فشل في الـ storage infrastructure الأساسية لخدمة Workers KV بتاعتهم، والمدعومة جزئياً من third-party cloud provider حصل عنده العطل. الـ single point of failure دي عملت cascading effect على كتير من الـ products بتاعتهم، زي WARP، وAccess، وWorkers AI، وTurnstile، وبعض الخدمات دي وصلت فيها معدلات الأخطاء (error rates) لـ 100% تقريباً.
منصات كبرى أخرى (Other Major Platforms): قايمة الخدمات اللي اتأثرت كانت طويلة ومتنوعة، ومنها:
الـ Streaming والتواصل: Spotify، وDiscord، وSnapchat كلهم واجهوا اضطرابات كبيرة.
أدوات الإنتاجية والأعمال (Productivity and Business Tools): كتير من تطبيقات Workspace بتاعة جوجل زي Gmail، وGoogle Calendar، وGoogle Chat، وGoogle Drive اتأثرت. خدمات زي Shopify وDoorDash واجهت مشاكل برضه.
الألعاب والترفيه (Gaming and Entertainment): مستخدمين خدمات زي Nintendo Switch Online، وRocket League، وPokémon Trading Card Game بلغوا عن توقف الخدمة.
خدمات الذكاء الاصطناعي (AI Services): الـ Platforms اللي بتشتغل بـ AI infrastructure، زي OpenAI وCharacter.AI، شافت انقطاعات كبيرة هي كمان.
من المهم نلاحظ إنه رغم وجود بلاغات من المستخدمين عن مشاكل في Amazon Web Services (AWS)، الشركة صرحت إن خدماتها كانت شغالة بشكل طبيعي.
الترابط ونقاط الضعف (Interconnection and Vulnerabilities)
الحادثة الواسعة دي بتفكرنا بشكل قاسي قد إيه الإنترنت مترابط وبيعتمد على بعضه. اعتماد عدد لا يحصى من الشركات، بما فيهم مزودي infrastructure أساسيين زي Cloudflare، على عدد قليل من مزودي الـ cloud الكبار زي Google Cloud معناه إن أي single point of failure ممكن يكون له تأثير عالمي.
الحدث ده بيبرز نقاط الضعف الموجودة في النموذج المركزي ده. ورغم إن مزودي الـ cloud بيستثمروا بشكل كبير في الـ redundancy والـ resilience، الحادثة دي بتثبت إن الاضطرابات الكبيرة لسه ممكن تحصل وتنتشر بسرعة في الـ digital ecosystem. الـ cascading failure من Google Cloud لـ Cloudflare وبعدين لقاعدة عملاء Cloudflare الضخمة هو توضيح صريح للـ operational risk ده في العصر الحديث.
في النهاية، الانقطاعات الواسعة اللي حصلت يوم 12 يونيو 2025 مكنتش مجرد حوادث منفصلة، لكن كانت سلسلة ردود فعل واضحة بدأت من فشل كبير جوه الـ infrastructure بتاعة Google Cloud. الحدث ده بيسلط الضوء على الاعتماد الحرج للعالم الرقمي على عدد قليل من اللاعبين الرئيسيين وبيطرح أسئلة مهمة عن الـ resilience والمخاطر النظامية المحتملة لخدماتنا الأونلاين اللي بتزيد ترابط يوم عن يوم.
مصادر اضافية: