قالت فيسبوك اليوم الثلاثاء إن الصيانة الروتينية لشبكة الشركة التي تربط مراكز البيانات الخاصة بها أدت إلى انهيار نظامها العالمي لأكثر من ست ساعات يوم الإثنين ما منع ملايين المستخدمين من الوصول إلى الشبكة.
وفي إحدى المدونات أوضحت فيسبوك أن مهندسيها أصدروا أمرا يقضي بإلغاء جميع الاتصالات في شبكتها عن غير قصد ”ما أدى إلى قطع اتصال مراكز بيانات فيسبوك بشكل فعال على مستوى العالم“.
وأدى انقطاع الخدمة إلى عدم إمكانية الوصول إلى فيسبوك وإنستغرام وواتساب على مستوى العالم.
وقالت الشركة أيضا إنها تسببت في فقدان الموظفين إمكانية الوصول إلى الأدوات الداخلية بما في ذلك تلك التي يستخدمها موظفو فيسبوك لتصحيح مثل هذه المشكلات.
وأضافت فيسبوك أن أداة تدقيق البرنامج تعرضت لخلل وفشلت في إيقاف الأمر، ما تسبب في انقطاع الخدمة.
وفي وقت سابق، اعتذر سانتوش جاناردان نائب رئيس البنية التحتية في فيسبوك عن الخلل، وقال إن ”تغييرات في الإعدادات في أجهزة التوجيه الأساسية التي تنسق حركة مرور الشبكة بين مراكز البيانات لدينا، تسببت في حدوث مشكلات أدت إلى قطع هذا الاتصال“.
وكان خبراء في مجال الأمن السيبراني قد طرحوا عدة تحليلات حول أسباب انقطاع خدمة فيسبوك حول العالم.
ورأى الخبراء أن المشكلة تتلخص في شيء يطلق عليه ”بي جي بي“ أو بروتوكول التوجيه بين البوابات، وهو النظام الذي يستخدمه الإنترنت لاختيار أسرع طريق لنقل حزم المعلومات.
وقارن سامي سليم من شركة ”تيليهاوس“ لمراكز البيانات، ”بي جي بي“ ب“مراقبة الحركة الجوية“.
وأوضح أنه بالطريقة نفسها التي يقوم بها مراقبو الحركة الجوية أحيانا بإجراء تغييرات على جداول الرحلات ”قام فيسبوك بتحديث هذه المسارات“، لكن هذا التحديث احتوى على خطأ جوهري.
ولم يتّضح بعد كيف ولماذا، لكن أجهزة التوجيه في فيسبوك أرسلت رسالة إلى الإنترنت تفيد بأن خوادم الشركة لم تعد موجودة.
يقول خبراء إن البنية التحتية الفنية لفيسبوك تعتمد بشكل غير عادي على أنظمتها الخاصة، وقد تبيّن أن ذلك أمر كارثي الإثنين.
وبعدما أرسل فيسبوك تحديث أجهزة التوجيه، أُخرج مهندسوه من النظام الذي يسمح لهم بالإبلاغ بأن التحديث كان، في الواقع، خطأ. لذلك لم يتمكنوا من حل المشكلة.
وقال بيار بوني من ”أفنيك“ وهي الجمعية التي تدير أسماء النطاقات في فرنسا ”عادة يكون من المفيد جدا عدم وضع كل البيض في سلة واحدة“.
وأضاف: ”لأسباب أمنية، كان على فيسبوك أن تركز بشكل كبير على بنيتها التحتية“.
وتابع: ”هذا يبسط الأمور على أساس يومي، لكن لأن كل شيء موضوع في المكان نفسه، عندما تصبح هناك مشكلة في ذلك المكان، يكون مستحيلا القيام بأي شيء“.
من الآثار غير المباشرة للعطل، عدم قدرة بعض موظفي فيسبوك على دخول مبانيهم لأن شاراتهم الأمنية لم تعد تعمل ما أدى إلى زيادة تباطؤ الاستجابة.