Массовый сбой Microsoft 365 вызван изменением IP-адресов на WAN маршрутизаторах

Массовый сбой Microsoft 365 вызван изменением IP-адресов на WAN маршрутизаторах

Microsoft признала ответственность за глобальный сбой своей сетевой инфраструктуры.

image

Microsoft признала, что глобальный сбой в сетевой инфраструктуре компании, который длился почти пять часов, был вызван ошибкой сетевых инженеров при внесении изменений в конфигурацию WAN-маршрутизаторов. Изменение IP-адреса WAN-маршрутизаторов было сделано с помощью команды, которая не была тщательно проверена и приводила к различному поведению на разных сетевых устройствах" - объяснили в Microsoft

Компания заявила, что изменения в конфигурации маршрутизаторов внесли сетевые инженеры в ходе запланированных работ по обновлению IP-адресов на WAN-маршрутизаторах. Однако, из-за неправильно выполненных изменений в конфигурации, начался каскадный сбой WAN-маршрутизаторов Microsoft, которые отключились от других маршрутизаторов в глобальной сети. Обновление таблиц маршрутизации на устройствах привело к исключению из переадресации автономных систем Microsoft и систем управления трафиком, чтобы оптимизировать потоки данных в глобальной сети

25 января 2023 года компания Microsoft сумела восстановить работу всех основных своих сервисов через 4 часа после глобального сбоя. Инцидент затронул миллионы пользователей по всему миру, поскольку причиной стала ошибка в сетевой инфраструктуре компании.

Заказчики и пользователи во время инцидента не имели доступа к множеству сервисов Microsoft, таким как Azure, Microsoft 365, Microsoft Teams, Exchange Online, Outlook, SharePoint Online, OneDrive for Business, Microsoft Graph, Microsoft Store, Xbox, Minecraft и VS Code.

«Между 07:05 UTC и 12:43 UTC 25 января 2023 года у клиентов возникли проблемы с сетевым подключением, проявляющиеся в длительной сетевой задержке и/или тайм-аутах при попытке подключения к ресурсам, размещенным в регионах Azure, а также к другим службам Microsoft, включая Microsoft 365 и Power Platform», — говорится в опубликованном сегодня предварительном отчете Microsoft.

После глобального сбоя сетевые инженеры компании вручную откатили ранее внесённые изменения и все сервисы были успешно восстановлены. В связи с инцидентом, Microsoft решила запретить любые изменения в конфигурации сетевых устройств, которые не соответствуют рекомендациям по безопасности и не прошли проверку на всем парке сетевого оборудования.

Некорректные изменения в сетевых настройках Microsoft привели к потере связи автономной системы компании с 47 другими ASN, включая AS701 UUNET (Verizon), сообщили эксперты из Qrator. Нарушение работы ощущалось во всем мире.

Большой брат следит за вами, но мы знаем, как остановить его

Подпишитесь на наш канал!