Пользователи по всему миру столкнулись с масштабным падением сервисов: сразу несколько известных приложений и сайтов — в том числе Snapchat, Roblox, Fortnite, Duolingo и Canva, а также часть банковских сервисов — перестали нормально функционировать после серьёзного сбоя в Amazon Web Services (AWS). Инженеры Amazon оперативно разыскивают причину и работают над исправлением.
По данным мониторинга сбоев DownDetector, утром в понедельник многие платформы оказались недоступны или работали с ошибками. Считается, что основной причиной стала неисправность в системах AWS — крупнейшего в мире провайдера облачной инфраструктуры, на который полагаются тысячи компаний.
Платформа Downdetector, принадлежащая Ookla, сообщила о регистрации более 4 миллионов отчетов о проблемах по всему миру в этот период — это вдвое больше обычного среднего показателя в будний день, который составляет примерно 1,8 миллиона сообщений.
По данным компании, первые сообщения о проблемах с AWS начали поступать в 06:56 UTC (13:56 по тайскому времени), особенно из региона US‑East‑1. К 08:50 UTC (15:56 по тайскому времени) более 500 компаний из 66 исследованных начали сообщать о перебоях.
На странице статуса AWS отмечено, что наблюдается «повышенный уровень ошибок соединения» и «задержки в работе нескольких сервисов», особенно затронута служба базы данных DynamoDB в регионе US‑EAST‑1. Это может быть связано с проблемами в системе DNS и соединениях между компонентами инфраструктуры.
Сбой длился более 90 минут; Amazon подтверждает, что инженеры продолжают работать над восстановлением работы и расследованием первопричины инцидента.
AWS, запущенный в 2006 году, стал ключевым элементом современной интернет‑инфраструктуры, предоставляя облачные ресурсы и серверы для компаний по всему миру. Он конкурирует с Microsoft Azure и Google Cloud и является важным источником дохода для Amazon.
Этот инцидент вновь подчёркивает хрупкость глобальной цифровой инфраструктуры, которая в значительной степени зависит от работы нескольких крупных облачных провайдеров, и показывает, как сбой у одного участника может отразиться на огромном числе сервисов и пользователей по всему миру.
Источник: BBC