Аварии ЦОД – Новости от Джорджтаунского университета, EUROCONTROL, Telegram, Equinix и лондонских операторов ЦОД
23 апреля 2018 г. | Категория: Аварии в ЦОДах, Пожаротушение, Человеческий фактор, Электроснабжение ЦОД
С каждым годом появляются все более совершенные решения для защиты ЦОД от простоев и обеспечения непрерывности бизнес-процессов. Тем не менее, текущего уровня развития технологий, судя по всему, пока еще не совсем достаточно для сведения риска ухода ЦОД в офлайн к нулю. Об этом свидетельствуют свежие новости об авариях в ЦОД Джорджтаунского университета, EUROCONTROL, Telegram и Equinix, а также известие о масштабном инциденте, охватившем сразу несколько лондонских дата-центров.
Пожар в дата-центре Джорджтаунского университета привел к остановке активности на кампусе
В начале апреля дата-центр Laurel Data Center в Мэриленде, принадлежащий Джорджтаунскому университету, был выведен из строя пожаром и результирующими неполадками в электрораспределительной инфраструктуре. Это привело к перебоям в обслуживании в университетском городке.
Пожар привел к тому, что основные и резервные энергосистемы вышли из строя. Это, в свою очередь, обернулось полным отключением дата-центра. Точная причина пожара до сих пор неизвестна, но большинство предоставляемых ЦОД сервисов уже были восстановлены.
Пожар начался в помещении с электрическим оборудованием в среду 4 апреля примерно в обед по местному времени. Инженеры активно работали всю ночь, чтобы как можно скорее восстановить ЦОД. Ожидается, что работы по полному восстановлению будут продолжаться в течение нескольких дней.
Павел Дуров: отключение электричества в ЦОД стало причиной перебоев в работе Telegram
Проблемы с электроснабжением ЦОД недавно стали причиной головной боли не только для британских студентов и их преподавателей, но и для пользователей популярного приложения для обмена сообщениями Telegram, создателем которого выступает Павел Дуров.
29 марта 2018 года приложение Telegram оказалось недоступно многим пользователям в Европе, на Ближнем Востоке, в России и в других местах. Впоследствии выяснилось, что проблема была вызвана отключением электропитания в дата-центре партнера Telegram.
Авария в дата-центре EUROCONTROL вызывает задержки авиарейсов в Европе
4 апреля 2018 года произошла авария в одном из ЦОД организации EUROCONTROL (ЕВРОКОНТРОЛЬ), которая обеспечивает управление воздушным движением в Европе. Авария в ЦОД вызывает задержки авиарейсов. Простой длился 5 часов и стал первым за несколько десятилетий, что можно назвать довольно хорошим результатом.
Сразу же после аварии команда EUROCONTROL признала факт потери данных, попросив специалистов из авиакомпаний-партнеров перепроверить планы рейсов, которые были переданы им ранее. Команда EUROCONTROL принесла извинения всем пострадавшим, отметив, что за более чем 20 лет работы организация допустила только один перебой, произошедший в 2001 году.
Поскольку время простоя, как представляется, составило около пяти часов, EUROCONTROL может похвастать коэффициентом даунтайма в 0,0035% в течение последних 17 лет. Это довольно хорошо, но пассажиры, которые оказались затронуты недавним инцидентом, вероятно, не оценят подобный результат по достоинству.
Отключение электроснабжения дата-центра Equinix привело к перебоям в работе облака AWS
В минувшем месяце мы сообщали о проблемах с подключением к облаку Amazon Web Services, с которыми столкнулись некоторые клиенты Amazon. О недоступности ряда сервисов сообщили многочисленные корпоративные клиенты AWS, включая Atlassian, Twilio и Capital One. Проблемы начались около 6 утра по восточно-тихоокеанскому времени в пятницу 2 марта и продолжались около четырех часов.
Перебои в электроснабжении вызвала непогода, воздействующая на все восточное побережье США. Возникшая в результате непогоды авария ЦОД вызвала перебои в работе сервиса Direct Connect, в результате чего была потеряна связь с центрами обработки данных DC1, DC6, DC10, DC12 в Эшберне, штат Вирджиния (США). Все эти ЦОД входят в состав одного кампуса Equinix. Кроме того, была потеряна связь с ЦОД VA1 и VA2 колокейшн-провайдера CoreSite в близлежащем Рестоне.
Широкомасштабные отключения электроэнергии в регионе произошли из-за мощного циклона. В округе Лоудун, который характеризуется одной из самых высоких концентраций центров обработки данных на планете, 15 тыс. клиентов коммунальной компании Dominion Energy оказались лишены доступа к электричеству.
Отключение электропитания мешает работе ЦОД в лондонском районе Харбор Эксчендж
Еще одна похожая авария случилась 13 марта 2018 года в британской столице. После аварии в электросети местной энергетической компании National Grid начались перебои в работе ЦОД в лондонском районе Харбор Эксчендж.
Клиенты ряда местных колокейшн-провайдеров сообщили о даунтайме крупных лондонских дата-центров после серьезного отключения электроэнергии. В число пострадавших вошла телекоммуникационная фирма Midlands Networks, интернет-провайдер OptaNet, телекоммуникационная компании PureComms, поставщик IT-услуг Daisy Group и IT-компания Astec Computing. Теги: Telegram, EUROCONTROL
|