Даже самые надежные дата-центры уровня Tier III не защищены от форс-мажоров. Причинами серьезных аварий и продолжительных простоев часто становятся пожары, стихийные бедствия, человеческие ошибки. Случаются и курьезные истории — например, с участием диких зверей. Рассказываем о самых масштабных, резонансных и нелепых случаях выхода из строя российских и зарубежных дата-центров.

Штурм «Кибербункера»

Полный провал: 10 эпических аварий и отключений дата-центровФото: volksfreund.de

В сентябре 2019 года немецкая полиция взяла штурмом дата-центр CyberBunker, расположенный в районе городка Трабен-Трарбах. Дата-центр размещался в подземном военном бункере, построенном НАТО в 1950-е. Поводом для захвата стал нелегальный хостинг: в числе клиентов CyberBunker были драгдилеры, педофилы, пираты и т. п. анонимусы. «Пуленепробиваемый хостинг» работал с 1998 года и, несмотря на высокие тарифы, был очень популярен. Владельцы пренебрегали законами, защищающими авторское право, принимали криптовалюту и не требовали от клиентов никаких личных данных, кроме электронной почты. В результате штурма полиция задержала владельцев и персонал «Кибербункера», конфисковала около 200 серверов и большое количество дисковых накопителей.

Пожар в московском дата-центре OST

В июне 2019-го горел московский дата-центр OST (DataLine) на Боровой улице; до того ЦОД считался одним из самых надежных в России. В результате пожара на несколько часов стали недоступны 780 клиентских виртуальных машин. Также пострадала система холодоснабжения дата-центра, один из залов был обесточен. DataLine был вынужден выплатить штрафы в качестве компенсации клиентам за простой сервисов. Непосредственной причиной пожара стало короткое замыкание в проводке, соединяющей кондиционеры и их внешние блоки. Быстрой локализации огня помешали, среди прочего, горючие материалы в конструкции крыши.

Темные силы электричества

Масштабные сбои у социальной сети «ВКонтакте» — не редкость. Самый свежий произошел 14 января. Как правило, сбои случаются из-за технических проблем у партнерских дата-центров. Дважды «виновным» — в 2018 и 2019 годах, — причем по схожим причинам, оказывался петербургский ЦОД Xelent. В обоих случаях были зафиксированы перебои с электропитанием. Так, например, в ноябре 2019-го из-за перегрева и аварийного отключения магистрального кабеля, частично обесточилось клиентское оборудование. Несмотря на включение резервного питания, сервисы «ВКонтакте» поднялись не сразу.

Арест пиратских серверов Moonwalk

Еще один нелегальный дата-центр прикрыли в октябре 2019-го в Нидерландах. Главной целью полиции стали серверы стримингового плеера Moonwalk, которыми пользовались около 80% пиратских онлайн-кинотеатров в России. Moonwalk по сути представлял собой пиратскую сеть доставки контента (CDN). Инициатором ареста стал Нидерландский фонд защиты авторских прав. По данным фонда, на серверах Moonwalk хранилось 36 тысяч нелегальных фильмов и сериалов. У 50 самых популярных сайтов Moonwalk было 89 миллионов уникальных посетителей в месяц. Ущерб, нанесенный правообладателям от деятельности Moonwalk, оценили в несколько сотен млн долларов.

Молния против Microsoft

Полный провал: 10 эпических аварий и отключений дата-центровФото: pxhere.сom

В сентябре 2018 года сразу несколько дата-центров Microsoft в Техасе оказались в эпицентре урагана. Удары молний привели к продолжительным перебоям в электропитании ЦОДов. Серверное оборудование одного из дата-центров, который поддерживал работу облачного сервиса Azure, пришлось переключить на резервные генераторы — это привело к повышению температуры в машинном зале. Система охлаждения не выдержала нагрузки, часть серверов перегрелась и вышла из строя. Во избежание более серьезных последствий инженеры дата-центра решили полностью отключить машинные залы от электропитания. В итоге перебои в работе Azure продолжались несколько дней и вызвали проблемы у клиентов по всему миру. На данный момент это самый масштабный сбой в истории облачного сервиса.

Авария в дата-центре «Ростелекома»

19 августа 2018-го из-за сбоя в работе дата-центра «Ростелекома» начались проблемы у Росреестра, инфраструктура которого построена на мощностях госоператора. В информационной системе Единого государственного реестра недвижимости (ЕГРН) скопилась очередь из 180 тыс. необработанных заявок. Кроме того, в 50 регионах РФ были заморожены сделки с недвижимостью. К штатному режиму работы ведомство смогло вернуться только через две недели. Росреестр потребовал финансовой компенсации от «Ростелекома». Впоследствии госператор пересмотрел схему резервирования ЕГРН: данные Росреестра теперь одновременно хранятся в трех дата-центрах «Ростелекома».

Сбой на бирже Nasdaq Nordic

Полный провал: 10 эпических аварий и отключений дата-центровФото: wikimedia.org

В апреле 2018 года в дата-центре DigiPlex (Стокгольм) произошло ошибочное включение системы газового пожаротушения. Выпуск газа сопровождался ударной волной, которая вызвала настолько сильные вибрации, что вышли из строя системы хранения данных фондовой биржи Nasdaq Nordic. При этом резервное копирование сработало не сразу. Авария DigiPlex привела к остановке торгов в Копенгагене, Хельсинки, Рейкьявике, Риге, Стокгольме, Таллине и Вильнюсе. Можно только догадываться о размере компенсации, которую потребовали Nasdaq Nordic.

Авария в инфраструктуре аэропорта Гатвик

В 2017 году в лондонском аэропорту Гатвик произошел сбой работе ИТ-инфраструктуры, размещенной в дата-центре Vodafone. Проблемы привели к 8-часовой недоступности сайта аэропорта. Сотрудникам Гатвика приходилось использовать таблички, на которых от руки была написана информация о рейсах. Несмотря на то, что ни один из рейсов не был отменен, 200 человек не смогли попасть на свои самолеты.

Внедорожник-разрушитель

В декабре 2007 года в Техасе внедорожник, проезжавший мимо дата-центра Rackspace, свернул в кювет, подпрыгнул на кочке и влетел в будку силового трансформатора ЦОДа. Как позже выяснилось, водитель-диабетик потерял сознание в самый неподходящий момент. В дата-центре выключилось основное и включилось резервное электропитание — но этого оказалось недостаточно для нормальной работы системы охлаждения, которая в итоге тоже вышла из строя. После чего серверное оборудование стало быстро нагреваться, и сотрудникам дата-центра пришлось его отключить. Простой клиентских сервисов затянулся на 5 часов. Размер компенсаций, которые Rackspace выплатил клиентам, составил $3,5 млн.

Электрокабель — еда для грызунов

Полный провал: 10 эпических аварий и отключений дата-центровФото: pexels.сom

Каролинская, или восточная серая, белка широко распространена в США. Помимо обычной для беличьего рациона пищи, она обожает грызть кабель, в том числе электрический. Электрокабель часто становится для белки последней в жизни едой, что, в свою очередь, приводит к отключениям и авариям в американских дата-центрах. В 2010 году, например, одна белка на несколько часов вывела из строя половину дата-центра Yahoo в Санта-Кларе (Калифорния).

Как защитить свои данные

Поскольку стопроцентно надежных дата-центров, как показывает практика, не бывает, самый действенный способ защиты при пользовании услугами тех же облачных провайдеров — регулярные бэкапы. Причем идеальным вариантом будет хранение рабочих данных и их резервной копии в разных, географически разнесенных дата-центрах.

Выбирая облачный хостинг, стоит особое внимание уделять тому, какое оборудование использует поставщик, в каких дата-центрах оно размещается, как организовано хранение и резервирование данных.