Экспертные оценки

Несоблюдение правил эксплуатации ЦОДа влечет серьезные последствия

02 февраля 2015 г. | МакФарлейн Роберт | Категория: Обсуждаем статью

Обеспечение безопасной работы ЦОДа – задача непростая, однако стабильная поддержка лучших практик эксплуатации является жизненно важной. Необходимо внедрить эти правила и неукоснительно их соблюдать

Часто правила эксплуатации и техники безопасности в ЦОДе игнорируются, либо вообще отсутствуют.

Соблюдение лучших практик проектирования и эксплуатации современного дата-центра – задача довольно амбициозная, но так или иначе, объект должен эксплуатироваться должным образом для поддержания надлежащего уровня надежности сервисов.

Тщательно проработанная программа эксплуатации и технического обслуживания дата-центра позволяет полностью оправдать стоимость инвестиций, особенно если ЦОД сертифицирован, например, такими организациями как TIA или Uptime Institute.

Дата-центр – это потенциально опасное место для человека и оборудования. Правильное техобслуживание, четко прописанные правила эксплуатации, регулярное обучение персонала и обеспечение выполнения процедур позволит избежать травм и простоев, а также продлить срок службы оборудования и его надежность. Например, обучение должно включать информирование о месте нахождения огнетушителей и практикум по их применению, программа техобслуживания должна включать проверку, заряжены ли эти огнетушители.

Мы попросили читателей привести примеры несоблюдения техники безопасности в ЦОДе, с которыми им приходилось сталкиваться. Вы увидите эти примеры по ходу статьи, и наверняка сможете вспомнить подобные из вашей практики.

Дата-центр – это не кафетерий

Ни в коем случае нельзя проносить напитки и еду внутрь ЦОДа. Этот запрет должен строго выполняться, а нарушители – наказываться, вплоть до увольнения.

Дата-центр – это не дорожка для бега с препятствиями

Администрация профессиональной безопасности и здоровья предписывает, что отверстия в полу должны быть закрыты, либо защищены сигнальными конусами или временной решеткой. В полу зала можно открывать одновременно не более чем четыре плиты. Лучшие практики предотвращают травмы вследствие падения в открытые отверстия, минимизируют утечку воздуха в отверстия и позволяют сохранять устойчивость конструкции напольного покрытия.

Панели напольного покрытия следует снимать с помощью надежного инструмента и укладывать в стороне таким образом, чтобы они не создавали угрозы персоналу, проходящему мимо. Использование надлежащих инструментов для любых работ и правильное обращение с материалами также являются неотъемлемой частью техники безопасности и позволяют провести работы наиболее эффективным образом.

Дата-центр – это не кладовка

Хранение оборудования внутри серверного зала, особенно в коробках, вызывает загрязнение воздуха микрочастицами. Когда эти коробки открывают и распаковывают оборудование, возникает угроза засорения фильтров и воздуховодов от летающих частиц, что вызовет повышение рабочей температуры вычислительного оборудования, тем самым приближая момент отказа. Бумага и картон, кроме того, являются легковоспламеняющимися материалами.

«Самая большая головная боль в дата-центре? Запутанные кабели внутри стойки. Рано или поздно один из них обязательно будет прищемлен дверью и вызовет проблему, источник которой будет нелегко обнаружить». (Стюарт Вудворд, IT-специалист с 1988 г.)

Кабели, растянутые по полу в процессе установки оборудования, - это еще одно травмоопасное препятствие, создающее риск того, что специалист рано или поздно споткнется. Они также собирают грязь и создают статическое поле по мере растягивания их по полу. Кто-то должен держать влажную тряпку вокруг пучка кабелей, чтобы удалять поверхностную грязь, по мере того, как кабель вытягивают из упаковки. Проход(ы), где растягивается кабель, должны быть блокированы для прохода. Никогда не оставляйте кабели на полу дольше, чем это абсолютно необходимо, особенно в часы перерыва и на ночь.

Возьмите за правило постоянно делать влажную уборку дата-центра. На входе должны находится коврики для обуви, которые следует регулярно менять. Надлежащие правила эксплуатации должны включать ежегодную обработку дата-центра профессиональной клининговой компании. Если у вас фальшпол, то хорошо бы заняться его выравниванием по одному уровню, поскольку разноуровневые полы ведут к утечке дорогостоящего холодного воздуха и создают помехи для передвижения.

Когда вы переносите с места на место или устанавливаете шкафы или стойки, ваши менеджеры должны проводить проверку безопасного размещения, чтобы убедиться в их устойчивости и стабильности. Это особенно важно для дата-центров, расположенных в сейсмически опасных зонах. Положите на фальшпол пару слоев картона толщиной полсантиметра для предотвращения повреждения напольных плит, особенно если в шкафы установлено оборудование. Нельзя заполнять шкаф сверх указанной максимальной нагрузки.  Помните, что шкаф с установленным оборудованием может быть тяжелым в верхней части и может упасть в процессе переноски, особенно когда его поднимают или спускают по пандусу. Перфорированные плиты фальшпола особенно чувствительны к прокатыванию по ним тяжестей и большинство из них даже не имеет спецификаций по лимитам грузоподъемности.

Дата-центр – не спортзал и не сауна

Подумайте над тем, чтобы использовать подъемники для серверов. Это позволит избежать падения дорогостоящего сервера или сетевого коммутатора и предотвратить травмирование работника. Кроме того, механические подъемники работают быстрее и более эффективны в процессе инсталляции оборудования.

«Однажды длинноволосая женщина оказалась в ЦОДе рядом с вентилятором сервера, который был установлен без крышки. При этом сервер отключился, а у дамы был вырван клок волос. Такие простые правила, как установка на место крышки сервера после обслуживания, позволили бы избежать неожиданных проблем» (Роберт МакФарлейн).

Хорошее охлаждение важно для обеспечения надежности оборудования, и заключение контракта с квалифицированной обслуживающей организацией – это лишь начало. В процессе эксплуатационных проверок ЦОДа управляющие должны пройтись по рядам и убедиться, что на неиспользуемых стойках и пространствах шкафов установлены заглушки. Ваша обслуживающая фирма должна проверять фильтры в воздушных кондиционерах в дополнение к фильтрам в вычислительном оборудовании. Чистка и замена этих фильтров должна производиться регулярно. Поверка датчиков температуры и влажности должна проводиться как минимум раз в году. На объектах, использующих герметизацию холодного коридора, следует калибровать датчики дифференцированного давления. И, конечно, все системы мониторинга воздушных кондиционеров должны регулярно тестироваться для проверки работы системы оповещения.

В холодном климате важно проверять подогреватели поддона в камерах охлаждения и термокабель в трубе. Видеонаблюдение камер охлаждения может оповестить персонал о замерзании до того, как случится серьезная проблема.

Дата-центр – это не клуб для вечеринок

Не забывайте о шумозащите персонала. Охлаждающее оборудование и вентиляторы серверов создают высокий шумовой фон. Порекомендуйте, или даже потребуйте, чтобы персонал применял средства слуховой защиты, и обеспечьте всех этими средствами вместе с инструкцией по использованию.

С точки зрения электрической безопасности, самыми важным правилом обслуживания будет равномерное распределение нагрузки. Несбалансированная нагрузка может оказаться не только неэффективной с точки зрения производительности, но также привести к ненужной замене источника бесперебойного питания (ИБП) на основании ошибочного заключения, что он работает на пике своей мощности. Большие системы ИБП дают трехфазную энергию, и многие современные стойки и шкафы запитаны на две или все три фазы.  Потребление энергии должно регулярно проверяться на каждой точке электрической цепи: стойки и шкафы, распределительные щитки и сами ИБП. Обеспечение сбалансированной нагрузки поможет вам использовать ИБП максимально эффективно.

«Многие компании очень расстраиваются, обнаружив, что им нужно проложить трубы для обеспечения охлаждения ЦОДа, но они не отдают себе отчет, насколько они укорачивают жизнь коммутатору стоимостью 20 000 долларов, а также другим устройствам в помещении. Мне довелось побывать в школе, где дата-центр был расположен в кладовке кабинета математики. Там не только не было кондиционера, там сама стойка едва держалась на ногах, а на стульях вокруг лежали различные аппаратные компоненты» (Т.Дж.Хейтем, IT-консультант).

Лучший способ отслеживать нагрузку на электросеть и управлять ею - это установка сетевого фильтра в каждом шкафу, желательно с возможностью дистанционного считывания показаний, а также использование инструментария DCIM (инфраструктуры управления дата-центром). Четкая идентификация каждого электрощитка и контура позволит избежать ошибочных отключений. Используйте для маркирования крупный шрифт и цветные наклейки.

Слабые аккумуляторы – одна из самых распространенных причин отказа ИБП. Подумайте об инвестициях в хорошую систему отслеживания состояния аккумуляторов. Отказ аккумулятора обычно происходит в самое неподходящее время: когда отключается питание и нагрузку внезапно берет на себя блок АКБ. Это часто бывает с свинцово-кислотными аккумуляторами с самозакрывающимися клапанами, которые обычно пользуются предпочтением, поскольку для них не нужна специальная комната и меры предосторожности. Однако такой аккумулятор, рассчитанный на десять лет службы, может отказать через три года или даже быстрее, если колебания тока вызывают частое его применение. Хорошая система мониторинга может предупредить о выходе ячеек АКБ из строя до того, как станет слишком поздно. Также она может продлить жизнь всего аккумулятора путем обнаружения ячеек, требующих замены, до того, как они испортят остальные ячейки.

Если вы используете кислотные аккумуляторы, регулярно проверяйте безопасность оборудования, включая водородные детекторы и систему оповещения. А также  предусмотрите  соответствующие меры, такие как промывку для глаз, детоксикационный душ. Информация об активации любой из этих систем должна автоматически передаваться на пульт безопасности.

Дата-центр – это не кустарная мастерская

Все электромонтажные работы должны производиться квалифицированными электриками, но при этом безусловно каждый, работающий в ЦОДе, должен знать о чувствительности вычислительных операций и сопутствующих рисках в живой эксплуатационной среде.

Электрическая система в ЦОДе должна ежегодно сканироваться инфракрасным излучением для выявления свободных соединений, которые могут вызвать перегрев и отказ. Заказывайте новое электрооборудование со специальными окошками для инфракрасного сканирования, чтобы его можно было проверять, не снимая крышек. Также ищите электросистемы, использование которых не сопряжено с опасностью дугового разряда. Опасно открывать крышки высоковольтных щитков без специальной защиты. Специалист, работающий с таким оборудованием в дата-центре, должен знать все эти меры предосторожности, чтобы исключить даже малый риск возникновение пожара или незапланированного отключения нагрузки по причине плохих соединений.

Если в  ЦОДе есть пульт аварийного отключения, убедитесь, что он как следует маркирован  и оборудован защитой от несанкционированного вскрытия, лучше, если это будет звуковая сигнализация. Такие сигнализации обычно работают на батарейке, поэтому регулярно меняйте ее – но будьте аккуратны, не активируйте при этом устройство!

Также важно и надлежащее обслуживание генераторов. Есть две распространенные причины отказа генераторов: разряженные пусковые аккумуляторы и загрязнение топлива. В местности с холодным климатом также проверяйте работу нагревателя блока цилиндров.

Все устройства, где используется вода, также должны регулярно проверяться, и это не только трубы, по которым течет вода. Сливы в полу могут высохнуть и забиться. Системы слива могут сработать обратным потоком в случае паводка и затопить дата-центр. Сливы конденсата кондиционеров, а также датчики жидкости, должны постоянно проверяться. Проверяйте, не протекает ли крыша вашего ЦОДа, нет ли иных источников доступа воды извне. И если у вас установлена автоматическая спринклерная или газовая система подавления огня, она должна быть под регулярным наблюдением и обслуживанием квалифицированного специалиста – который не будет ее отключать в процессе проверки.

Это лишь примеры того, что нужно включать в детализированные правила эксплуатации и технического обслуживания центра обработки данных. Проверьте ваши нынешние правила и внесите изменения, если нужно. Если у вас нет специальной программы технического обслуживания, возьмите за основу данный список, напишите программу и ознакомьте весь персонал для последующего выполнения.

Об авторе:

Роберт МакФарлейн – руководитель, отвечающий за проектирование дата-центра в Shen Milsom and Wilke LLC, с более чем 35-летним опытом. Он является специалистом в энергоснабжении и охлаждении, участником разработки передовых технологий прокладки кабеля и членом-корреспондентом ASHRAE TC9.9. Также г-н МакФарлейн преподает в институте колледжа Marist (Marist College's Institute) учащимся по специализации «Дата-центры».

Теги: правила эксплуатации

Чтобы оставить свой отзыв, вам необходимо авторизоваться или зарегистрироваться

Комментариев: 0

Регистрация
Каталог ЦОД | Инженерия ЦОД | Клиентам ЦОД | Новости рынка ЦОД | Вендоры | Контакты | О проекте | Реклама
©2013-2024 гг. «AllDC.ru - Новости рынка ЦОД, материала по инженерным системам дата-центра(ЦОД), каталог ЦОД России, услуги collocation, dedicated, VPS»
Политика обработки данных | Пользовательское соглашение