КАТЕГОРИИ РАЗДЕЛА

 ПОСЛЕДНЕЕ

Самые резонансные аварии в ЦОД по итогам мая 2023 года

08.08.2023 г. | Раздел: Аварии в ЦОДах, Пожаротушение, Человеческий фактор, Электроснабжение ЦОД

Аварии в ЦОД: новости из Японии, США, Австралии и Китая

24.05.2023 г. | Раздел: Аварии в ЦОДах, Пожаротушение, Человеческий фактор

Аварии в дата-центрах: новости от Vocus, Twitter, Cyxtera и не только

23.03.2023 г. | Раздел: Аварии в ЦОДах, Пожаротушение, Электроснабжение ЦОД

Последствия аварий в ЦОД Lufthansa, Tesla, Oracle, Azure, Twitter

27.02.2023 г. | Раздел: Аварии в ЦОДах, Охлаждение ЦОД, Пожаротушение, Человеческий фактор, Электроснабжение ЦОД

Аварии в ЦОД: новости из Монако, Японии и США

27.01.2023 г. | Раздел: Аварии в ЦОДах, Пожаротушение, Человеческий фактор, Электроснабжение ЦОД

Нормативная документация

Анатомия некоторых процессов операционной модели эксплуатации инженерной инфраструктуры ЦОДа

20 мая 2014 г. | Категория: Эксплуатация ЦОД

Этой статьей авторы продолжают знакомить читателей с основными элементами операционной модели эксплуатации инженерной инфраструктуры ЦОДа. В 2013 году авторами была опубликована статья «Классификация подходов к организации эксплуатации инженерной инфраструктуры ЦОДа» («ЦОДы.РФ», 2013, № 4, с. 43), в которой был предложен подход к формированию групп элементов операционной модели эксплуатации.

       

I. Введение

Классическая операционная модель эксплуатации ЦОДа состоит из трех групп элементов:

– организационная структура;

– бизнес-процессы;

– ресурсы.

Все перечисленные элементы важны для успешной, надежной и эффективной эксплуатации инженерной инфраструктуры ЦОДа. Если первая группа элементов (организационная структура) определяет общие признаки положения службы эксплуатации в структуре организации — операторе ЦОДа, а последняя группа — ресурсное обеспечение эксплуатации, то вторая группа — бизнес-процессы — определяет порядок и правила их использования и выстраивания взаимодействия. Нам представляется важным обратить на бизнес-процессы эксплуатации инженерной инфраструктуры ЦОДа особое внимание.

Приведенные в работе иллюстративные примеры ориентированы на формирование единого понимания подходов к практическому использованию анализируемых бизнес-процессов, возможного состава мероприятий в рамках отдельных процессов, способов их группирования и не претендуют на полноту и завершенность.

Как нам представляется, статья будет интересна и полезна, в первую очередь, менеджерам уровня предприятия и экспертам, занимающимся вопросами разработки и сопровождения процессов управления.

II. Процессы эксплуатации инженерной инфраструктуры

2.1. Подгруппы процессов

Бизнес-процессы операционной модели эксплуатации инженерной инфраструктуры ЦОДа подразделяются на две подгруппы: 1) подгруппу процессов управления и взаимодействия и 2) подгруппу процессов обслуживания.

Подгруппа процессов обслуживания формируется из регламентов технического обслуживания оборудования инженерных систем ЦОДов. Основой являются наборы технологических карт, по которым производятся операции технического обслуживания и ремонта оборудования. В большинстве своем эта группа процессов хорошо известна подавляющему большинству команд эксплуатации ЦОДов, поэтому мы не будем на них останавливаться.

Сосредоточимся на определении и описании второй подгруппы бизнес-процессов — подгруппы процессов управления и взаимодействия.

2.2. Подгруппа процессов управления и взаимодействия. Классы, типы и элементы

Процессы управления и взаимодействия предназначены для организации усилий различных участников процесса эксплуатации инженерной инфраструктуры ЦОДа по поиску причин отказов и реализации действий по их устранению.

Все относящиеся к этой подгруппе процессы можно разделить на три основных функциональных класса:

Класс 1. Управление взаимодействиями:

– процесс диспетчерского управления.

Класс 2. Управление операциями:

– процесс управления устранением отказов;

– процесс управления техническим обслуживанием;

– процесс управления ремонтами;

– процесс планирования текущих операций;

– процесс управления текущими операциями.

Класс 3. Поддерживающие процессы:

– процесс текущего мониторинга;

– процесс управления обеспечением обслуживания.

Эти классы показывают функциональную направленность конкретного процесса. Вместе с делением на функциональные классы имеет место типизация процессов управления и взаимодействия с точки зрения групп элементов, их составляющих.

Каждый из процессов управления и взаимодействия можно представить как набор элементов двух основных групп: 1) группа элементов стандартной операционной деятельности и 2) группа элементов деятельности по обеспечению непрерывного производства. Первая группа относится к категории плановой деятельности, вторая — к категории оперативных дежурств.

Рис. 1. Группы элементов операционной модели эксплуатации инженерной инфраструктуры ЦОДа

В принципе, каждый из рассматриваемых процессов может содержать элементы обеих групп, но для достижения бо,льшей понятности и структурированности их описаний набор процессов сформирован нами таким образом, чтобы каждый процесс относился лишь к одной из определенных выше групп — то есть процесс являлся или процессом стандартной операционной деятельности, или процессом деятельности по обеспечению непрерывного производства. Среди определенных нами процессов управления и взаимодействия нет процессов, относящихся к обеим группам одновременно.

Для исчерпывающего описания любого процесса управления и взаимодействия необходимо учесть все его составляющие — элементы процесса.

Состав элементов процессов, относимых нами к группе стандартной операционной деятельности, может быть определен следующим образом:

– планирование работ по процессу;

– организация работ по процессу;

n отслеживание исполнения работ по процессу;

– оперативная корректировка планов работ и текущих заданий;

n формирование отчетов.

А состав элементов процессов, относимых нами к группе деятельности по обеспечению непрерывного производства, может выглядеть так:

– заступление на дежурство;

– организация дежурства;

– действия в ходе дежурства;

– завершение дежурства.

Для иллюстрации предложенного деления по элементным группам приведем список ранее определенных процессов в преломлении через вторую классификацию — классификацию по элементным группам:

Группа 1. Процессы стандартной операционной деятельности:

– процесс управления техническим обслуживанием;

n процесс управления ремонтами;

– процесс управления обеспечением обслуживания;

– процесс планирования текущих операций.

Группа 2. Процессы деятельности по обеспечению непрерывного производства:

– процесс диспетчерского управления;

– процесс текущего мониторинга;

– процесс управления устранением отказов;

– процесс управления текущими операциями.

2.3. Краткие описания процессов управления и взаимодействия

К сожалению, ограничения журнальной статьи не дают возможности детально описать все нюансы процессов подгруппы управления и взаимодействия. Ниже представлены краткие описания и классификация определенных выше семи процессов. Авторы планируют в самом ближайшем будущем вернуться к этой теме и расширить описания процессов.

2.3.1. Процесс диспетчерского управления

Процесс предназначен для организации общей координации и взаимодействия между различными группами и отдельными исполнителями в ходе эксплуатации ЦОДа в части инженерно-технических систем.

Основным ресурсом, участвующим в реализации процесса, является диспетчерская служба или иная обладающая соответствующим статусом структура службы эксплуатации ЦОДа, непрерывно присутствующая на объекте, имеющая необходимые для реализации функций управления ресурсы, технологии и полномочия.

Процесс относится к классу процессов управления взаимодействиями (класс 1, см. рис. 2) и группе процессов деятельности по обеспечению непрерывного производства (группа 2).

2.3.2. Процесс текущего мониторинга

Процесс предназначен для контроля текущих параметров функционирования отдельных систем ЦОДа, соответствия данных параметров допустимым целевым значениям. В случае отклонений за допустимые пределы целевых значений, в рамках процесса инициируется информирование ответственных структур и/или иных процессов о такого рода отклонениях в целях обеспечения принятия мер по приведению состояния систем к допустимому.

В целом, процесс охватывает различные методы мониторинга, включая визуальный контроль состояния, контроль показаний установленных на оборудовании индикаторов, показания независимых датчиков, показания специализированных систем мониторинга и управления.

К значимым процедурам процесса, помимо перечисленных, относятся процедуры информирования (предоставления информации по итогам контроля параметров) различных заинтересованных в получении данной информации процессов и отдельных исполнителей.

Глубина и охват контроля параметров отдельных систем находится в зависимости от критичности данной отдельной системы для функционирования объекта в целом. Дополнительным ограничивающим фактором при реализации процесса является наличие (или отсутствие) специализированных систем мониторинга, глубина их настройки и проникновения в отдельные системы и их параметры.

Процесс относится к классу поддерживающих процессов (класс 3, см. рис. 2) и группе процессов деятельности по обеспечению непрерывного производства (группа 2).

2.3.3. Процесс управления устранением отказов

Отказ (повреждение) — это нарушение работоспособности объекта, т. е. сис­тема, узел или компонент перестает выполнять целиком или частично свои функции.

Отказы, возникающие в ходе эксплуатации ЦОДа в части зданий, со­оружений, инженерных сетей и инженерно-технических систем, не всегда приводят к инциденту, связанному с тем или иным сервисом, поскольку многие из перечисленных систем не имеют непосредственной связи с предоставлением сервисов, а также часто дублированы. Это несколько усложняет выявление отказов и не позволяет организовать эффективную их обработку в рамках традиционного процесса управления инцидентами без его расширения и дополнительной проработки.

Процесс организации устранения отказов ориентирован на выявление, анализ и последующее устранение отказа.

Рис. 2. Классы и группы процессов управления и взаимодействия операционной модели эксплуатации инженерной инфраструктуры ЦОДа

Основным источником информации о наличии отказов является процесс текущего мониторинга.

Ключевым исполнителем в части функций организации и управления в рамках процесса является диспетчерская служба или иная обладающая соответствующим статусом структура службы эксплуатации ЦОДа, непрерывно присутствующая на объекте. К исполнению собственно работ по анализу и устранению отказа привлекаются как технический персонал службы эксплуатации ЦОДа, так и внешние поставщики услуг. Выбор исполнителей осуществляется на основании первичных данных об отказе, с учетом конкретной ситуации, в том числе — и в зависимости от выбранного подхода к организации эксплуатации.

Процесс относится к классу процессов управления операциями (класс 2, см. рис. 2) и группе процессов деятельности по обеспечению непрерывного производства (группа 2).

2.3.4. Процесс управления техническим обслуживанием

Процесс предназначен для организации планирования, исполнения и контроля качества работ по техническому обслуживанию инженерно-технических систем. В рамках процесса обеспечивается, в том числе, и исполнение работ по текущей регулировке и настройке оборудования из зоны ответственности процесса в соответствии с текущими условиями и потребностями эксплуатации.

Детализация исполняемых работ, требования по качеству их исполнения и рекомендованные способы его контроля должны быть отражены в соответствующих регламентах по обслуживанию конкретных систем.

Работы в рамках процесса исполняются управленческим персоналом службы эксплуатации ЦОДа (в части организации и управления) и техническим персоналом в части исполнения конкретных работ по обслуживанию оборудования и предоставления отчетности о выполненных работах.

Процесс относится к классу процессов управления операциями (класс 2, см. рис. 2) и группе процессов стандартной операционной деятельности (группа 1).

Состав элементов процесса управления техническим обслуживанием проиллюстрирован на рис. 4.

2.3.5. Процесс управления ремонтами

Процесс предназначен для организации планирования, исполнения и контроля качества работ по ремонту оборудования инженерно-технических систем. В рамках процесса обеспечивается организация исполнения всего перечня работ по текущим ремонтам, а также основные элементы планирования средних и капитальных ремонтов, осуществляемых в соответствии с текущим состоянием обслуживаемых элементов, и требований производителей по ремонтам и замене комплектующих.

Рис. 3. Реализация групп элементов процесса обеспечения непрерывного производства (на примере процесса управления устранением отказов)

Детализация исполняемых работ, требования по качеству их исполнения и рекомендованные способы его контроля должны быть отражены в соответствующих регламентах по обслуживанию конкретных систем.

Работы в рамках процесса исполняются управленческим персоналом службы эксплуатации ЦОДа (в части организации и управления) и техническим персоналом в части исполнения конкретных работ по ремонту оборудования и предоставления отчетности о выполненных работах.

Процесс относится к классу процессов управления операциями (класс 2, см. рис. 2) и группе процессов стандартной операционной деятельности (группа 1).

Процесс похож структурно на процесс управления техническим обслуживанием, тем не менее, обладает определенной спецификой, связанной с масштабами исполняемых работ, сроками их реализации, подлежащими учету рисками и общим влиянием на работоспособность объекта.

2.3.6. Процесс управления обеспечением обслуживания

Процесс предназначен для организации планирования и контроля состояний оборудования инженерно-технических систем с точки зрения необходимости затрат и материалов на проведение их обслуживания.

В ходе разработки процесса должны быть определены как учитываемые и управляемые в рамках процесса объекты эксплуатации, так и фазы их состояния, переход между которыми подлежит контролю и управлению со стороны данного процесса.

В рамках процесса должна быть обеспечена организация учета соответствующих объектов эксплуатации, их состояния, должно осуществляться планирование переводов объектов эксплуатации между состояниями, а также определение необходимых для этих целей мероприятий.

Основные цели процесса — контроль состояния объектов эксплуатации с точки зрения необходимости планирования затрат на их обслуживание и ремонт.

Процесс тесно связан с процессами управления техническим обслуживанием и управления ремонтами.

Работы в рамках процесса исполняются управленческим персоналом службы эксплуатации ЦОДа. Их результаты являются основой для планирования и реализации ремонтов и технического обслуживания.

Процесс относится к классу поддерживающих процессов (класс 3, см. рис. 2) и группе процессов стандартной операционной деятельности (группа 1).

2.3.7. Процесс планирования текущих операций

Процесс предназначен для формирования и определения перечня задач, связанных с текущими операциями администрирования оборудования и узлов инженерных систем ЦОДа. Основные категории операций, подпадающие под действие этого процесса, — это различные регулировки и переключения, как правило, критических систем ЦОДа (например, электрические и механические системы).

В рамках процесса определяются состав и графики выполнения текущих операций в ходе оперативных дежурств, в том числе — стандартные регулировки и плановые переключения для обеспечения ротации резервного оборудования.

Процесс относится к классу процессов управления операциями (класс 2, см. рис. 2) и группе процессов стандартной операционной деятельности (группа 1).

2.3.8. Процесс управления текущими операциями

Процесс предназначен для управления выполнением задач, относящихся к текущим операциям администрирования оборудования и узлов инженерных систем ЦОДа.

Основными задачами процесса являются организация выполнения запланированных текущих операций, а также прием, обработка и выполнение допустимых запросов, связанных с регулированием, настройками, переключениями систем ЦОДа и прочими текущими операциями.

Процесс относится к классу процессов управления операциями (класс 2, см. рис. 2) и группе процессов деятельности по обеспечению непрерывного производства (группа 2).

Рис. 4. Реализация групп элементов процесса стандартной операционной деятельности (на примере процесса управления техническим обслуживанием)

III. Заключение

Подведем краткие итоги рассуждений об анатомии некоторых процессов управления операционной модели эксплуатации инженерной инфраструктуры ЦОДа:

– Для успешной эксплуатации инженерной инфраструктуры ЦОДа важно разработать и реализовать операционную модель эксплуатации. Важной частью операционной модели являются бизнес-процессы, которые делятся на 1) процессы обслуживания (регламенты обслуживания), 2) процессы управления и взаимодействия, 3) вспомогательные процессы.

– Процессы управления и взаимодействия могут быть классифицированы (подразделены) в двух плоскостях: на три функциональных класса (управление взаимодействием, управление операциями, поддерживающие процессы) и две элементных группы (процессы стандартной операционной деятельности, процессы деятельности по обеспечению непрерывного производства).

– Принадлежность процесса к определенному функциональному классу определяет его роль и место в общей иерархии процессов управления, что позволяет правильно расставить акценты и приоритеты при проектировании процессов.

– Принадлежность процесса к определенной элементной группе определяет структуру его описания, реализация которой позволяет учесть все детали эксплуатации и, в конечном итоге, достичь поставленных перед службой эксплуатации целей.

К сожалению, в настоящее время в российской теории и практике эксплуатации инженерной инфраструктуры дата-центров отсутствует единый подход к построению процессной модели обслуживания ЦОДов. Возможным вариантом решения этой проблемы могла бы стать разработка национального стандарта эксплуатации инженерной инфраструктуры ЦОД.

Заурбек Алехин,
Дмитрий Басистый,
независимые консультанты

Источник: журнал ЦОДы.РФ, февраль 2014, № 06

 

ИСТОЧНИКИ И ЛИТЕРАТУРА

1. ГОСТ 25866-83. Эксплуатация техники. Термины и определения.

2. ГОСТ Р ИСО/МЭК 20000. Информационная технология. Менеджмент услуг.

3. Операционная модель [Электронный ресурс] /Wikipedia. The Free Encyclopedia/ Wikipedia Foundation. — [Б.м.], [2001–]. — Режим доступа: https://ru.wikipedia.org/wiki/Операционная модель. — Загл. с экрана. — Яз. рус.

4. Official ITIL® Website [Электронный ресурс] /APM Group Ltd. — [Б.м.], [2007–]. — Режим доступа: http://www.itil-officialsite.com. — Загл. с экрана. — Яз. англ.

5. Классификация подходов к организации эксплуатации инженерной инфраструктуры ЦОДа [Текст] /Заурбек Алехин, Дмитрий Басистый //ЦОДы.РФ. — № 4. — 2013. — Авг.

Теги: Эксплуатация, инженерия

Чтобы оставить свой отзыв, вам необходимо авторизоваться или зарегистрироваться

Комментариев: 0

Регистрация
Каталог ЦОД | Инженерия ЦОД | Клиентам ЦОД | Новости рынка ЦОД | Вендоры | Контакты | О проекте | Реклама
©2013-2024 гг. «AllDC.ru - Новости рынка ЦОД, материала по инженерным системам дата-центра(ЦОД), каталог ЦОД России, услуги collocation, dedicated, VPS»
Политика обработки данных | Пользовательское соглашение