Процесс сертификации Uptime Institute означает, что центр обработки данных получает один из уровней надежности (tiers). Система Tier была впервые описана в середине 1990-х годов и вскоре получила широкое распространение. Присвоение уровня основывается на результатах оценки отказоустойчивости и отказоустойчивости.
Мифы и заблуждения относительно Tier-системы сертификации Uptime Institute
Система классификации центров обработки данных Uptime Institute отметила свое двадцатилетие». С момента своего появления в середине 1990-х годов рейтинг превратился из стандартной отраслевой терминологии в глобальный стандарт для проверки инфраструктуры критически важных центров обработки данных.
За это время отрасль изменилась, и система уровней эволюционировала вместе с ней, но остается такой же актуальной и важной, как и тогда, когда Uptime Institute впервые задумал и опубликовал свою систему классификации. В то же время Uptime Institute отмечает, что понимание общественностью масштабирования было затуманено многими мифами и заблуждениями, возникшими в течение многих лет.
Uptime Institute давно признал, что не все полностью понимают идеи, изложенные в Стандартах уровня, а некоторые не согласны с некоторыми определениями. Обе ситуации приводят к классическому недопониманию, когда люди принимают решения в пользу того, чего они хотят, а не точной информации.
В других случаях, однако, маркетологи ссылаются на некий контракт, основанный на многоуровневой системе. Такие фантазии, как Tier III plus, используемые маркетологами в разговорах с потенциальными клиентами, не имеют под собой никакой основы в классификации Uptime Institute, но могут быть аргументами, вводящими в заблуждение менеджеров по закупкам, тендерам, имуществу и финансам и даже ИТ-персонал без соответствующих технических знаний.
Другие мифы распространяются потому, что некоторые профессионалы отрасли ссылаются на устаревшие публикации и пояснительные материалы, которые уже не соответствуют современным стандартам. Могут быть и другие причины недопонимания, но действительно важно понять, что Uptime Institute является единственным источником точной информации о своей системе классификации.
Uptime Institute организует многочисленные курсы, статьи и обзоры в течение года, чтобы информировать отрасль о текущей классификации уровней.
- Уровень I: базовая мощность, нерезервируемая инфраструктура.
- Уровень II: резервные компоненты мощности
- Уровень III: Возможность одновременного обслуживания
- Уровень IV: Инфраструктура отказоустойчивости
Uptime Institute — единственная организация, уполномоченная сертифицировать центры обработки данных в соответствии с системой классификации уровней. Uptime Institute не занимается проектированием, строительством или эксплуатацией центров обработки данных. Миссия Uptime Institute заключается в оценке инфраструктуры, операций и управления центрами обработки данных.
Основываясь на своем опыте, мы собрали и развеяли многие мифы и заблуждения.
Система уровней не затрагивает вопросы соответствия требованиям бизнеса
Ложь. Уровни — это бенчмаркинг центров обработки данных по производительности, основанный на требованиях бизнес-функций. Толерантность компании к риску определяет необходимый уровень риска для данного бизнеса. Другими словами, уровень зависит от бизнес-модели компании. Компании, которые не уточняют требования к производительности и надежности своих объектов до определения TIER, злоупотребляют классификацией и избегают внутреннего диалога, который должен иметь место.
Неправильно. Толерантность организации к риску определяет соответствующий уровень. Уровень IV не является лучшим выбором для всех организаций, как и уровень II. Владельцы центров обработки данных должны провести всестороннюю оценку (due diligence) своих объектов, прежде чем устанавливать целевой уровень. Если бизнес-цель не поставлена, уровни могут стать причиной для оправдания неоправданно высоких инвестиций.
Уровни I и II — это тактические решения, основанные на первоначальных затратах и времени выхода на рынок, а не на стоимости жизненного цикла и требованиях к доступности. Организации, выбирающие центры обработки данных уровней I и II, как правило, не получают основной доход от электронной продажи продуктов или услуг. Эти организации обычно защищены договором от потерь в результате сбоев ИТ-систем.
Жесткие требования к доступности и долгосрочная устойчивость обычно являются стратегическим выбором, соответствующим инфраструктуре уровней III и IV. В центрах обработки данных уровня III любой элемент инфраструктуры, необходимый для поддержки ИТ-процессов, может быть отключен по расписанию без ущерба для критически важных сред и процессов. Решения уровня IV более надежны, поскольку все компоненты и пути передачи данных полностью резервированы и могут пережить сбой, нарушение работы или другое незапланированное событие без ущерба для критически важных сред и процессов.
Решение уровня IV ничем не лучше решения уровня II. Производительность и возможности инфраструктуры центра обработки данных должны соответствовать бизнес-целям, иначе компании инвестируют «впустую» или берут на себя слишком большой риск.
Например, прежде чем строить центр обработки данных уровня II, который по определению не предусматривает одновременного обслуживания всех критически важных подсистем, владелец должен рассмотреть способность предприятия переносить плановые или профилактические отключения и спланировать, как операционная группа будет координировать эти отключения для проведения технического обслуживания.
Решение о выборе центра обработки данных TIER I, III или IV должно определяться бизнес-целями.
Количество компонентов строго определяет Tier.
Неправильно. Сертификация уровня — это оценка эффективности инфраструктуры конкретного центра обработки данных, а не контрольный список или «поваренная книга». К сожалению, некоторые отраслевые эксперты используют терминологию N для определения доступности уровней, где N — это минимальное количество компонентов, необходимых для обработки существующей рабочей нагрузки. Включение резервного оборудования может быть описано как проектирование элемента N+1, N+2, 2N или 2(N+1). Однако увеличение количества элементов не определяет и не гарантирует достижение определенного уровня, поскольку оно также основано на оценке маршрутов доставки и других элементов системы. Таким образом, достижение уровня IV с компонентами N+1 зависит от того, как они настроены и подключены с резервными маршрутами доставки.
Неправильно. Фактически, первым шагом является сертификация проектной документации. Консультанты Uptime Institute проверяют 100% проектной документации, чтобы убедиться, что все электрические, механические, диспетчерские и многочисленные подсистемы автоматизации соответствуют основным концепциям и что нет уязвимых мест в схеме. Сертификация проекта должна стать важным этапом, который позволит владельцам ЦОД начать строительство объекта, зная, что предлагаемый проект может соответствовать заданному уровню.
Пакет документации получает свой уровень, который является результатом предварительной инспекции перед сертификацией построенного объекта. Uptime Institute не инспектировал изготовленный завод и поэтому не может сказать, все ли было выполнено, как планировалось. Чтобы подчеркнуть этот момент, Uptime Institute отмечает дату истечения срока действия на сертификационных документах Tier Design. Срок действия сертификатов уровня, выданных после 1 января 2014 года, истекает через два года после даты выдачи.
При сертификации центров обработки данных команда консультантов Uptime Institute выезжает на объект для выявления несоответствий между проектными планами и установленным оборудованием. Консультанты наблюдают за испытаниями и демонстрациями, чтобы определить, соответствует ли уровень устойчивости. Поэтому ценность сертификации заключается в способности выявить эти «слепые пятна» и слабые звенья в цепи. Консультанты Uptime Institute говорят, что почти каждый раз, когда они посещают ЦОД, они обнаруживают, что в проект, прошедший сертификацию на проектном уровне, были внесены изменения, и одна или несколько систем или подсистем работают не так, как требуется для выбранного уровня.
Недавно Uptime Institute ввел сертификацию уровня операционной устойчивости для оценки операторов центров обработки данных и их способности управлять критически важными объектами. Даже центры обработки данных, спроектированные и построенные с учетом их высокой устойчивости, могут серьезно пострадать от стихийных бедствий без хорошо продуманной, комплексной программы управления кризисными ситуациями. Получив сертификаты всех трех уровней, владельцы центров обработки данных могут быть уверены в том, что они максимально повышают производительность своих объектов.
Необходимость сертификации была очевидна, поскольку уже существовали другие стандарты сертификации центров обработки данных. Некоторые из них до сих пор актуальны.
Что такое Tier
Название Tier не является аббревиатурой. Tier Standard — это система сертификации центров обработки данных, разработанная одним из самых известных и надежных международных институтов сертификации — Uptime Institute. Существует множество стандартов и классификаций для центров обработки данных, но категории Tier — это те, которые отражают уровень надежности и безопасности.
Существует 4 уровня надежности центров обработки данных:
- Уровень I: Базовая мощность (базовая мощность, инфраструктура без резервирования).
- Уровень II: компоненты с избыточной емкостью: Инфраструктура с резервированием
-
Уровень III: Параллельно обслуживаемая: Инфраструктура, которую можно ремонтировать/обслуживать параллельно, не прерывая работы.
- Уровень IV: Инфраструктура отказоустойчивости
Каждая последующая категория содержит характеристики предыдущей категории.
Как понять, к какой категории относится дата-центр
Единственной компанией, имеющей лицензию на оценку и сертификацию центров обработки данных в соответствии с системой классификации уровней, является Uptime Institute Professional Services. В настоящее время почти все центры обработки данных указывают, к какому уровню относится их инфраструктура, но это не всегда подтверждается сертификатами. В этом отношении уровни можно условно разделить на заявленные и подтвержденные.
Если центр обработки данных не сертифицирован Uptime Institute, он является многоуровневым центром обработки данных; если он сертифицирован, он является подтвержденным. Проверенная сертификация гарантирует, что сайт отвечает всем требованиям соответствующего уровня, обеспечивая тем самым доступность предлагаемых услуг.
Наиболее востребованные категории
Большинство центров обработки данных, предлагающих коммерческие услуги, относятся к уровню II или III. Это связано с тем, что при использовании стороннего провайдера каждый клиент хочет получить надежную инфраструктуру, высокую производительность и разумный бюджет на качество.
Уровень I является нерезервируемым и поэтому ненадежным, в то время как уровень IV является очень дорогим и резервируемым и обычно касается корпоративных центров обработки данных, которые редко находятся в эксплуатации. Центры обработки данных уровней II и III являются наиболее популярными на рынке ИТ-услуг с точки зрения производительности и доступности.
Большинство центров обработки данных, предлагающих коммерческие услуги, относятся к уровням Tier II или Tier III.
Центры обработки данных уровня II имеют функции резервирования критически важных компонентов для улучшения восстановления и защиты ИТ-процессов от сбоев. Резервные системы включают в себя силовое и охлаждающее оборудование, такое как источники бесперебойного питания, чиллеры или насосы и генераторы.
Tier II — резервные мощности
- Допустимое годовое время простоя составляет 22 часа.
- Доступность — 99,741%
- Доступность — частичная (N+1)
- Уровень надежности — средний
Центры обработки данных уровня II включают в себя все функции предыдущего уровня Uptime Institute. Этому способствует использование резервных компонентов в критически важных системах ЦОД, таких как электропитание и охлаждение, для обеспечения более высокого уровня производительности и надежности инфраструктуры. Это снижает вероятность непредвиденных сбоев в инфраструктуре центра обработки данных и повышает качество обслуживания. Центру обработки данных уровня II не нужно полностью отключать свои системы для проведения планового или профилактического обслуживания.
Для объекта уровня Tier II характерны:
- Дополнительные резервные каналы питания N+1,
- Использование холодильных агрегатов, чиллеров и теплоотводящих установок,
- использование систем бесперебойного питания,
- наличие фальшпола,
- Наличие аккумуляторов или генератора для обеспечения работы в случае отключения электроэнергии,
- Время доступности 99,741% в год.
Следует отметить, что система уровня 2 на объекте не имеет полного резервирования, а только дополнительные элементы охлаждения и питания в конфигурации N+1. Это означает, что критически важные компоненты системы связаны, но не исключает полного отказа центра обработки данных в определенных режимах работы.
Главное, что нужно знать про ЦОД уровня Tier II:
- В случае чрезвычайной ситуации центр обработки данных такого уровня вынужден прекратить работу для проведения ремонтных работ.
Такой центр обработки данных существует на рынке, и он имеет разумную цену. Он подходит для размещения серверов и услуг для средних и малых предприятий, для которых кратковременный простой в несколько минут не является критичным.
Простои бизнес-сайта или интернет-магазина с низкой посещаемостью могут иметь финансовые или репутационные последствия. Однако для банковских услуг, крупных торговых площадок, правительственных порталов и других проектов с высокой посещаемостью соображения и риски гораздо серьезнее. Для некоторых отраслей, организаций или услуг простои вообще недопустимы.
Tier III — параллельное техническое обслуживание
- Допустимое время простоя в год — 1 час 36 минут
- Коэффициент доступности — 99,982%
- Доступность — частичная (N+1 / 2N)
- Уровень безопасности — высокий
Центр обработки данных уровня 3 — это, пожалуй, самый распространенный центр обработки данных на рынке. Это связано с потребностями современного бизнеса, который не желает мириться с простоями и возможными перебоями в обслуживании. Такие центры обработки данных характеризуются высоким уровнем надежности, поскольку все компоненты инфраструктуры являются резервными. Объекты уровня III включают все элементы предыдущего уровня по классификации Uptime Institute. Однако разница между ними хорошо заметна. Даже с учетом допустимого времени простоя в год, объект уровня 3 сокращает время простоя на 92,7% (20 часов) по сравнению с предыдущим уровнем.
Для объекта уровня Tier III характерны:
- Дополнительные резервные каналы питания N+1,
- Использование резервных промышленных систем охлаждения и кондиционирования воздуха и систем TRR для контроля температурно-влажностного режима в серверных помещениях,
- Наличие ДГУ — дизель-генератора на случай отключения электроэнергии,
- Наличие нескольких независимых источников питания,
- Распределенная избыточность каналов связи,
- Соблюдение правил и выполнение инструкций во время работы команды центра обработки данных,
- Наличие систем пожаротушения: система раннего оповещения, дымоудаления, газового пожаротушения,
- использование фальшполов,
- Наличие промышленных ИБП в машинных залах,
- Способность выполнять технические работы и обслуживание центра обработки данных без перерывов,
- Размещение центра обработки данных в отдельном здании с огороженной территорией,
- время доступности 99,982% в год.
Исходя из его характеристик и систем, центр обработки данных уровня 3 можно считать абсолютно надежным объектом. Большинство веб-сервисов, компаний различного масштаба и правительственных организаций используют для своей работы центры обработки данных этой категории.
Главное, что нужно знать про ЦОД уровня Tier III:
- Технические системы центров обработки данных уровня 3 включают в себя несколько каналов электропитания, охлаждения и связи, но только одна из них постоянно активна или несет основную ответственность. Этот тип инфраструктуры ЦОД позволяет проводить операции и ремонт компонентов без необходимости остановки всего объекта.
В центрах обработки данных уровня Tier III все элементы механической системы являются резервными. Это делает объект надежным для предоставления оборудования, аренды выделенных серверов или облачных инфраструктур. Предприятия, для которых качество связи, бесперебойное электропитание и физическая безопасность имеют первостепенное значение, обращаются за услугами дата-центров такого уровня.
Tier IV — максимальная отказоустойчивость
- Допустимое время простоя в год — 26 минут
- Коэффициент доступности — 99,995%
- Плеоназм — Плеоназм (2(N+1))
- Уровень надежности — максимальный
Центры обработки данных уровня IV основаны на предыдущей инфраструктуре с добавлением концепции отказоустойчивости. Таким образом, можно свести к минимуму время простоя, будь то плановое обслуживание или аварийный ремонт. Это самый высокий уровень надежности, который Uptime Institute определил для центров обработки данных на сегодняшний день.
Уровень 4 включает в себя требования всех предыдущих стандартов. Главной отличительной особенностью ЦОД IV является полное многоуровневое резервирование компонентов инфраструктуры. Все технические системы объектов резервируются по системе 2 (N+1). Это означает, что помимо основной системы центра обработки данных, все остальные системы также резервируются по схеме N+1. Кроме того, в инфраструктуре используется разделение, при котором основные и резервные компоненты системы распределены по разным областям. Разделение делает компоненты независимыми друг от друга, что повышает эксплуатационную надежность центра обработки данных в случае отказа одного из компонентов (или самой площадки). Объект уровня 4 должен использовать этот подход для организации всех критически важных систем центра обработки данных.
Главное, что нужно знать про ЦОД уровня Tier IV:
- Объект обеспечивает самый высокий на сегодняшний день уровень отказоустойчивости. Все работы и ремонты выполняются без прерывания производства,
- В системе используется избыточность каждого компонента, который также является избыточным,
- Использование сегментации — физическая изоляция компонентов инфраструктурной системы для независимой работы каждого компонента,
- Коэффициент доступности составляет 99,995%.
Центры обработки данных уровня IV подходят для компаний с критически важными услугами, для которых простои неприемлемы. Сегодня в России дата-центры такого масштаба все еще находятся в зачаточном состоянии. Прежде всего, строительство и обустройство такого рода объектов стоит больших денег, что, безусловно, скажется на стоимости конечных услуг. Во-вторых, многие клиенты услуг центров обработки данных рассматривают класс IV в качестве резервного решения для своего бизнеса. Однако в мире существует множество сертифицированных Uptime Institute центров обработки данных уровня Tier 4, но пока преобладают центры уровня Tier 3.
Устройства обеспечения на базе стоек (встроенные) обычно выбираются для обеспечения того, чтобы инфраструктура могла соответствовать целям уровня. Однако плановое отключение или отсутствие этих встроенных коммутаторов резервирования может привести к выходу из строя конкретной стойки или устройства.
I, II, III, IV
Шкала уровней является прогрессивной: требования последующих уровней включают требования предыдущих уровней. Уровни пронумерованы от одного до четырех, причем уровень I представляет собой базовую, нерезервированную топологию технической инфраструктуры, где серверы питаются от одного ИБП и дизельного генератора. Это приемлемый вариант для некритичных нагрузок или при наличии резервирования в ИТ-инфраструктуре.
Уровень II включает резервирование критически важных компонентов электропитания и охлаждения, а уровень III — возможность их обслуживания без перерыва в работе. Это, пожалуй, главное отличие между ними и ключевая особенность правильно спроектированного центра обработки данных уровня Tier III: он не предусматривает плановых отключений и остановок клиентского оборудования.
Также должны быть запасы топлива для обеспечения бессрочной работы без внешнего источника питания. Если в центре обработки данных уровня Tier III что-то случится с внешней электросетью, дизель-генераторы (DGU) позволят центру продержаться до восстановления электроснабжения. Каждая ДГУ может быть индивидуально отключена, масло заменено и долито дизельным грузовиком по мере его израсходования.
Топология центра обработки данных уровня Tier IV делает его полностью отказоустойчивым. Это означает, что сбои отдельных устройств или соединений не должны влиять на работу центра обработки данных. Центры обработки данных, построенные в соответствии с этим стандартом, называются отказоустойчивыми и могут работать без привлечения обслуживающего персонала.
Такие центры обработки данных очень дороги, поэтому они, как правило, небольшие и используются охранными агентствами или для чрезвычайно дорогих финансовых операций, когда вы хотите свести к минимуму человеческий фактор и сделать центр обработки данных практически необслуживаемым. Если на таком объекте что-то выходит из строя, ремонтная бригада может прибыть без спешки — через несколько часов или даже на следующий день.
Основные различия между уровнями |
ЦОД БЕЗ СЕРТИФИКАТА ≠ ПЛОХОЙ ЦОД
Отсутствие официальной сертификации не обязательно означает, что центр обработки данных ненадежен. Есть несколько причин для отказа от сертификации, и первая из них — финансовая. Для относительно небольшого центра обработки данных стоимость одной стойки очень чувствительна; кроме того, Uptime Institute работает в нашей стране всего пять лет, а старые центры обработки данных не были построены в «эпоху UI».
Владелец серьезного коммерческого центра обработки данных должен убедительно доказать заказчику, что помещение соответствует требованиям стандарта для конкретного уровня. В частности, технические специалисты должны быть готовы представить необходимые доказательства инженерам клиента.
МАРКЕТИНГОВЫЕ СКАЗКИ ПРО 99,88%
В конце 1990-х годов сотрудники UI собрали статистику по времени простоя, обследовав несколько существующих центров обработки данных. Этот документ, разбитый по уровням, был опубликован в форме отчета. В то время показатель времени безотказной работы для центров обработки данных уровня Tier III составлял 99,982%, и у многих возник соблазн просто включить этот показатель в договор SLA, что, конечно, не имеет смысла. Самый большой и самый вредный миф заключается в том, что он глубоко укоренился в сознании масс: Если мы выполним требования уровня III, то коэффициент готовности составит 99,982% (99,741% для уровня II и т.д.).
Конечно, не существует простого ответа на такой сложный вопрос, как определение уровня готовности большого объекта с множеством оборудования. Для его предварительного расчета для каждого отдельного центра обработки данных требуется большая работа, и основная сложность в таких расчетах заключается в получении базовых оценок для каждого элемента.
В любом случае, само число не имеет никакого значения. Например, доступность 99,982% технически может означать, что за год происходит 5 600 1-секундных отключений (31,5 млн. секунд). Главный вопрос заключается в том, как конвертировать это красивое число в финансовую компенсацию.
Владелец серьезного коммерческого центра обработки данных должен убедительно доказать заказчику, что помещение соответствует требованиям стандарта для конкретного уровня. В частности, технические специалисты должны быть готовы представить необходимые доказательства инженерам клиента.
Несколько слов об энергоэффективности
Помимо доступности и надежности, энергоэффективность является важной характеристикой современного центра обработки данных. Консорциум Green Grid занимается исследованиями в области эффективного использования ресурсов в центрах обработки данных. Членами этой организации являются такие известные компании, как Cisco, Dell, EMC, Intel, IBM и другие. Хотя Green Grid не занимается разработкой стандартов, метрики консорциума по энергоэффективности и эффективности инфраструктуры были приняты Агентством по охране окружающей среды США, а также другими государственными учреждениями по всему миру.
Коэффициент энергоэффективности рассчитывается по формуле (изображение из Википедии):
Где PUE — индекс энергоэффективности, общая энергия объекта — общее количество потребляемой энергии, а энергия ИТ-оборудования — количество энергии, потребляемой ИТ-инфраструктурой.
Существуют даже веб-калькуляторы (см., например, здесь), которые можно использовать для расчета PUE для конкретного центра обработки данных. В последнее время появилось несколько публикаций, посвященных экологически безопасной эксплуатации центров обработки данных, однако соответствующих требований нет ни в одном стандарте — просто потому, что термин «энергоэффективность» не имеет четкого определения.
Заключение
В этой статье мы привели краткий обзор наиболее важных стандартов для строительства и эксплуатации центров обработки данных.
Конечно, мы не смогли охватить все аспекты этой темы, и если у вас есть дополнительная информация, мы будем рады услышать ее в комментариях.
Серия статей о центрах обработки данных будет продолжена в ближайшее время. В следующей статье мы подробно поговорим о российских стандартах.
В целом, многоуровневая сертификация центров обработки данных не используется для определения лучшего или худшего типа центра обработки данных. Это поможет понять, для чего предназначена инфраструктура центра обработки данных, для решения каких задач она лучше всего подходит и каких показателей производительности можно ожидать.
«Как это работает»: Классификация ЦОД Tier
В июне этого года было объявлено о нескольких важных событиях в индустрии центров обработки данных. Во-первых, было объявлено, что в Республике Бангладеш одобрено строительство первого и единственного в Азии национального центра обработки данных уровня Tier IV. Вслед за этим японский технологический гигант Fujitsu объявил о модернизации своих австралийских центров обработки данных — также до уровня Tier IV. Последние новости заставили задуматься о развитии центров обработки данных и природе их классификации, о чем мы сегодня и поговорим.
У клиентов операторов центров обработки данных всегда были особые ожидания и требования к предоставляемой инфраструктуре. В основном речь шла о надежности и безопасности — наиболее важных критериях при выборе центра обработки данных. Вехой на пути стандартизации стало объединение единомышленников в Uninterruptible Uptime Users Group (UUUG) в 1989 г. По словам Эдварда Рафтера, инженера, проектировавшего первые центры обработки данных в США, это стало поворотным моментом в обмене опытом и первым толчком к оценке инфраструктуры центров обработки данных.
В 1993 году Uptime Institute с помощью ассоциации компаний, отвечающих за обслуживание крупнейших американских центров обработки данных, создал структуру для обмена опытом. Она начала разрабатывать методы оценки эффективности работы центров обработки данных. Были проанализированы аспекты, влияющие на принятие бизнес-решений: около 30 факторов работы ЦОД, связанных с местоположением, воздействием на окружающую среду и качеством обслуживания, а также 16 технических подсистем. При разработке классификации Uptime Institute сосредоточился на последнем. Официально она была сформулирована как стандартная методология в 1990-х годах.
Uptime Institute имеет право сертифицировать центры обработки данных в соответствии с системой уровней для проектирования, строительства и эксплуатации инфраструктур по всему миру. Центры обработки данных в России разрабатываются в соответствии с требованиями стандарта TIA-942 Ассоциации производителей передающего оборудования (TIA) Американского национального института стандартов. Требования TIA охватывают конструкцию, электропитание, охлаждение, контроль безопасности, резервирование, ремонтопригодность и ввод в эксплуатацию.
Uptime Institute и внутренний ГОСТ используются в России в качестве дополнения к стандартам TIA. Важно отметить, что стандарт TIA-942, введенный в 2005 году, в свою очередь, основан на стандарте Uptime Institute. Кроме того, между Uptime Institute и TIA было достигнуто соглашение, в результате которого ассоциация перестала использовать термин Tier в своей методологии. В настоящее время она полностью ассоциирована с Uptime Institute.
Что касается различий между двумя подходами, следует отметить, что система Uptime Institute не ставит своей целью предписать строгие технические условия для проектирования и строительства центров обработки данных. Стандарт TIA, с другой стороны, предписывает конкретные требования к ресурсам и доступности для каждого уровня. В отличие от Uptime Institute, TIA не имеет полномочий проводить формальный процесс оценки центров обработки данных. Более того, нет группы экспертов, которые следили бы за соблюдением стандартов. Однако конкретные требования для каждого уровня находятся в открытом доступе, и их использование является бесплатным. В отличие от этого, Uptime Institute предлагает платную сертификацию центров обработки данных.
Зачем нужна классификация ЦОДов?
Uptime Institute принимает запросы от операторов центров обработки данных на проведение независимой оценки инфраструктуры. Это добровольная процедура, которая используется не всеми компаниями. Однако, исходя из основной идеи классификации, прозрачность при выборе центра обработки данных — это благо для клиентов. По этой причине Uptime Institute начал поощрять операторов к прохождению сертификации в 2015 году.
Организация объявила новый параметр для оценки центров обработки данных — энергоэффективность. Предлагается два уровня соответствия: «одобрено» и «разрешено». По данным Uptim e Institute, результат оценки показывает, что компания применяет лучшие практики в отрасли. Подтвержденная энергоэффективность центра обработки данных является дополнительным аргументом в пользу его выбора клиентами.
В целом, рейтинг важен для клиентов, поскольку он гарантирует, что конечный результат будет соответствовать их ожиданиям с точки зрения времени безотказной работы и производительности. Джо Хертвик, глава консалтинговой компании Hertvik Business Services, приводит несколько сценариев использования системы грейдов:
- Оценка рисков при передаче инфраструктуры облачному провайдеру.
- Конфигурирование центра обработки данных для обеспечения его соответствия конкретным требованиям бизнеса.
- Предоставление сертификата клиентам в качестве дополнительного преимущества.
- Выбор уровня доступности сети во время оценки рисков.
Какой Tier выбрать?
Существует распространенное заблуждение, что качество услуг центра обработки данных повышается с каждым уровнем. В действительности, многоуровневые центры обработки данных не предназначены для определения наилучшего типа центра обработки данных. Каждый уровень разработан для удовлетворения различных потребностей бизнеса и требований к производительности. Для разных предприятий требуется разная инфраструктура, и для большинства предприятий размещение в центре уровня IV просто неэффективно.
В 2013 году компания Data Center Dynamics опросила группу экспертов, чтобы выяснить, стоит ли платить больше за переход на более высокий уровень. Рахул Шевале, консультант компании Capgemini, и доктор Карлос Гарсия де ла Носеда согласились с тем, что центры обработки данных уровня III имеют более надежную инфраструктуру и могут быть более экономически эффективными, чем центры уровня IV. А Уильям Англ, директор компании CS Technology, которая помогла построить первый в мире объект уровня Tier IV, считает, что почти 60% всех отказов связаны с человеком, а не с инфраструктурой, поэтому не всегда имеет смысл стремиться к максимальной конфигурации.
Сотрудники Uptime Institute, напротив, утверждают, что стоимость инфраструктуры ЦОД и сложность эксплуатации возрастают от уровня к уровню, и что владельцам следует выбирать тот уровень, который лучше всего соответствует потребностям их конкретного бизнеса.
Решение Уровня IV не всегда «лучше» решения Уровня II. Инфраструктура центра обработки данных должна соответствовать коммерческому применению, иначе компании инвестируют слишком большой капитал или берут на себя слишком большие риски», — говорится на сайте организации.
Возвращаясь к недавним новостям: Стремление Бангладеш и Fujitsu к центрам обработки данных уровня IV можно объяснить климатическими и сейсмическими условиями, но не лучшей производительностью этих центров обработки данных по сравнению с другими. Бангладеш объявила о строительстве мега-центра обработки данных в 2014 году. В то время сообщалось, что для него был выбран сейсмоопасный район.
Uptime Insitute заявил, что сейсмические риски не учитываются при сертификации уровня, но, по словам Гэри Вонга из телекоммуникационной компании Instor Solutions, метод сейсмической изоляции учитывается Uptime Insitute при присвоении уровня IV сейсмоопасным районам. Что касается обновления статуса центров обработки данных Fujitsu в Австралии, то, по словам Майка Фостера, управляющего директора Fujitsu в Австралии и Новой Зеландии, оно было вызвано ударом молнии в 2015 году.
На практике центров обработки данных уровней I и II обычно достаточно для компаний, которые могут справиться с периодическими простоями серверов в нерабочее время. Для компаний, чей бизнес работает круглосуточно и по всему миру, или для компаний, где каждый перебой в работе негативно сказывается на деятельности, инвестиции в системы уровня III или IV могут быть оправданы.
Другими словами, уровень I подходит для малых предприятий, где ИТ-инфраструктура лишь расширяет внутренние бизнес-процессы и не является центральным инструментом. Уровень II достаточен для малых предприятий, чьи требования к ИТ ограничиваются в основном обычными рабочими часами и допускают простои системы в нерабочее время. Крупные компании, стремящиеся к круглосуточному обслуживанию клиентов и автоматизации бизнес-процессов и работающие в отраслях, где качество обслуживания является конкурентным преимуществом, могут выбирать между уровнями Tier III и Tier IV. Однако защита от простоев в случае уровня III в большинстве случаев является достаточной.
Различия между стандартами TIA-942 и Uptime Institute уже обсуждались на Хабре. Стандарт TIA содержит более подробные технические требования к инфраструктуре центра обработки данных и в некотором смысле сопоставим с многоуровневой системой. По сравнению с этим, стандарт Uptime Institute кажется гораздо более гибким.
Резервирование электропитания
Важным параметром, обеспечивающим надежную работу и высокое время безотказной работы, является резервирование питания.
Уровень 4, в частности, требует резервирования 2N+1, т.е. двойное резервирование плюс дополнительная система для обслуживания одной из двух основных систем. Это самый высокий уровень надежности. Это было реализовано в центре обработки данных компании «Миран».
Система резервирования питания Miran
Общее резюме требований стандарта уровня выглядит следующим образом.
Cводка требований стандарта Tier
В таблице приведены все требования, определяющие четыре различных уровня. Распределение источников бесперебойного питания определяется в данной таблице как часть цепи, ведущей от выходов ИБП к ИТ-нагрузке.
Уровень I | Уровень II | Уровень III | Уровень IV | |
Минимальное количество активных компонентов для поддержки ИТ-нагрузки | N | N+1 | N+1 | N после неудачи |
Каналы распределения — входная часть источника питания | 1 | 1 | 1 активный, 1 резервный | 2 одновременно активны |
Распределение бесперебойного питания | 1 | 1 | 2 одновременно активны | 2 одновременно активны |
Возможность технического обслуживания без перерыва | Нет | Нет | Да | Да |
Отказоустойчивость | Нет | Нет | Нет | Да |
Разделение | Нет | Нет | Нет | Да |
Непрерывное охлаждение | Нет | Нет | Нет | Да |
Основной принцип стандарта Tier
Что касается топологии, то основной принцип очень прост: уровень яруса общей топологии сайта соответствует уровню самой слабой подсистемы, влияющей на сайт. Например, объект с надежной конфигурацией ИБП уровня IV и системой охлаждения уровня II будет иметь итоговый рейтинг уровня II.
Это действительно сложный принцип. Это означает, что сайт может соответствовать абсолютно всем требованиям Уровня IV, за исключением одного незначительного требования — и по этой причине не получит сертификат Уровня IV. По мнению разработчиков стандарта, такой строгий подход отвечает пожеланиям топ-менеджеров, которые принимают решения о многомиллионных инвестициях и хотят получить объективную картину возможностей центра обработки данных.
По этой причине уровни не приводятся в виде дробей. Не существует уровней 2.5 или 2.9; либо сайт полностью соответствует требованиям уровня 3, либо он остается на уровне 2.
Стандарт Data Centre Infrastructure Topology Tier описывает основные требования к топологии объекта, включая:
- Производственные системы. Системы выработки электроэнергии объекта (например, дизель-генераторы) считаются первичным источником электроэнергии. Местная электросеть является лишь недорогой альтернативой. Перебои в электросети считаются не чрезвычайной ситуацией, а ожидаемым рабочим состоянием.
- Расчетные температуры воздуха в помещении .
- Телекоммуникации
- Подпиточная вода (в случае охлаждения) .
Дополнительный стандарт Tier по операционной устойчивости дополняет стандарт топологии инфраструктуры ЦОД и определяет требования к производительности конфигурации систем электропитания и охлаждения, включая резервирование, плановое обслуживание и возможности восстановления в случае сбоев без ущерба для критической нагрузки. Этот дополнительный стандарт описывает особые требования к техническому обслуживанию центров обработки данных.
Это относится, например, к категорийному штатному расписанию и организационной структуре уровней I, II, III и IV:
Подробную информацию об отдельных областях стандарта можно найти в документации.
Документация
На официальном сайте вы найдете полную документацию по стандартам уровня, в том числе и на русском языке:
Институт Uptime Institute разработал три программы сертификации для центров обработки данных. Эти программы относятся к различным этапам жизненного цикла центра обработки данных.
-
. Оценка соответствия проектной документации, примененных решений, мощности, требований к обслуживанию здания, архитектуры и местоположения. Проверка того, что объект был построен в соответствии с сертифицированной проектной документацией уровня (см. выше). Демонстрация ключевых систем в реальной среде для подтверждения соответствия требованиям. Общая оценка практики управления и эксплуатации объекта. Выявление проблем, которые могут повлиять на надежность.
Не каждый центр обработки данных может позволить себе сертификацию уровня, поскольку это дорогостоящий процесс. За 16 лет существования стандарта было выдано чуть более 2 500 сертификатов.
Aptitude Institute подчеркивает, что тестирование и сертификация — это не просто документ, а эффективный процесс оптимизации бизнеса. Другими словами, владельцы центров обработки данных выигрывают за счет повышения эффективности, снижения рисков и затрат, а также обеспечения высочайшего уровня производительности инфраструктуры.
Для некоторых операторов сертификация является стимулом для проведения необходимой модернизации оборудования и обеспечения резервных каналов питания и связи. В этом случае сертификация действительно помогает бизнесу. Очевидно, что высокая надежность может быть достигнута и без сертификации. Однако сертификация по уровню автоматически повышает престиж центра обработки данных в глазах клиентов.
Когда появляются инновационные технологии, они включаются в стандарт уровня, поэтому документация обновляется. Однако само целевое значение остается неизменным. Таким образом, стандарт уровня сегодня так же актуален, как и в момент его создания. Фактически, такой стандарт не может устареть, разве что элементы времени доступности для различных уровней могут быть скорректированы. Например, сегодня максимальная надежность соответствует уровню 4 с доступностью 99,995% и максимальным временем простоя 26 минут в год. Возможно, через десять лет на Уровне 4 будет только пять девяток.