Уменьшение затрат в кризис — вещь вполне естественная. И всё, что связано с ИТ, также становится объектом весьма жесткой экономии. По данным исследования «ИТ в условиях кризиса», которое наш журнал проводил в прошлом году, о сокращении бюджетов заявило 60% опрошенных. Но любые меры должны быть разумными, иначе можно поставить свой бизнес под угрозу и последствия от такой экономии будут весьма плачевными. С другой стороны, существует немало узких мест, которые вполне можно устранить, не прибегая к большим материальным затратам.
Выявлению таких вот узких мест и было посвящено исследование, проведенное в 2008 году Uptime Institute. Его результаты и сделанные на их основе рекомендации оказались в чем‑то ожидаемыми или даже банальными. Но целый ряд моментов стал сюрпризом, причем далеко не всегда приятным.
Куда утекают средства
Главным результатом исследования Uptime Institute, организации, которая занимается анализом нарушений в работе серверов, сетевого оборудования и СХД, стало то, что затраты на электроэнергию являются основной статьей затрат на поддержку ЦОДов. Согласно полученным данным, средний сервер форм-фактора 1U «тратит» в год 700 долларов, включая расходы на обслуживающую его инженерную инфраструктуру, системы хранения, сетевое оборудование и т.д. И эта величина только растет, несмотря на все действия по снижению бюджетов. Учитывая, что стоимость электроэнергии в России и США близка, у нас эта величина вряд ли будет намного ниже. Плюс ко всему во многих российских регионах, в частности в Москве, существует дефицит мощностей, и их получение требует существенных затрат времени и финансов. Это составляло серьезную проблему и до кризиса, и многие компании были вынуждены идти на весьма нетривиальные меры, чтобы эти мощности получить. Так что к рекомендациям Uptime Institute, которые так или иначе связаны именно со снижением энергопотребления, имеет смысл прислушаться.
Согласно результатам этого исследования основными каналами утечки средств на эксплуатацию ЦОДов стали следующие категории систем:
- с низким уровнем утилизации;
- так называемые системы-«призраки»;
- системы с высоким потреблением электроэнергии;
- системы с высоким уровнем операционных затрат.
Как показало исследование, одним из главных факторов перерасхода финансовых средств на эксплуатацию ЦОДов стали недозагруженные системы. Естественно, все знают, что это плохо, но за утилизацией следят не так пристально, как было бы нужно. А эти системы тоже требуют питания, охлаждения и прочего обслуживания наравне с теми, что работают эффективно.
Этот результат вполне прогнозируем. Тем более, что одной из причин такого положения дел мог стать кризис, точнее, его последствия. Компании производили сокращение штатов, ликвидировали убыточные подразделения, но обслуживающие их ИТ-ресурсы оставались такими же, каковы они были до наступления тяжелых времен. При этом все понимают, что кризис не вечен и ресурсы потом понадобятся, так что кажется, что проще оставить всё как есть. Да и вне кризиса существует масса приложений с цикличной загрузкой, так что оборудование для них приходится подбирать исходя из максимальной нагрузки.
Хрестоматийным примером здесь являются модули начисления заработной платы, которые работают в полную мощность лишь несколько дней в месяц. Или контроллер домена, который бывает загружен в начале и в конце рабочего дня, когда пользователи соответственно входят в систему и выходят из нее, а в остальное время практически бездействует.
Более интересным результатом исследования оказалось то, что до 30% систем не используются для реальных задач, то есть являются «призраками». Естественно, их выявление и использование для более насущных целей снимет массу проблем. Впрочем, их можно считать экстремальным вариантом систем с низкой нагрузкой.
Обычно такие системы можно обнаружить там, где развитие ИТ проходило стихийно и любое подразделение всеми правдами и неправдами пыталось получить в свое распоряжение сервер. Об этом, к примеру, рассказывал Владимир Анцыпович, директор ФГУП «ГВЦ Росгидромета» (см. стр. 38 в этом номере). Как уже отмечалось выше, к таким результатам могли приводить и последствия кризиса, когда подразделение закрыто, но все его ИТ-ресурсы продолжают функционировать.
Нет ничего удивительного и в том, что одной из «черных дыр» стали системы с высоким уровнем потребления электроэнергии. Об этом в последнее время говорилось много, в том числе и у нас, особенно на фоне того, что энергетики не могут предоставить нужные мощности, так что подробно на данной теме останавливаться нет смысла.
Вместе с тем ресурсы с низкой энергоэффективностью можно считать частным случаем систем с высоким уровнем операционных затрат. При этом затраты касаются не только электроэнергии. Сюда, например, можно отнести устаревшие системы, снятые с технической поддержки. И эта проблема у нас, похоже, существенно более актуальна, чем в США. Хотя бы в силу более широкого распространения продукции небольших компаний, которые быстро уходят с рынка. К тому же срок жизни такого рода систем заметно меньше, чем у брендов. В результате уже через три года приобретение целого ряда запасных частей становится проблематичным. А среди потребителей таких систем не только компании малого и среднего бизнеса, но и, например, многие региональные телеком-операторы или хостинг-провайдеры. Да и у брендовых систем с истекшим сроком жизни стоимость контрактов на поддержку может быть чрезвычайно высокой.
Как закрыть каналы утечки
Для того чтобы закрыть каналы утечки, Uptime Institute рекомендует предпринять ряд мер, о которых говорилось выше. Речь, в частности, идет о том, чтобы:
- следить за утилизацией серверов;
- активнее виртуализировать и консолидировать ресурсы;
- оптимизировать системы кондиционирования;
- использовать системы управления электропитанием;
- избавляться от систем с высоким уровнем операционных затрат.
Однако отслеживать утилизацию серверов — не всегда простая задача. Равно как и определить, какой уровень загрузки следует считать приемлемым. Тут как в немецкой поговорке о том, что все относительно: три волоса на голове мало, но те же три волоса в супе — уже много. Для одного приложения уже 15% является практически критическим уровнем, а для другого 60% можно считать недозагрузкой. К тому же иногда для адекватного решения задачи утилизации и её учета приходится внедрять элементы ITSM, на что далеко не все готовы идти, даже если речь идет о внедрении простого и дешевого, а то и вовсе бесплатного продукта.
Так что использование виртуализации и консолидации часто является более адекватным решением этой задачи. Хотя внедрение такого рода требует некоторых затрат, но они быстро окупаются. Причем происходит это не только за счет снижения расходов на электроэнергию, хотя и это тоже важно. Не менее актуально, в частности для Москвы и других больших городов с высокой стоимостью коммерческой недвижимости, уменьшение площадей, занимаемых оборудованием. Ведь физических серверов становится меньше. Как показывает практика, количество физических систем уменьшается втрое. И это еще не предел, особенно если используются новейшие процессоры с четырьмя и более ядрами.
Немаловажно и то, что использование средств виртуализации может заметно снизить расходы на лицензирование ПО. Например, с одного диска Microsoft Windows Server нельзя установить систему более чем на один физический сервер, в то время как лицензионное соглашение допускает инсталлировать ОС с того же диска на четыре виртуальных сервера. И это при том, что очень многие гипервизоры виртуальных машин бесплатны. Или по крайней мере не требуют дополнительной оплаты лицензий, так как являются базовым компонентом самой операционной системы, как это сделано, скажем, в Microsoft Windows Server 2008, практически во всех промышленных Unix‑системах или, пусть и в существенно более ограниченном варианте, во всех основных дистрибутивах Linux. Хотя, естественно, в этом случае не может быть и речи о целом ряде расширенных сервисных средств, но ведь они бывают востребованы далеко не всегда, особенно в условиях относительно небольшого ЦОДа. Но и в небесплатных системах есть много средств, которые вполне могут способствовать существенному снижению расходов на эксплуатацию. Это прежде всего средства консолидации и перераспределения ресурсов между виртуальными машинами и их кластерами, что производители часто называют маркетинговым термином «виртуализация 2.0» или даже «виртуализация 2.5». Их использование в немалой степени разгружает персонал и позволяет обойтись меньшим количеством администраторов. Так что с выбором конкретного гипервизора спешить не стоит, и следует тщательно проанализировать баланс затрат и вероятного выигрыша. Следует иметь в виду и то, что не все системы можно переносить на виртуальные машины. Это относится к системам, которые постоянно работают под большой нагрузкой, например BI. Но в любом случае необходимо провести целый ряд консультаций, а возможно, и тестов в обстановке, максимально приближенной к реальной.
Uptime Institute также рекомендует оптимизировать системы кондиционирования. Как показало исследование, очень часто они проектируются без должного учета движения воздушных потоков. У нас скорее всего дела обстоят еще хуже, примеры чему привел, в частности, Александр Артюхов, интервью с которым опубликовано в настоящем номере (см. стр. 45). Например, далеко не редкость, когда в качестве систем охлаждения используются бытовые (!) кондиционеры. Естественно, в таких случаях дорогостоящие и энергоемкие системы работают неэффективно и при этом потребляют большой объем энергии. Но должный уровень охлаждения все равно не обеспечивается, что приводит ко всякого рода аварийным ситуациям и способствует преждевременному выходу оборудования из строя. И как только эта проблема решается, практически сразу всё приходит в порядок, причём никакого дополнительного оборудования не требуется. Более того, иногда удаётся обойтись меньшим количеством систем кондиционирования.
Другим выводом стало то, что практически не используются штатные средства управления питанием, даже на уровне операционной системы. А они позволяют заметно снизить потребление электроэнергии без каких бы то ни было дополнительных затрат. О расширенных инструментах, которые вендоры часто включают во всяческие средства управления серверами и системами хранения данных, не стоит и говорить… Можно, конечно, возразить, что выигрыш будет не слишком большим, но и уровень затрат на эти мероприятия будет минимальным.
По результатам этого же исследования специалисты Uptime Institute рекомендуют избавляться от систем с высоким уровнем операционных затрат. Кстати, это единственная рекомендация, которая требует закупки нового оборудования. Вопросов здесь обычно не возникает, и бизнес, если ему с цифрами в руках показать, во что обойдется эксплуатация такой системы и к каким издержкам может привести ее выход из строя, довольно легко соглашается приобрести новую. Особенно если показать, что уровень текущих расходов больше или равен стоимости нового оборудования, которое к тому же более производительно, энергоэффективно и занимает меньше места.
Есть, однако, способ отсрочить закупку нового оборудования — это оптимизация используемого ПО. Интересно отметить, что о нём специалисты Uptime Institute не вспомнили. Это решение было высказано одним из участников сообщества ITBlogs как вариант уменьшения затрат на закупку нового оборудования по причине снижения расходов в рамках антикризисных мер, с одной стороны, и удорожания оборудования в связи с девальвацией рубля, с другой. Тем более что, как показал опыт Венгрии и Украины, девальвировавших свои валюты раньше, повышение цен на оборудование происходило даже с некоторым опережением изменения курса.
Данное предположение касалось по большей части самописных систем, которые, тем не менее, применяются не так уж и редко. Сюда же можно отнести и разработки различных отраслевых и ведомственных НИИ. Такие системы зачастую тянутся со времен ДОС и СУБД на плоских файлах со всеми их ограничениями. Естественно, их перенос в более современные среды позволит снять некоторые проблемы. Такие проекты есть, и их не так уж мало. Другим объектом возможного приложения сил могут стать системы, которые в прежних условиях дешевле было масштабировать горизонтально, чем оптимизировать код, несмотря на то что резервы для его оптимизации есть. Можно добиться заметного эффекта, заменив и тиражное ПО. Естественно, о «тяжелых» или критичных системах не может быть и речи, но интернет-ориентированные серверы (Web/Mail/FTP, прокси, межсетевые экраны), средства коллективной работы или СУБД можно попробовать заменить на те, что более оптимально используют возможности имеющегося оборудования. Хотя надо быть готовым к тому, что выигрывая в одном, можно проиграть в другом. Например, прокси‑сервер squid более производителен и существенно менее требователен к системным ресурсам, чем Microsoft ISA Server, и при этом бесплатен, но его недружественность в области настройки вошла в легенду. Замена Microsoft Exchange на более старую версию будет означать отказ от целого ряда возможностей, на который также не все готовы идти. Ну а замена продукта на конкурирующий с ним еще потребует и дополнительных финансовых затрат, к которым, естественно, бизнес готов идти далеко не всегда, особенно в условиях кризиса.
Эта штука не работает
Есть и такие меры, которые западные специалисты рекомендуют активно, но их использование в наших условиях вызывает немало сомнений. Это прежде всего касается аутсорсинга. Хотя бы потому, что такого рода услуги очень плохо развиты. Например, лишь в четырёх городах — Москве, Санкт-Петербурге, Екатеринбурге и Новосибирске — можно получить услуги по хостингу серверов. Да и обходится аутсорсинг в лучшем случае не дешевле, а зачастую и дороже. И кризис, похоже, еще больше затормозит процесс развития данной услуги. Буду рад, если окажусь неправ.
Вместе с тем, есть тенденция к развитию аутсаффинга, когда компании отказываются от собственного ИТ-персонала и прибегают к услугам специалистов из сервисной службы. Эта разновидность аутсорсинга, похоже, кое‑где начинает пользоваться популярностью. Однако речь идет об относительно небольших компаниях, которым необходимо обслуживать настольные ПК и, может быть, один-два сервера, причем один специалист обслуживает несколько клиентов. Если же нужно поддерживать работоспособность ЦОДа, где работают десятки серверов, игра уже не стоит свеч. Просто потому, что к заработной плате такого сотрудника неизбежно добавляется оплата услуг сторонней компании. Естественно, в этом случае проще и дешевле держать свой собственный персонал.
Нередко можно услышать и такие прогнозы, что кризис будет способствовать развитию сервисов «облачных вычислений» (Cloud Computing). С одной стороны, выглядит это заманчиво. Особенно может показаться таковой перспектива мобилизовать не только вычислительные ресурсы настольных систем в момент их простоя, но также и устаревшее оборудование. Однако, как уже говорилось выше, поддержание устаревшего оборудования в работоспособном состоянии может оказаться делом не просто затратным, а чрезвычайно затратным по причине его энергоемкости, склонности к перегреву и высокой стоимости запасных частей. Использование ресурсов настольных систем возможно только в момент простоя, а значит, применимо весьма ограниченно, а в области типичных бизнес-приложений и вовсе представляет скорее теоретический интерес. К тому же сервисов, предоставляющих такие услуги в России, просто нет и потенциальных потребителей тоже не слишком много.
Вместо резюме
В целом итоги исследования Uptime Institute и рекомендации, которые давались на их основе, выглядят вполне убедительно. Причем актуальность целого ряда проблем в наших условиях даже более велика, чем в США. Так что результат принятия мер, которые советуют специалисты этой организации, должен быть осязаемым.
Использование виртуализации снижает затраты вдвое
Вячеслав Ковалев
Начальник отдела ЦОД компании «Открытые Технологии»Действительно, вопрос, как эффективно использовать серверное оборудование в ЦОДе, возникает у наших заказчиков всё чаще. Это и понятно. С точки зрения стоимости владения ЦОДом затраты на эксплуатацию серверов составляют весомую часть всех суммарных расходов. Западные компании столкнулись с подобными проблемами несколько лет назад и уже смогли разработать определенные способы их решения. В частности, их отчёты показывают, что достичь экономии в 50%, а в отдельных случаях и выше, позволяют технологии виртуализации. В силу того, что происходит перераспределение загрузки серверов, значительно экономятся средства на закупку нового оборудования, выделение дополнительных площадей, электроэнергию и установку дополнительных климатических систем.
Вопросы снижения расходов на ЦОД актуальны, как никогда
Сергей Щербаков
Руководитель группы системных инженеров в России и странах СНГ компании APC by Schneider ElectricОдним из наиболее эффективных способов достижения реальной экономии с точки зрения нашей компании является использование модульных систем электропитания и кондиционирования. Модули при необходимости можно отключать и тем самым достигать оптимальной загрузки систем электропитания и кондиционирования, повышая их КПД. Кроме того, существенного сокращения расхода электроэнергии можно достичь и за счет внедрения инновационных внутрирядных систем кондиционирования, которые на 20—25% эффективнее стандартных систем периметрального охлаждения. Весьма полезны и инструменты для оценки загрузки ресурсов, позволяющие понять процент загрузки, выявить неиспользуемые ресурсы и добиться повышения суммарной эффективности работы системы. Использование энергоэффективных ИБП также способствует снижению общего энергопотребления. Следуя указанным рекомендациям, можно суммарно добиться повышения эффективности ЦОДов на 30—40%.
Энергоэффективность — важнейшая задача
Алексей Нечуятов
Продакт-менеджер по серверам и системам хранения данных DellДля оптимизации энергопотребления ИТ-оборудования важным фактором является использование блоков питания с высокой эффективностью конверсии переменного тока в постоянный. Это наиболее актуально для систем с низкой загрузкой. Большую роль здесь могут сыграть также энергоэффективные вентиляторы, модули памяти, многоядерные процессоры с возможностью отключения незагруженных ядер. Блейд‑серверы с высокой плотностью и низким энергопотреблением позволяют консолидировать ресурсоемкие задачи, уменьшая количество выделенных серверов и тем самым — общее энергопотребление. На снижение энергопотребления серьёзно может повлиять установка серверов в бездисковых конфигурациях. Dell рекомендует консолидацию данных и выделение систем хранения во внешние.
Системы хранения данных менее пригодны для существенного снижения энергопотребления; основными нововведениями здесь стали рекомендации по использованию дисков с разной частотой вращения. Выпущены диски SATA 5400RPM для архивирования, Near-line SAS 7200 RPM для некритичных приложений второго уровня, твердотельные SSD. В линейке Dell EMC CX4 Clarion появилась функция ввода неактивных дисков в режиме ожидания.