В конце 1980‑х появились прогнозы, что не позже 1993 г. будет выведен из эксплуатации последний мейнфрейм. Тогда это казалось реалистичным на фоне быстрого распространения существенно более дешевых систем x86 и RISC. Однако в эпоху централизации вычислений стало ясно, что мейнфреймы не просто не сдают позиций, но со временем даже переходят в контрнаступление. Ведь мейнфрейм уже сам по себе является полноценным самодостаточным ЦОД. О реализации проекта на базе мейнфрейма в компании Comepay мы беседовали с ИТ-директором этой компании Русланом Степаненко.
Intelligent Enterprise: Почему вы выбрали именно мейнфреймы?
Руслан Степаненко: По мере роста бизнеса нашей компании стало ясно, что нам необходимо нечто более серьезное, чем то, что уже имеется. У нашего бизнеса очень жесткие требования к простоям. Если наша платежная система не будет функционировать хотя бы сутки, то это означает конец бизнеса.
А оборудование на платформе x86 этим требованиям удовлетворяло далеко не в полной мере. К тому же при загрузке процессора на уровне 40% производительность просто начинает деградировать. К ПО, как системному, так и прикладному, для платформы x86 все это относится даже в большей степени, чем к аппаратной части. Проблемы с операционной системой, сервером баз данных, Web‑сервером возникают спорадически и загадочно. Конечно, причину такого поведения мы в конце концов выясняем. При этом в 90% случаев нашей вины в нем нет. Это плохо, так как свои ошибки мы можем устранить. В итоге приходится держать дополнительные системы в резерве или применять какие‑то архитектурные решения, которые, по большому счету, не нужны.
Тут встал вопрос выбора альтернативы. RISC‑системы нас не устраивали тем, что для обеспечения бесперебойной работы пришлось бы строить кластер, а это значительная переплата за фактически неиспользуемые мощности. Кроме того, при высокой загрузке тоже деградирует производительность, пусть и не так сильно, как на x86. Вот тут‑то я вспомнил свой прежний опыт работы с мейнфреймами и подумал: а почему бы нам не воспользоваться современными системами? Ведь заявленные показатели по производительности при высокой загрузке и, особенно, надежности оказались близкими к тем, которые нам были нужны.
Операционная система разрабатывается уже более 40 лет, и это добавило нам уверенности. Нас не остановил тот факт, что для миграции на новую систему придется полностью переписывать приложения на DB2. Ведь многое делалось именно для того, чтобы обойти недостатки и ограничения прежней платформы, возможности которых мы просто переросли, и тащить это в новую среду не имело никакого смысла.
Как проходила установка систем? Были ли в этом процессе какие‑то особенности или сложности?
Все проходило в штатном режиме, никаких проблем не было. Тут надо отдать должное нашим партнерам по оборудованию — компании «РП Система». Они нам все привезли, установили и, совместно с инженерами IBM, привели в работающее состояние.
Специалисты «РП Системы» также подготовили всю инфраструктуру серверной, начиная от проектирования и заканчивая запуском «под ключ». Для ее построения были выбраны системы бесперебойного и резервного электропитания соответственно от APC и GMGen, кондиционирования — от DAIKIN. Именно они лучше всего подходили для наших условий.
Насколько востребовано в вашей компании то, что считается основными преимуществами технологий мейнфреймов? Начнем с повышенного уровня устойчивости систем.
Да, именно это преимущество стало решающим при выборе мейнфреймов. К тому же есть такие возможности, которых нет у других платформ. Например, две системы, объединенные в сисплекс, работают как единое целое. И при выходе одной из его частей вторая будет продолжать работу. Но и без использования кластеризации предусмотрено резервирование всего, что только возможно: процессоров, оперативной памяти, систем хранения данных. Мы выбрали в качестве системы хранения DS8000 от IBM. В ней для обеспечения бесперебойной работы тоже предусмотрено очень многое. К тому же мы продублировали все, что только возможно, в том числе системы электропитания.
В числе основных преимуществ называют еще скорость и эффективность обработки данных. Так ли это?
Тут тоже картина совсем не в пользу систем x86 и RISC. Одной только процессорной мощностью производительность не определяется. Многое зависит и от пропускной способности. А вот тут системам x86 и RISC похвастаться нечем. У мейнфреймов же этот показатель выше в разы, а если сравнивать с x86, то даже на порядки.
ПК или сервер на x86 можно сравнить с заводом, директор которого привык сам контролировать на своем предприятии все. Точно так же процессор сам обслуживает сеть, взаимодействие с накопителями, ввод/вывод и много чего еще. И когда разработчикам показывают абсурдность этой ситуации, они только обещают повысить производительность процессора и включить в него новые модули. Сейчас в них стали интегрировать контроллеры памяти и даже видеоадаптеры. На мейнфреймах все обслуживание внешних функций вынесено на отдельные модули. В результате при загрузке центрального процессора в 90% мейнфрейм полностью сохраняет производительность.
В результате количество запросов, которое система может обрабатывать одновременно, будет существенно больше, несмотря на то, что скорость их обработки может быть не выше или даже несколько ниже, чем на других платформах. Если раньше мы могли проводить не больше 30 платежей в секунду, то теперь мы можем легко увеличить этот показатель минимум в 10 раз.
Средства защиты данных мейнфреймов также называют одним из главных преимуществ. Это так?
У мейнфреймов есть несколько подсистем защиты данных. Среди них, например, встроенные криптосредства. Да, они уже есть и на x86, причем реализованные в виде аппаратного модуля. Но в остальном похвастаться нечем.
Для z/OS в принципе невозможно заражение вирусами и прочим вредоносным ПО. Ограждает как сама ее архитектура, так и имеющиеся средства защиты. Любая несанкционированная активность приложений и процессов просто невозможна. То же самое относится и к СУБД DB2 для z/OS, которая весьма тесно переплетена с системой безопасности ОС. Таким образом обеспечивается беспрецедентный уровень безопасности данных, чего нельзя добиться на других платформах. Причем все это никак не влияет на производительность.
А о том, что системное ПО систем как x86, так и RISC в принципе подвержено заражению, напоминать не нужно. Вопрос лишь в том, что для Windows вероятность подвергнуться заражению существенно выше, чем для Unix и Linux. В результате необходимо использовать ПО для защиты от вредоносов, которые далеко не всегда корректно работают, самым пагубным образом влияя на производительность. Также нужно регулярно следить за появлением информации о новых уязвимостях и своевременно их закрывать.
Один из самых распространенных мифов, связанных с мейнфреймами, — то, что они очень дороги и вполне можно обойтись использованием кластеров из более дешевых систем. Так ли это?
Тут есть подвох, который не всегда замечают. Да, RISC‑системы и некоторые решения на x86, например, Fujitsu FlexFrame, начинают обзаводиться технологиями, позаимствованными у мейнфреймов. Однако все родовые недостатки этих платформ никуда не исчезают и начинают проявляться рано или поздно.
Кластер хорошо работает до тех пор, пока не разрастается за пределы какого‑то объема. А его составные части необходимо администрировать. Нужно поддерживать в адекватном состоянии операционную систему, СУБД, другое прикладное ПО. Надо следить за тем, чтобы сами серверы были исправны, а также за кабельным хозяйством, сетевым оборудованием. Для кластера в 500 узлов нужно несколько стоек одних коммутаторов. И всю эту инфраструктуру тоже надо сопровождать и поддерживать. Для всего этого нужен штат специалистов, который к тому же имеет явную склонность к росту. Плюс площади под оборудование, плюс затраты на электроэнергию, да и само выделение нужных мощностей может стать кое‑где проблематичным. Это техническая сторона. Не стоит также забывать о лицензиях на ПО. С блейдами, а мы их тоже используем, все несколько лучше, но тоже, что называется, до поры до времени. Критический порог тут отодвигается, но не исчезает совсем.
В результате все эти затраты в нашем случае оказались существенно выше, чем стоимость мейнфрейма. Оборудование находится на трех площадках, его обслуживает один администратор и три инженера. Даже более того, мы сэкономили за счет радикального снижения затрат на лицензирование ПО для систем x86.
А как быть с «кадровым голодом», особенно за пределами Москвы и Петербурга?
Это уже чистой воды миф. В любой крупной организации специалисты делятся на две категории: администраторы и технический персонал — с одной стороны, и разработчики — с другой. И для квалифицированного разработчика нет большой разницы, на чем разрабатывать, будь то языки программирования или СУБД. Межплатформенные различия тут играют куда меньшую роль. Конечно, есть некоторые различия между той же DB2 или WebSphere для разных платформ, которые желательно знать и использовать, — и все. Так что с разработчиками проблем нет. Наши специалисты могут писать под любую используемую у нас в компании платформу. Что касается администраторов, тот тут также не вижу проблем. Тем более что системы на обслуживании у IBM, специалисты которой периодически приезжают, что‑то осматривают и меняют. Кроме того, всему можно и нужно учиться. Даже при смене версии Windows, Linux, AIX или другой Unix‑системы. А у IBM есть курсы для администраторов с замечательными преподавателями, которые охотно отвечают на любые вопросы даже тогда, когда курс успешно пройден. В результате любые вопросы с оборудованием IBM, не только мейнфреймами, решаются быстро и качественно. Группа наших администраторов закончила эти курсы и сейчас успешно сопровождает ОС, базу данных и другое ПО.
Также есть мнение, что использование мейнфреймов сложнее, чем систем x86 и RISC. Так ли это?
Начнем с того, что для System z есть не только z/OS, но и Linux, который широко распространен. Да, интерфейс z/OS текстовый. Но и практически все серверные версии Unix и Linux для других платформ также используют командную строку, подчас не имея никаких средств поддержки графического интерфейса. И с ними работают по многу лет, успешно решая все стоящие задачи. Да и Windows Server 2008 и новее тоже может работать в текстовом режиме. Для управления подобными серверами есть богатый инструментарий, во многих случаях более гибкий и удобный, чем при использовании графического интерфейса.
К тому же в z/OS есть такое средство, как TSO, обеспечивающее интерфейс пользователя. Там имеется инструментарий, облегчающий выполнение задач по администрированию системы, прикладного ПО, разработке приложений. Эти средства псевдографические, отдаленно похожие на те, что использовались в DOS, Novell Netware или FAR.
Каковы дальнейшие планы развития проекта? Планируется ли расширение, модернизация систем?
В ближайших планах — приобретение второй системы и построение сисплекса, кластерной системы. Это позволит нам обеспечить не только резервирование, но и объединение мощностей. На x86 и RISC ничего подобного нет, можно обеспечить только зеркалирование. Далее планируется перевод всей инфраструктуры на мейнфреймы. Пока на них работает только наша платежная система.