В последний год тема использования SSD-накопителей в системах хранения данных стала весьма популярной. Тем более что разговоры очень быстро сместились в практическую плоскость. Рассуждения о том, как и где можно использовать такие диски, сменились анонсами реальных систем, которые затем начали появляться и в продаже. Некоторые уже используют такое оборудование.
В принципе технология твердотельных накопителей не так уж нова. Она была разработана еще в конце 70‑х гг. прошлого века. Массовое применение таких накопителей началось больше двух десятков лет назад. Те же флеш-накопители или карты памяти тоже стали привычными продуктами уже лет десять назад. SSD-диски, которые используются в современных системах хранения, конечно, отличаются от своих «родственников», в том числе применяемых в настольных и портативных персональных системах, но у них есть целый ряд общих особенностей. Так что достоинства и недостатки данной технологии следует обозначить подробнее, чтобы более четко определить те ниши, где применение данных накопителей будет оправданным.
Достоинства и недостатки SSD
Главными достоинствами SSD-дисков обычно называют следующие:
- очень малое время задержки при записи и чтении;
- высокая производительность, фактически ограниченная только пропускной способностью самого интерфейса;
- устойчивое время считывания файлов вне зависимости от их расположения или фрагментации;
- низкая потребляемая мощность;
- полное отсутствие вибрации и шума;
- высокая механическая стойкость;
- широкий диапазон рабочих температур.
В итоге, как показывают тесты, проведенные в условиях, близких к имеющим место на практике, SSD-диски на реальных задачах опережают RAID-массивы из самых быстродействующих SAS жестких дисков со скоростью вращения шпинделя 15 KRPM как минимум вдвое, а на некоторых операциях даже практически на порядок (http://www.stoik.ru/articles. php? cat=4&subcat=0&article=2010_11_99_2). Если же диски не объединять в RAID, то разница в быстродействии между SSD и SAS жестким диском составит порядка 15—20 раз, и до 50 раз, если речь идет о массовых SATA-накопителях. При этом SSD-диски не имеют движущихся частей, а значит, не боятся вибраций, механических перегрузок, пыли и агрессивных сред. При этом они не потребляют энергию при отсутствии обращения к ним, что еще более снижает их энергопотребление.
Существенных недостатков у SSD-накопителей всего два, но они довольно существенны. Это, в частности, ограниченное количество циклов перезаписи. У лучших (но и дорогих) образцов он составляет порядка 100 тыс. циклов, однако у некоторых систем на базе технологии MLC этот показатель существенно меньше (5—10 тыс. циклов, по разным данным). Если брать минимальный показатель в 5 тыс. циклов, то при типичном использовании в ЦОД такого диска хватит меньше чем на год. При этом скорость записи у SSD-дисков еще и не слишком велика, что может стать узким местом на ряде задач. В любом случае требуется доработка ПО, иногда серьезная. Это также стоит считать если не недостатком, то определенной особенностью, о которой надо знать и которую необходимо иметь в виду.
Не менее серьезным недостатком является также высокая цена. При этом стоимость SSD прямо пропорциональна емкости, в то время как цена жестких дисков по мере увеличения емкости растет довольно медленно. В итоге средняя стоимость хранения на SSD-диске будет в пять раз выше, чем на SAS-диске, и как минимум на порядок больше, чем на SATA. Были надежды, что по мере перехода к массовому производству цена будет снижаться, но они не оправдались. И это при том, что рынок SSD существенно более конкурентный, чем жестких дисков, где сложилась олигополия небольшого числа крупных игроков.
Таким образом, SSD-диски имеет смысл использовать для следующих задач:
- создание подсистем хранения для оборудования, рассчитанного на использование в жестких условиях эксплуатации;
- хранение данных, где критична скорость чтения;
- в качестве буферной памяти для ускорения доступа к данным.
Как они используются, или как их можно применить на практике? Попробуем рассмотреть некоторые сценарии.
SSD как основа систем хранения, работающих в жестких условиях
Серверные системы приходится использовать не только в практически стерильных условиях центров обработки данных, но и в цехах, на судах и в разных летательных и космических аппаратах, в железнодорожных вагонах и локомотивах. Здесь играют роль такие факторы, как электромагнитные излучения, повышенные или пониженные температуры и влажность, загазованность, запыленность, вибрации, перегрузки. Причем полностью устранить все эти факторы, а они часто представлены в сочетании, не представляется возможным.
Естественно, об использовании жестких дисков для таких систем не может быть и речи, что, к слову, долго было одним из сдерживающих соображений для развития средств промышленной автоматизации и всевозможных бортовых систем. А емкость и быстродействие твердотельных дисков росли не так быстро, как того хотелось бы. Кроме того, существенно упрощается решение многих задач в области внутрицеховой автоматизации, в то время как в прежние времена приходилось идти на всевозможные ухищрения, чтобы избежать размещения тех или иных систем на определенных участках.
То же самое относится и к целому ряду специализированных систем для хранения больших массивов данных, полученных в ходе всяческого рода научных исследований и экспериментов. Впрочем, только этой сферой область применения таких накопителей не ограничивается. Схожие требования возникают и при решении целого ряда инженерных задач, и при геологоразведке, особенно нефтегазовых месторождений, при составлении прогнозов погоды, аэрофотосъемке и еще в множестве других областей.
Когда важна высокая скорость чтения
Ситуация, когда том работает в основном на чтение, в то время как запись происходит существенно реже, не так уж и необычна. Именно так обстоит дело с очень многими задачами, которые решают вычислительные комплексы для высокопроизводительных научных и инженерных расчетов, где необходимо обрабатывать относительно небольшие объемы данных по сложным алгоритмам. В итоге уже есть суперкомпьютеры, где вся подсистема хранения построена на базе SSD-дисков. Например, как раз такая система «СКИФ-Аврора» действует в Южно-Уральском государственном университете.
Использование SSD дает значительный выигрыш и там, где критична скорость ввода-вывода. Везде, где необходимо добиться реальных десятков тысяч операций в секунду (а это, например, все, что связано с биллингом или кеширующими прокси‑серверами), пришлось бы использовать десятки, а то и сотни довольно дорогих SAS-дисков. SSD-накопителей понадобится в десятки раз меньше, что позволит снизить затраты. А новейшие накопители позволяют добиться уже сотен тысяч операций ввода/вывода в секунду. Такой производительности удалось достичь в ходе проекта Quicksilver, который был успешно завершен еще в 2008 г. в одном из исследовательских центров IBM. И это без учета того, что уменьшается пространство, занимаемое дисковыми массивами (в среднем в пять раз), а также энергопотребление и затраты на охлаждение (немногим меньше, чем вдвое). Так что многие аналитики полагают: именно данный сегмент рынка СХД станет прорывным для SSD-дисков, которые будут все более активно вытеснять из него жесткие диски SAS.
Одним из первых успешных применений SSD‑дисков в подсистемах хранения данных началось в качестве системного накопителя в блейд‑серверах. Причем это было сделано практически одновременно и независимо друг от друга обоими ведущими поставщиками таких систем: HP и IBM. В этом случае лучше всего раскрываются достоинства SSD, ведь запись на системный том происходит довольно редко, только при обновлении системы, и в основном такой том работает как раз на чтение. При этом данные размещались на другом устройстве, так же как файл (или раздел) подкачки и всяческие логи, временные файлы и тому подобное. К тому же использование SSD, по данным IBM, позволило снизить энергопотребление на 18 Вт в расчете на сервер, на 252 Вт на шасси и на 1512 Вт на всю стойку.
Схожий эффект достигается и тогда, когда SSD используют для хранения системных образов виртуальных машин. В этом случае количество циклов записи будет еще меньше, в то время как скорость чтения будет оставаться критичным параметром. Это в равной степени относится как к виртуализации серверов, так и к использованию данной технологии для организации рабочих мест.
SSD как буферная память
Использование более быстрых устройств для буферизации чтения с более медленных имеет весьма длительную историю. Вспомним хотя бы программу smartdrv из времен ДОС, которая применялась для ускорения работы жестких дисков еще в конце 1980‑х гг. Аналогичные средства были и для более серьезных систем, в том числе и серверных. И идея использовать в качестве буфера более быстродействующие SSD-накопители тоже не заставила себя ждать. Так называемые гибридные винчестеры для настольных систем и серверов существуют уже несколько лет. В первое время эффективность такого решения вызывала, скажем так, сомнение, но современные устройства действительно заметно быстрее, чем традиционные. При этом эффективность данной технологии для серверов оказалась существенно выше, чем для рабочих станций, где выигрыш составляет, по разным данным, 10—30%. Прежде всего за счет того, что значительную часть ПО удалось адаптировать, с тем чтобы использовать сильные стороны SSD. Кроме того, в гибридных дисках для настольных систем и ноутбуков применяются компоненты с более скромными параметрами.
Хороший пример использования такого подхода — решение Oracle Exadata. «Exadata Version 1 была самой быстродействующей в мире машиной для реализации хранилищ данных. Exadata Version 2 вдвое превосходит Exadata V1 по быстродействию для приложений хранилищ данных и является единственной машиной баз данных, способной исполнять OLTP-приложения. Exadata V2 исполняет практически любые приложения для баз данных значительно быстрее и с меньшими затратами, чем любой другой существующий в мире компьютер», — подчеркнул глава компании Oracle Ларри Эллисон. Как показывают тесты на реальных задачах, никакого преувеличения тут нет. Во многом этого удалось добиться благодаря применению решения Exadata Smart Flash Cache, позволяющего хранить часто запрашиваемые «горячие» данные, чтобы обеспечить высокую пропускную способность и сверхмалое время отклика при обработке транзакций. Емкость буфера составляет 5 Тбайт из общего объема 336 Тбайт неформатированной емкости, которым комплектуется Oracle Exadata 2. Стоит также отметить, что немалую роль в столь значительном ускорении сыграли и доработки, внесенные в код СУБД Oracle 11g и отличающие его от более ранних версий. В противном случае выигрыш все равно был бы, но куда скромнее.
SSD: развеиваем мифы
Игорь Катков,
специалист по продажам систем хранения данных, IBM в России и СНГМне хотелось бы развеять ряд мифов, которые заставляют корпоративных заказчиков воздерживаться от использования SSD при хранении и обработке своих критически важных данных. Данные мифы были «чистой правдой» еще три-пять лет назад, но технологии развиваются, и в настоящее время SSD уже совсем не те, что были раньше.
Миф 1. SSD-накопители — недостаточно зрелая технология для хранения бизнес-критичных данных за счет ограниченного количества циклов перезаписи. Современный SSD-накопитель — сам по себе уже система хранения со своим контроллером, кеш‑памятью, микрокодом и внутренней «файловой системой». Количество перезаписей каждого блока учитывается и выравнивается в масштабах всего накопителя. Заложена дополнительная емкость, и потенциально проблемные блоки заранее выводятся из эксплуатации. В целом, современный SSD-накопитель корпоративного класса — более надежное устройство, нежели жесткий диск, о чем свидетельствует обширная статистика. Миф 2. SSD-накопители эффективны при чтении. При записи преимущество над жесткими дисками минимально. Да, преимущества в 30—50 раз при записи не будет. Но на 7—10 раз рассчитывать можно. Именно такие результаты мы получаем на наших системах хранения при случайной записи на SSD. При типичной смешанной нагрузке SSD превосходит жесткий диск примерно в 20 раз. Миф 3. SSD-накопители — непозволительно дорогая роскошь для большинства коммерческих организаций. Цена за единицу объема SSD по‑прежнему превосходит HDD в 5—10 раз, и это не изменится кардинально в ближайшее время. Добиться экономической эффективности от применения SSD позволяет программное обеспечение систем хранения IBM Easy Tier для автоматического переноса «горячих» данных на SSD. По сути, SSD — это дополнительный слой кеширования. Добавление четырех SSD-накопителей к 100 жестким дискам позволит удвоить производительность СХД при увеличении цены на 30—40%. Возможен и другой вариант — добавить четыре SSD, а 100 жестких дисков заменить на 50 более емких. В этом случае при сохранении исходной производительности стоимость, энергопотребление и габариты СХД кардинально сократятся.