Возможный путь развития: программно-определяемые системы хранения данных

Данный пост посвящен возможному развитию программно-определяемых СХД. Я не претендую на стопроцентный прогноз, но мне хочется немного заглянуть в будущее и посмотреть, что может произойти на рынке СХД в ближайшее время.

Начнем с обзора текущей ситуации и прогнозов по росту рынка программно-определяемых систем хранения данных.

Многие ИТ-специалисты, с которыми я общался, выбирают системы хранения с расчётом на 2-3 года использования. По данным IDC, количество данных в мире удваивается каждые два года, и к 2020 году объем данных будет равен 44 зетабайтам или 44 триллионам гигабайт, то есть по 5 терабайт на каждого жителя Земли, включая младенцев (!).  Данное утверждение легко доказать простым примером: ещё 10 лет назад любительский зеркальный фотоаппарат (возьмём Canon EOS 350 для примера) имел матрицу 8MPx и размер фотографии 7.5МБ, сейчас матрица у Canon EOS 750D – 24MPx, а размер фотографии – 30МБ. Получается, что за 10 лет размер одной фотографии увеличился в 4 раза — соответственно, он удваивался каждые 2.5 года.

Для хранения постоянно увеличивающегося объёма данных нужно огромное количество систем хранения данных. СХД, в свою очередь, должны быть оптимальны по тем параметрам, которые не менялись последние 15-20 лет:

  • производительность
  • стоимость хранения
  • управление хранением

С производительностью всё предельно просто: из года в год приложения становятся требовательнее к ресурсам, как по операциям ввода-вывода (IOps), так и по пропускной способности. Когда нужно сделать новый проект, например, VDI, необходима более производительная СХД, что влечёт за собой увеличение бюджета на хранение. Всё, что мы делаем для обеспечения высокой производительности, сильно повышает стоимость нашей СХД. Дело не только в стремлении использовать передовые технологии (например, All-Flash/SSD storage); прежде всего, нужно пройти цикл обновления железа и ПО, совершить миграцию данных. После внедрения мы оказываемся в ситуации, когда у нас есть пул из разрозненных систем хранения разных производителей, которые несовместимы между собой. У нас нет общей системы управления этими хранилищами. Вследствие появляются сложности в планировании обслуживания, обновлении и переносе данных. Многие вендоры до недавнего времени предлагали единственное решение — установить новую «коробку» вместо всех старых, что решит все ваши проблемы. В последние два года компании-лидеры рынка СХД ( EMC, NetApp, HP, IBM, DELL) анонсировали свои решения в идеологии программно-определяемых систем хранения данных (Software Defined Storage – SDS); помимо лидеров, много новых компаний выпустили на рынок продукты в идеологии SDS.

Что же такое Software Defined Storage и почему так много шума вокруг? На сегодняшний день нет устоявшегося определения SDS, есть только описание набора возможностей, которые предоставляют программно-определяемые СХД. Платформы SDS обеспечивают ИТ-организациям следующие возможности:

  • Повышение автономности и гибкости при закупке ресурсов хранения данных. (Гибкость закупок позволяет ИТ-организациям выбрать подходящую физическую или виртуальную аппаратную платформу для развертывания платформы SDS);
  • Экономические преимущества от стандартизации инфраструктуры хранения данных на недорогих серверах и JBOD-системах отраслевого стандарта;
  • Комбинирование и согласование аппаратных платформ и нагрузок нескольких поколений, а также разделение циклов обновления аппаратного и программного обеспечения, позволяющее увеличить возврат инвестиций в инфраструктуру хранения данных;

По функциональности такие СХД не уступают обычным и обеспечивают все основные функции, характерные для СХД: дедупликацию, репликацию, thin provision, snapshots, back-up, tiering. Основными отличиями являются гибкость, автоматизация управления (работа в концепции «СХД как сервис»), меньшая стоимость совокупного владения и капитальных затрат.

Почему SDS? Ответ очень прост: теоретически ПО должно уметь делать несколько важных вещей:

  • Первое — допускать возможность совместного использования железа различных производителей. Это позволит избежать вендор-лока и сократить капитальные затраты.
  • Второе — уметь отделять преимущества софта от железа. Другими словами, мы сможем избежать обновления софта при обновлении железа и наоборот.
  • Третье — позволять использовать весь пул хранения на разном железе и управлять им из единого центра. При использовании новых технологий и стандартов должен быть программный способ интегрировать их в текущую систему хранения.
  • Четвертое — упрощать ввод в эксплуатацию новых пулов хранения данных, делать миграцию данных простой и лёгкой.

Было бы странно, если бы никто в мире не заметил такое количество преимуществ, которые даёт абстрагирование от железа. Произошла революция в мире СХД: ПО отделили от железа и дали возможность запускать его на стандартных x86 серверах. Сейчас по инерции развиваются и аппаратно-зависимые СХД, однако все лидеры рынка СХД в прошлом году представили свои продукты в концепции SDS. По прогнозам IDC, этот рынок вырастет с 1.4 млрд долларов США в 2014 году до 6.2 млрд. долларов в 2019 году.

Условно SDS можно поделить на несколько направлений:

  • Storage Hypervisor — ПО, которое может запускаться на сервере, на виртуальной машине, внутри гипервизора или в сети хранения данных. Этот сегмент вырастет с 609 млн до 1.8 млн в 2019.
  • Storage Virtual Software — открытое и масштабируемое ПО, которое исключает вендор-лок и обеспечивает открытое, безопасное и масштабируемое управление данными по минимальной цене. Рост составит с 215 млн до 1.9 млрд к 2019 г.
  • Control Planes — ПО, отвечающее за обработку политик хранения и транслирующее эти политики на более низкие уровни ресурсов и сервисов. Доля на рынке увеличится с 453 млн до 1.44 млрд к 2019г.
  • Data Services — ПО, реализующее дополнительные функции в СХД. Прогнозируемый прирост: с 65 млн до 1 млрд к 2019г.

Что же двигает развитие рынка SDS? На данный момент драйверами являются:

  • Big Data — количество данных растёт каждый год, а для их хранения, как ни парадоксально, нужны системы хранения. Бизнесу нужны хорошо масштабируемые надёжные СХД, и SDS может обеспечить такие потребности. Кроме того, SDS обеспечивает потребности малого и среднего бизнеса за счёт уменьшения стоимости железа и инфраструктуры
  • Уменьшение расходов — большинство предприятий озадачены оптимизацией своих расходов, использование SDS позволяет использовать стандартные х86 серверы и компоненты для построения производительных, гибких СХД
  • Сложность сетей хранения данных — долгое время растущая сложность SAN-сетей была вызовом для операторов дата-центров, а также компаний, внедрявших СХД в предприятиях среднего и малого бизнеса. SDS позволяет упростить SAN-сеть и снизить затраты для среднего и малого бизнеса.

 

Продолжение следует…

Во второй части рассмотрим новые технологии, которые появятся на рынке SDS в ближайшее время.