К вопросу о будущем и настоящем в индустрии хранения

Пару дней назад на Хабре вышел блогпост “Перспективы рынка хранения данных” от компании CBS. Статья – вольный перевод англоязычной «Storage Market: Out With The Old, In With The New» («Рынок хранения данных: долой старое, встречайте новое»).

Речь в статье идет о новых бизнес-моделях и новых продуктах, которые вытеснят с рынка существующих игроков. Не буду пересказывать содержание – статья небольшая и с ней легко ознакомиться. Хотелось бы добавить свои пять копеек.

На мой взгляд, многое из того, что представлено в тексте как технологии будущего, уже давно стало частью настоящего.

По некоторым прогнозам, твердотельные диски сравняются по стоимости с жесткими к 2017 году. В целом, хранение данных на flash неизбежно удешевляет процесс. Дело здесь не только в стоимости накопителей, но и в расходах на инфраструктуру (помещение, электричество, охлаждение). Так, новый накопитель от Samsung, вмещающий 512 ГБ данных, весит всего около 1 гр. Экономия пространства и сниженное энергопотребление налицо! Цена IOps при работе с SSD-устройствами также на порядок ниже, чем при работе с HDD.

Что касается стоимости хранения 1 ГБ данных, здесь возможны варианты в зависимости от выполняемых операций. Диски, оптимизированные под различные виды доступа, демонстрируют большой разброс по стоимости гигабайта. Существенно отличаются размеры “запасных блоков”, буферов, а также производительность контроллеров. При этом надежность диска не означает его долговечности. При неправильном использовании диск, превосходящий обычный HDD по параметрам надежности (например, RBER, MTBF), может быть выведен из строя за неделю.

Принципиально важно выбрать правильное аппаратное обеспечение под конкретные задачи и, конечно, позаботиться об управляющем ПО. На стоимость конечного комплексного решения влияет целый ряд факторов: уровень QoS (гарантии по качеству обслуживания), поведение RAID-массива в режиме деградации (при системных или аппаратных сбоях), используемые способы оптимизации записи, поддержка технологий сжатия и дедупликации на лету, решение проблемы write amplification – множественных операций по перемещению данных при записи (что особенно актуально для flash-устройств с ограниченной перезаписью).

Решения RAIDIX уделяют должное внимание этим вопросам. Например, задача оперативного восстановления данных успешно решается за счет быстрого доступа к индексу дедупликации и его кэширования. В случае с флэш-накопителями можно более эффективно использовать хэш-функцию и бороться с коллизиями (возникновением совпадающих хэш-значений) – за счет побитового сравнения найденных дубликатов. В то время как жесткие диски требует больше времени на обработку дополнительного запроса, на твердотельных дисках лишняя операция на чтение пройдет без потери производительности.

Программно-определяемое хранение также далеко не новинка. Здесь, скорее, стоит говорить об изменении подходов к администрированию решений. Так, разрабатываемая в Рэйдикс технология StarRAIN будет учитывать все аспекты стоимости хранения, производительности и обслуживания, c которыми сталкиваются клиенты. Если говорить о новых программных интерфейсах, то главное здесь – постепенный уход от старых уровней записи, привносящих дополнительные задержки. Со временем ПО будет взаимодействовать с СХД напрямую через API, минуя файловую систему и драйверы блочных устройств. И мы в Рэйдикс активно над этим работаем.