Кластерная СХД XtremIO на флэш-памяти от EMC
25 июня 2015 г. | Категория: Теория и практика SDDC, Виртуализация вычислений, Программно-определяемые системы хранения
В конце 2013 года, предложив рынку XtremIO, компания EMC вышла на лидерские позиции в сегменте массивов, построенных полностью на флэш-памяти (All-Flash Array, AFA). Для сравнения, известная ранее модель VNX-F попадает только лишь в категорию гибридных накопителей (Hybrid Flash Array, HFA), поскольку хотя она комплектуется дисками SSD, но при этом сохраняет архитектуру, традиционную для дисков HDD, и, как следствие, не использует все преимущества твердотельной технологии.
Рис. 1 Магический квадрант Gartner
Массив XtremIO с самого начала был хорошо воспринят рынком и за последующий год EMC обошла основных конкурентов по объемам продаж в этом классе нокопителей. Соответствующие данные показаны на рис. 1 и 2. За минувший год EMC заметно потеснила прежнего лидера Violin Memory и тем самым вызвала настоящую блоговую войну, где в качестве оружия используют взаимные обвинения к некомпетентности или некорректной трактовке методов, используемых для "уборки мусора", чрезвычайно важных в AFA из-за особенностей физических принципов флэш-памяти. Тем, кому покажутся интересными аргументы противников, можно порекомендовать два содержательных источника: со стороны EMC и со стороны Violin Memory.
Рис. 2 Распределение рынка AFA по данным 451 Reserch
Причина разразившейся полемики в разногласии взгляда на особенности SSD. Глобально принципы записи на все типы твердотельные устройства SSD (Solid State Device) похожи и заметно отличаются от принципов записи на любые магнитные носители (диски, ленты, карты) наличием обязательного для SSD предварительного этапа, так называемой "уборки мусора". При записи на магнитные носители ничего подобного нет, независимо от их конструктивного исполнения, будь то лента, диск или что-то иное, новую запись можно выполнять непосредственно поверх того, что было записано раньше, поскольку в любом случае магнитная головка попросту перемагничивает нужную область носителя и более ничего. А на флэш-памяти перед записью в некоторую область (ячейку) существующие в ней данные предварительно должны стерты и только после этого в эту ячейку могут быть записаны новые данные, эту процедуру называют перепрограммированием ячейки. Ячейка может состоять из одного или более "блоков очистки" (erase block), для устройства размер блока является, например 256 Кбайт.
Предположим, нам требуется записать меньше блока очистки, всего 8 Кбайт, однако выполнить такую операцию без очистки всего блока невозможно, приходится работать со всем блоком целиком. Предельно упрощенно процедуру записи 8 Кбайт на флэш можно представить следующим образом: сначала перекачиваем все 256 Кбайт в буфер, затем заменяем в буфере требуемые 8 Кбайт и возвращаем все 256 Кбайт из буфера в очищенную ячейку на флэш. В процедуру включен цикл уборки мусора перед записью, для нее есть специальное название amplification, которое можно перевести как расширение, в русскоязычной научной литературе используют слово амплификация.
Массив XtremIO отличается от массивов конкурентов тем, что он построен по оригинальной архитектуре и его конструкция удачно использует особенности наиболее современных элементной базы для твердотельной памяти, поэтому в нем реализована уборка мусора на системном уровне (system-level garbage collection) без необходимости выполнения специальных процедур уборки, обязательных во всех остальных массивах. Такие устройства содержат обеспечивают уборку мусора внутри самого устройства SSD и такие устройства проще интерпретировать наподобие обычных дисков HDD. Разработчики XtremIO, известно, что эти накопители были созданы в одноименной израильской компании, объясняют преимуществах своего решения тем, что в процессе разработки не только критически рассмотрели подходы конкурентов к уборке мусора, но и работали в плотном взаимодействии с компаниями разрабатывающими SSD, они лучше знали последние достижения и смогли их использовать system-level garbage collection. Отсутствие выделенной процедуры уборки мусора и есть основной предмет дискуссии.
Рис. 3 Блок-схема массива XtremIO
Несомненным достоинством XtremIO является возможность абстрагироваться от специфических свойств SSD и рассматривать новый накопитель примерно в том же контексте как традиционные, физика остается скрыта средствами system-level garbage collection. В XtremIO реализованы принципы контентно-адресуемого хранения (Content-Addressed Storage, CAS) предложенного бельгийской компанией FilePool, купленной EMC в 2001 году, ее директор по технологиям Пол Карпентер предложил использовать хорошо известный криптографам 128-разрядный хеширующий алгоритм MD5 (Message-Digest algorithm 5) для формирования образа хранимого объекта. Любое изменение в содержании объекта приведет к созданию совершенно иного образа. Наличие метаданных позволяет развести функции доступа к архивным данным и служебные функции, связанные с поддержанием сохранности архива. В 2002 году EMC выпустила первый промышленный образец накопителя Centera 2002. Более подробно см. "Московская премьера Centera".
Архитектура XtremIO Storage Array предполагает горизонтальное масштабирование, он собирается из модулей, называемых X-Bricks, в кластер, как показано на рис. 3. Для управления системой применяется отдельны выделенный Linux-сервер XtremIO Management Server (XMS). Он служит для мониторинга и конфигурирования, при отключенном сервере XtremIO может работать, но без этих функций. В XtremIO Storage System нет ни каких распределенных кэшей и обеспечен в полном смысле этого слова прямой доступ данным (true random I/O) поэтому размер кластера не влияет на производительность. Прямой доступ в сочетании с CAS обеспечивает равномерное распределение (Even distribution) данных и метаданных, что способствует повышению производительности, а также такие важные для современного накопителя функции как встроенное сокращение объема данных Inline Data Reduction, включающее дедупликацию и компрессию данных, динамическое выделение памяти (thin provisioning), расширенную защиту данных (XtremIO Data Protection, XDP), снэпшоты и другое.
Каждый X-Brick собирается в конструктив Disk Array Enclosure (DAE) содержащий 25 или 13 eMLC SSD суммарной емкостью 10 или 5 Tбайт, источники питания и модули подключения к SAS с резервированием и два контроллера Storage Controller для подключения по интерфейсам Fibre Channel (FC), iSCSI и InfiniBand плюс порт менеджмента IPMI. В стойку собирается до 6 X-Brick. По перечисленным показателям XtremIO очень напоминает обычную универсальный блочный накопитель, одна XtremIO задуман как специализированная система хранения (purpose-built flash storage system) с целью сочетания наивысшей производительности с простотой использования и для работы с разнообразными типами данных. Этот функционал возлагается на контролер Storage Controller, встроенный в каждый XtremIO и работающий под управление операционной системы XtremIO на базе Linux. XIOS оптимизирует ввод/вывод, управляет функциональными модулями системы, пулами памяти и прямым доступом в память RDMA over InfiniBand.
Контролерам Storage Controller в каждом из подчинены "диски", размещенные конструктиве Disk Array Enclosure (DAE) по соединению SAS с резервированием. Между собой контролеры Storage Controller из разных связаны в общую надежную структуру (InfiniBand fabric) в ней, вне зависимости от того какой из получает запрос на операцию ввода/вывода из хоста все контролеры Storage Controller из разных X-Bricks кооперируются на выполнении запроса. Как следствие все компоненты системы XtremIO участвуют в распределении нагрузки. Итогом этих архитектурных решений является линейны рост производительности по отношений к росту объема, см. рис. 4.
Рис. 4 Линейность масштабирования XtremIO Storege Array
XtremIO логически вписывается в продуктовую линейку EMC, но у XtremIO есть серьезные внешние конкуренты. Прежде всего это четыре известных стартапа, массивы, производимые ими имеют свои преимущества. Сила Pure Storage в емкости, Violin Memory в производительности, Kaminario и SolidFire в масштабировании. У традиционных вендоров тоже есть продукты класса AFA, у Hitachi это FMD, у HP это 3PAR 7450.
Литература:
Автор: Леонид Черняк
Теги: EMC, SAS
|
Чтобы оставить свой отзыв, вам необходимо авторизоваться или зарегистрироваться
Комментариев: 0