РСК уже более двух лет, с 2018 года, является разработчиком, производителем и интегратором интеллектуальных систем хранения данных «по требованию» (RSC Data Storage-on-Demand). Такие системы уже установлены в Объединенном институте ядерных исследований (ОИЯИ, Дубна), в Санкт- Петербургском политехническом университете Петра Великого (СПбПУ) и Межведомственном суперкомпьютерном центре Российской академии наук (МСЦ РАН).
Российские системы в рейтинге IO500
На данный момент две системы производства РСК являются единственными представителями России в мировом рейтинге IO500 самых высокопроизводительных систем хранения данных – суперкомпьютер «Говорун» с системой хранения данных РСК в ОИЯИ занимает 17-е место в этом списке, а суперкомпьютер «Политехник – РСК Торнадо» в СПбПУ находится на 22-й позиции. Столь хороших результатов удалось достичь благодаря применению в обеих проектах уникальной технологии создания масштабируемых распределённых и компонуемых «по требованию» систем хранения данных RSC Data Storage-on- demand на основе твердотельных дисков Intel® SSD и Intel® OptaneTM SSD с интерфейсами NVMe. Уместно напомнить, что суперкомпьютер «Говорун» еще в июне 2018 г., сразу после установки и запуска в эксплуатацию в ОИЯИ, занял высокое 9-е место в мировом рейтинге IO500.
Поддержка DAOS в решениях RSC Data Storage-on-Demand
На FMS 2020 группа компаний РСК объявила о поддержке в своих решениях RSC Data Storage-on-Demand новой кластерной файловой системы с открытым кодом DAOS (Distributed Asynchronous Object Storage) корпорации Intel. Теперь стало возможным построение не только многослойных систем хранения данных на базе файловой операционной системы Lustre в архитектуре Composable Disaggregated Infrastructure и гибкое управление пулами дисков с интерфейсом NVMe, но и включение в такие слои высокопроизводительных компонент на основе DAOS.
Долгие годы, несмотря на рост номинальной производительности устройств хранения данных, прирост обеспечивался, в основном, за счет повышения
производительности последовательных операций чтения-записи. Использование DAOS позволяет уйти от ограничений старых подходов к построению высокопроизводительных систем хранения данных, связанных с работой протокола TCP/IP, архитектурой ядра ОС Linux и ряда других узких мест, ликвидировав так называемые «бутылочные горлышки» для работы в тех случаях, когда приложению необходим высокоскоростной произвольный доступ к данным.
Существенный рост производительности в случае поддержки DAOS стал возможным благодаря нескольким принципам, заложенным в ее архитектуре:
Платформа оркестрирования «РСК БазИС» для создания высокопроизводительных составных архитектур хранения данных
РСК переносит свой опыт в построении компонуемых дезагрегированных решений и на управление DAOS, а именно предлагает использование для этого программной платформы оркестрации «РСК БазИС».
Реализованные до настоящего момента решения на основе DAOS требовали жестко определенного – на уровне установленной аппаратной конфигурации – соотношения между процессорными ресурсами, наличием энергонезависимой памяти с произвольным доступом (Intel® OptaneTM DC Persistent Memory, PMEM), твердотельных накопителей с интерфейсом NVMe. В рамках платформы «РСК БазИС» можно применить компонуемый подход для управления DAOS, разделив сервера с PMEM и сервера с устройствами NVMe в пулы, объединённые быстрой сетевой фабрикой. Оснащение серверов высокопроизводительными адаптерами с поддержкой RDMA с одной стороны, накопителями с интерфейсом NVMe и части серверов – энергонезависимой памятью Intel® OptaneTM DC Persistent Memorу с другой, позволяет произвести такую дезагрегацию и дальнейшую компоновку «по запросу» без снижения производительности.
Какие преимущества дает такой подход? Во-первых, он позволяет уйти от жесткого соотношения накопителей PMEM/NVMe в серверах хранения. Во-вторых, он позволяет значительно увеличить допустимый объем системы хранения данных. Сегодня требования к объему PMEM в DAOS – не менее 6% от объема локальных накопителей с интерфейсом NVMe – серьезно ограничивают максимальное полезное количество дисков на один сервер хранения. При этом, благодаря компонуемости, неиспользуемые в какой-то момент времени диски можно подключить к другому серверу на основе DAOS или Lustre.
Помимо этого, можно вообще разделить сервера с DAOS и сервера c накопителями NVMe на два пула, тем самым максимально устранив ограничения аппаратной архитектуры сервера (ограниченного возможностями шины PCIe, используемой как накопителями, так и сетевыми адаптерами, а также физических ограничений шасси сервера по размещению дополнительных устройств и их охлаждению).
Эти подходы будут раскрыты в докладе РСК на сессии DUG (DAOS User Group), которая состоится 19 ноября во время крупнейшей всемирной виртуальной конференции-выставки SC20 по суперкомпьютерным технологиям и решениям.
Система хранения данных RSC Tornado AFS
Специалисты РСК представили на FMS 2020 свою обновленную интеллектуальную систему хранения данных «по требованию» RSC Tornado AFS, один узел которой может обеспечивать рекордную емкость до 1 Петабайт благодаря использованию 32-х твердотельных дисков Intel® SSD с интерфейсом NVMe в форм-факторе EDSFF.L (так называемый «рулер»). В таком узле также используются 2 процессора семейства Intel® Xeon® Scalable 2-го поколения, твердотельные диски Intel® OptaneTM SSD и модули энергонезависимой памяти Intel® OptaneTM DC Persistent Memory. В RSC Tornado AFS реализовано 100% жидкостное охлаждение узла в режиме «горячая вода» с рекордно низким показателем эффективности использования электроэнергии PUE на уровне 1,04.
Гиперконвергентный узел RSC Tornado HS
Еще одно решение РСК для создания систем хранения данных «по требованию» – гиперконвергентный узел RSC Tornado HS. Он построен на базе 2- х процессоров семейства Intel® Xeon® Scalable 2-го поколения, серверной платы Intel® Server Board S2600BP с 2-мя портами 10GigE и (опционально) Intel® Quick Assist Support. Такой узел поддерживает до 12-ти твердотельных дисков «с горячей заменой» (hot-swap) Intel® SSD с интерфейсом NVMe, например:
- Intel® SSD DC P4511 (NVMe, M.2) емкостью 1-2 TБ, сконфигурирован как диск;
- или Intel® OptaneTM SSD DC 4801X (M.2) емкостью 375 ГБ, сконфигурирован как диск или память с помощью технологии Intel® Memory Drive Technology (IMDT).
Это обеспечивает большой объем быстрой памяти - до 24 ТБ на узел, а также большой объем оперативной памяти на 1 узел благодаря применению Intel® Memory Drive Technology (IMDT) – до 4,2 ТБ RAM.
Гиперконвергентный узел RSC Tornado HS также работает со 100% жидкостным охлаждением в режиме «горячая вода».