Для реализации CDC в состав дистрибутива Arenadata Streaming включены два source-коннектора Debezium для сервиса Kafka Connect, предназначенные для захвата изменений в базах данных PostgeSQL и Microsoft SQL Server. Они собирают изменения данных в СУБД, записывая их в топики Kafka, а затем различные sink-коннекторы могут передавать эти данные в другие базы и хранилища. Предусмотрена возможность использовать доступные «из коробки» коннекторы Debezium, добавлять собственные и настраивать их из веб-интерфейса ADS Control — системы для управления кластерами потоковой передачи.
Новая версия Arenadata Streaming реализует концепцию Tiered Storage — «многослойного» хранения данных в топиках Kafka. Поступающие «горячие» данные располагаются в локальной файловой системе, а далее, согласно заданным политикам, переносятся во внешнюю систему, которая лучше адаптирована для долгосрочного хранения «холодных» данных. В качестве внешней системы Arenadata Streaming поддерживает HDFS[ Минимальная версия Arenadata Hadoop для импорта HDFS при настройке многоуровневого хранилища — ADH 3.3.6.2.b1.] и S3.
«Концепция Tiered Storage позволяет сократить расходы и предоставить дополнительную гибкость, когда требуется хранение исторических данных. Благодаря ограниченному набору локальных сегментов снижается потребность в преждевременном масштабировании, уменьшается время на расширение и ребалансировку кластера, а также на его восстановление после сбоев и обслуживания», — комментирует Александр Анисимов, технический руководитель продукта Arenadata Streaming.
В Arenadata Streaming включён новый сервис мониторинга. Он разворачивает в ADS свой сервер Prometheus, который собирает и хранит метрики мониторинга кластера (системные, а также метрики сервисов Kafka, ZooKeeper, Kafka REST Proxy, Schema-registry, ksqlDB, NiFi, MiNiFi, Kafka Connect). Просматривать и анализировать собранные данные можно в веб-интерфейсе Prometheus или в веб-приложении Grafana.
Новая версия Arenadata Streaming поддерживает протокол согласования Kafka Raft (KRaft), который позволяет управлять метаданными внутри Kafka, устраняя зависимость от внешнего сервиса ZooKeeper. Благодаря KRaft использование Kafka становится проще, сокращается целевое время восстановления системы (RTO) и кратно увеличивается доступное число партиций, поддерживаемых одним кластером. В текущей версии продукта функционал предоставляется в режиме превью и не предназначен для использования в продуктивной среде.