«M1Cloud использует экспертный и всесторонний подход к построению системы комплексного мониторинга ИТ-инфраструктуры. Нам удалось выстроить проактивный мониторинг благодаря тонким настройкам, которые были протестированы на реальных кейсах компаний из разных отраслей. Количество отслеживаемых параметров позволяет контролировать работоспособность всех компонентов инфраструктуры и предоставлять заказчикам высоконадежные сервисы», - прокомментировал Дмитрий Соловьёв, технический директор Stack Group и M1Cloud.
Для мониторинга виртуализации используется автоматизированный процесс добавления хостов, который включает механизм автообнаружения – при добавлении кластера добавляются все хосты, а при удалении хоста из кластера он пропадает из мониторинга. Таким образом, удается устранить человеческий фактор. При этом отслеживаются управляющие кластером компоненты, а также базы загрузки ресурсов, состояние баз данных и статусы служб внутри.
Мониторинг СХД включает мониторинг capacity, hardware и performance и позволяет наблюдать за доступностью ресурсов CPU и RAM, в том числе определяются допустимые пороги нагрузки для SAS, SSD и SATA.
Мониторинг SAN сети отслеживает равномерность утилизации линков и их состояние на критических портах – crc и psc, а также ошибки на physical layer. Помимо этого, отслеживается sfp-температура и уровни сигналов, а также аппаратный статус всех компонентов, вплоть до кулеров.
В процессе мониторинга Hardware отслеживаются базовые параметры серверов, систем хранения данных и fc-коммутаторов. Данный вид мониторинга позволяет при появлении ошибок или критических задержках превентивно осуществить замену дисков.
Мониторинг приложений оценивает состояние Cloud Director, VCDA, vCenter, NSX-V и NSX-T. В частности, отслеживается статус сертификатов для Cloud Availability и NSX, проверяется взаимосвязи Cloud Director – зарегистрированы ли vCenter сервера, может ли vCenter управлять NSV-V, доступность NSX-T, а также доступность cell, статус репликации PostgresSQL, доступность по API.