Мониторинг#

GraDeLy реализует метрики, которые отражают общие показатели работы сервиса и отдельных модулей GraDeLy в контексте определенного источника. Для передачи метрик конечной системе используется Kafka: метрики публикуются в специальном топике, либо их публикует компонент Объединенный мониторинг Unimon (MONA) продукта Platform V Monitor (OPM) (далее по тексту – MONA).

Все метрики всегда формируются в разрезе источника данных и, в зависимости от метрики, добавляются дополнительные разрезы:

  • source — источник (мнемоника источника, эквивалентна наименованию);

  • channel — модуль GraDeLy, соответствующий потоку данных;

  • type — тип данных (класс Java);

  • ErrorClass — класс по классификатору ошибок.

Настройка#

Для интеграции с MONA заполните в конфигурационном файле prometheus.yaml параметры:

  • global.⁣scrape_interval — частота забора метрик (в секундах) по умолчанию;

  • scrape_configs.⁣metrics_path — ⁣HTTP путь до endpoint. Всегда равен /actuator/prometheus;

  • scrape_configs.⁣scrape_interval — частота забора метрик (в секундах);

  • scrape_configs.⁣static_configs.targets — массив, содержащий IP адреса и порты модулей GraDeLy, отправляющих метрики.

Метрики#

Название

Тип

Описание

Размерность (лейблы)

Основные атрибуты

gdl-journal.async_process_object.count

counter

Количество переданных объектов за 15с

channel, source, type

- channel: модуль GraDeLy (строка) -y (строка) источник данных (строка) - (строка тип данных / класс Java (строка)

gdl-journal.errors.count

counter

Количество ошибок репликации за 15с по потоку

channel, source

- channel: модуль GraDeLy (строка) -y (строка) источник данных (строка)

Результаты работы с секретами HashiCorp Vault/Secret Management System#

Консоль#

Для отслеживания событий с секретами, относящихся к консоли, используется Platform V Monitor.

Воркер#

Для отслеживания событий с секретами, относящихся к воркеру, используется собственная система событий GraDeLy. События отображаются в Описании события во вкладке Процессы (подробнее в Руководстве пользователя интерфейса консоли управления).

События:

  • успешное чтение и проверка секрета: Successfully read <secret-name> secret;

  • неуспешное чтение и проверка секрета: Failed to read <secret-name> secret;

  • неуспешное применение секрета: Failed to commit <secret-name> secret;

  • неуспешное чтение и проверка секрета при включенной стратегии fail-fast: Failed to read <secret-name> secret, remainingAttempts=<remaining-attempts-count>;

  • неуспешное применение секрета при включенной стратегии fail-fast: Failed to commit <secret-name> secret, remainingAttempts=<remaining-attempts-count>;

  • секреты для БД применителя применены: Update target db connections;

  • запрос на отложенное обновление секретов БД источника принят: Lazy update source db connections.