Мониторинг#
Все сервисы Kintsugi (DBCM) публикуют прикладные метрики в формате Prometheus.
Настройка#
Platform V Kintsugi (DBM) редакция Standard не имеет собственные встроенные средства мониторинга.
Метрики#
Прикладные метрики сервиса backend#
Метрика |
Описание |
|---|---|
|
Количество HTTP-запросов к сервису |
|
Распределение длительности выполнения запросов |
Прикладные метрики сервиса collector#
Метрика |
Описание |
|---|---|
|
Количество попыток выгрузки метрик в хранилище, завершившихся успешно |
|
Количество попыток выгрузки метрик в хранилище, завершившихся ошибкой |
|
Количество выполнения запросов на снятие метрик, завершившихся успешно |
|
Количество выполнения запросов на снятие метрик, завершившихся ошибкой |
|
Длительность выполнения пакетных запросов метрик к наблюдаемым базам |
|
Количество успешно завершенных обновлений конфигурации наблюдаемых БД |
|
Количество завершенных ошибкой обновлений конфигурации наблюдаемых БД |
|
Распределение длительности обновления конфигурации наблюдаемых БД |
|
Длительность процедур сбрасывания метрик в хранилище метрик |
Прикладные метрики сервиса curator#
Метрика |
Описание |
|---|---|
|
Количество HTTP-запросов к сервису |
|
Распределение длительности выполнения запросов |
|
Распределение длительности выполнения запросов к интерфейсу templates |
|
Распределение длительности выполнения запросов к интерфейсу cluster |
Прикладные метрики сервиса dbperf#
Метрика |
Описание |
|---|---|
|
Количество успешно завершенных обновлений конфигурации наблюдаемых БД |
|
Количество завершенных ошибкой обновлений конфигурации наблюдаемых БД |
|
Распределение длительности получения данных из таблицы |
|
Распределение длительности технического обслуживания внутреннего хранилища данных |
|
Текущий уровень общего затраченного времени на запись данных во внутреннее хранилище |
|
Количество попыток записи данных во внутреннее хранилище |
|
Распределение длительности записи данных |
|
Распределение длительности получения данных о производительности из внутреннего хранилища |
|
Распределение длительности выполнения запроса получения данных о производительности |
|
Количество созданных объектов сбора данных из |
|
Количество удаленных объектов сбора данных из |
|
Количество неудачных попыток наложения рекомендательной блокировки в PostgreSQL |
|
Количество завершенных с ошибкой запросов получения данных о производительности |
|
Количество неудачных попыток снятия рекомендательной блокировки в PostgreSQL |
|
Количество неудачных попыток отправки нотификации |
|
Количество запросов получения данных о производительности, завершенных по тайм-ауту |
|
Количество успешных установок соединения к объектам мониторинга |
|
Количество разрыва соединений от объектов мониторинга |
|
Количество обновлений данных объектов мониторинга |
|
Количество успешных попыток наложения рекомендательной блокировки в PostgreSQL |
|
Количество запросов получения данных о производительности, завершенных успешно |
|
Количество успешных попыток снятия рекомендательной блокировки в PostgreSQL |
|
Количество успешных попыток отправки нотификации |
|
Количество полученных запросов, непрошедших валидацию структуры данных |
|
Распределение длительности обновления экспортной конфигурации |
|
Получение всех деревьев блокировок на момент времени |
Прикладные метрики сервиса kmetrics#
Метрика |
Описание |
|---|---|
|
Количество запросов, полученных через WebSocket-соединение |
|
Количество ответов на запросы, отправленных через WebSocket-соединение |
|
Количество WebSocket-запросов в обработке |
|
Количество байт, отправленных через WebSocket-соединение |
|
Количество байт, полученных через WebSocket-соединение |
Прикладные метрики сервиса piface#
Метрика |
Описание |
|---|---|
|
Количество HTTP-запросов к сервису |
|
Распределение длительности выполнения запросов |
Прикладные метрики сервиса mcwatch#
Метрика |
Описание |
|---|---|
|
Продолжительность HTTP-запроса в миллисекундах |
|
Количество метрик, переданных успешно в адаптер БД |
|
Количество пакетов значений метрик, переданных в адаптер БД |
|
Количество обработанных пороговых значений |
|
Количество обработанных значений, пересекающих порог |
|
Количество обработанных запросов получения заданных пороговых значений |
Прикладные метрики сервиса inform#
Метрика |
Описание |
|---|---|
|
Количество открытых соединений в БД |
|
Количество модулей, наблюдаемых компонентом |
|
Количество значений, находящихся в хранилище |
|
Счетчик операций обновления в хранилище |
Прикладные метрики сервиса AgentWay#
Метрика |
Описание |
|---|---|
|
Количество соединений, находящихся в обработке в текущий момент времени |
|
Количество принятых соединений от агента для обработки протокола |
|
Количество завершенных соединений с агентом |
|
Количество отклоненных соединений от агента по причине превышения значения ограничения количества сессий (задается конфигурационным параметром) |
|
Количество успешно установленных соединений на этапе handshake |
|
Количество неуспешно установленных соединений на этапе handshake |
|
Количество принятых сообщений с информацией о выборках (CPU, memory) |
|
Количество принятых сообщений с информацией об обнаруженных СУБД агентом |
|
Общее количество блокировок, в результате которых сессия агента была завершена |
|
Количество полученных отчетов со стороны агента, отложенных для обработки по причине отсутствия рекомендательной блокировки |
|
Количество неудачных попыток получения рекомендательной блокировки на уровне обработки протокола |
|
Количество успешных попыток получения рекомендательной блокировки на уровне обработки протокола |
|
Количество принятых выборок (CPU, memory) для создания метрик в системе |
|
Количество созданных метрик из выборок |
|
Количество переданных метрик (в архитектурный слой uploader) для выгрузки в систему |
|
Количество принятых сообщений с информацией о выборках (CPU, memory) |
|
Количество принятых выборок (CPU, memory) для создания метрик в системе |
|
Количество полученных байт из сервиса-владельца информации об активах. Если информация отсутствует, это означает, что ни одна из метрик не будет записана в систему |
|
Количество созданных метрик из выборок |
|
Количество переданных метрик для выгрузки в систему |
|
Количество неуспешных попыток записи метрик в систему |
|
Количество успешных попыток записи метрик в систему |
|
Количество успешно выгруженных байт из сервиса в систему метрик |
|
Количество неуспешно выгруженных байт из сервиса в систему метрик |
|
Количество принятых сообщений с информацией об обнаруженных СУБД агентом |
|
Текущее количество обнаруженных СУБД всеми агентами Kintsugi |
|
Количество неудачных попыток обновления информации об СУБД |
|
Количество удачных попыток обновления информации об СУБД |
|
Количество проверок целостности сетевого соединения с СУБД, завершенных успешно |
|
Количество проверок целостности сетевого соединения с СУБД, завершенных ошибкой |
|
Количество попыток установления сетевого соединения с СУБД |
|
Количество успешно установленных соединений с СУБД |
|
Количество попыток установления соединения с СУБД, завершенных ошибкой |
Прикладные метрики сервиса scheduler#
Метрика |
Описание |
|---|---|
|
Количество задач (статусы и типы) |
|
Длительность нахождения задачи в очереди на выполнение |
|
Длительность подготовки задачи к исполнению |
|
Количество открытых WebSocket-соединений в данный момент |
|
Время нахождения WebSocket-соединений на разных этапах |
|
Длительность выполнения задачи с момента отправки в backend и до получения результата |
|
Длительность выполнения запроса задачи в БД |
|
Длительность обработки результата задачи |
|
Длительность записи артефакта задачи в хранилище |
|
Размер артефакта |
|
Количество артефактов на задачу |
|
Длительность удаления задачи |
|
Размер хранилища |
|
Размер данных, удаленных из хранилища фоновых процессом очистки |