События мониторинга#
Для просмотра текущего состояния системы в Pangolin предусмотрены предопределенные представления. Подробнее о представлениях смотрите в официальной документации PostgreSQL, а также в разделе «Сценарии администрирования» документации Pangolin.
Для сбора метрик с Pangolin необходимо дополнительное ПО, установка которого описана в документе «Установка и настройка дополнительных компонентов системы, не входящих в состав дистрибутива Pangolin», раздел «Мониторинг с помощью Grafana» (доступен в личном кабинете).
Примечание:
Дополнительные запросы для
postgres_exporterможно найти здесь.
Фоновые процессы: autovacuum и vacuum#
Название метрики |
Частота сборки метрик |
Описание метрики |
Описание результатов сбора метрик |
SQL запрос |
Пример использования Grafana-prometheus:postgres_exporter |
|---|---|---|---|---|---|
|
1 раз /10 сек |
Значение параметра |
Значение параметра на момент сбора метрик |
Получение значения из |
Количество транзакций, оставшихся до принудительной остановки Pangolin ( |
|
1 раз /10 сек |
Количество транзакций БД до принудительной остановки СУБД |
Текущее значение Transaction ID на момент сбора метрик |
|
Cм. ячейку выше |
|
1 раз /10 сек |
Запуск операции vacuum по таблице |
Количество операции vacuum по таблице |
|
Таблицы по количеству проходов |
|
1 раз /10 сек |
Запуск операции |
Количество операции |
Cм. ячейку выше |
Cм. ячейку выше |
|
1 раз /10 сек |
Значение параметра |
Значение параметра на момент сбора метрик |
Получение значения из |
Работающие процессы |
|
1 раз /10 сек |
Операции |
Количество запущенных процессов |
|
Cм. ячейку выше |
|
1 раз /10 сек |
Операции vacuum, запущенные пользователем |
Количество инициированных пользователем процессов vacuum в момент опроса |
|
Cм. ячейку выше |
|
1 раз /10 сек |
Операции vacuum для избежания случая wraparound |
Количество процессов vacuum, запущенных, чтобы избежать wraparound в момент опроса |
|
Cм. ячейку выше |
Фоновые процессы: bgwritter и checkpoint#
Название метрики |
Частота сборки метрик |
Описание метрики |
Описание результатов сбора метрик |
SQL запрос |
Пример использования Grafana-prometheus:postgres_exporter |
|---|---|---|---|---|---|
|
1 раз /10 сек |
Значение параметра |
Значение параметра на момент сбора метрик |
Получение значения из |
Запись на диск различными процессами СУБД: |
|
1 раз /10 сек |
Буферы, записанные самим серверным процессом |
Количество буферов, записанных самим серверным процессом |
Значение из |
Cм. ячейку выше |
|
1 раз /10 сек |
Буферы, записанные фоновым процессом записи |
Количество буферов, записанных фоновым процессом записи |
Значение из |
Cм. ячейку выше |
|
1 раз /10 сек |
Буферы, записанные процессом контрольной точки |
Количество буферов, записанных процессом контрольной точки |
Значение из |
Cм. ячейку выше |
|
1 раз /10 сек |
Файлы, архивированные процессом архивации WAL файлов |
Количество файлов WAL, которые были успешно архивированы |
Значение из |
Cм. ячейку выше |
|
1 раз /10 сек |
Файлы, созданные запросами в этой базе данных |
Количество временных файлов, созданных запросами в этой базе данных |
Значение из |
Cм. ячейку выше |
|
1 раз /10 сек |
Страницы (блоки), измененные запросами |
Количество блоков затронутых во время выполнения запросов |
|
Страницы (блоки) измененные запросами: |
|
1 раз /10 сек |
Контрольные точки, инициированные по срабатыванию таймаута |
Количество работающих контрольных точек, инициированных по срабатыванию таймаута |
Значение из |
Статистика контрольных точек: |
|
1 раз /10 сек |
Контрольные точки, инициированные по условию на размер накопленного WAL |
Количество работающих контрольных точек, инициированных по условию на размер накопленного WAL |
Значение из |
Cм. ячейку выше |
|
1 раз /10 сек |
Общее время, которое было затрачено на этап обработки контрольной точки, в котором файлы записываются на диск, в миллисекундах |
Общее время, которое было затрачено на этап обработки контрольной точки, в котором файлы записываются на диск, в миллисекундах |
Значение из |
Cм. ячейку выше |
|
1 раз /10 сек |
Общее время, которое было затрачено на этап обработки контрольной точки, в котором файлы синхронизируются с диском, в миллисекундах |
Общее время, которое было затрачено на этап обработки контрольной точки, в котором файлы синхронизируются с диском, в миллисекундах |
Значение из |
Cм. ячейку выше |
Репликация#
Название метрики |
Частота сборки метрик |
Описание метрики |
Описание результатов сбора метрик |
SQL запрос |
Пример использования Grafana-prometheus:postgres_exporter |
|---|---|---|---|---|---|
|
1 раз /10 сек |
Активность репликации |
Количество и статус активных слотов репликации |
|
Активность репликации: |
|
1 раз /10 сек |
Время, прошедшее с момента локального сброса последних данных WAL до получения уведомления о том, что этот ведомый сервер записал, сбросил на диск и применил их |
Задержка, возникшая при фиксации транзакции, когда в synchronous_commit выбран уровень remote_apply |
|
Максимальная задержка репликации (в секундах) всех реплик: |
|
1 раз /10 сек |
Время, прошедшее с момента локального сброса последних данных WAL до получения уведомления о том, что этот ведомый сервер записал их (но еще не сбросил на диск и не применил) |
Задержка, возникшая при фиксации транзакции, когда в |
Cм. ячейку выше |
Задержка репликации по фазам(в секундах): |
|
1 раз /10 сек |
Время, прошедшее с момента локального сброса последних данных WAL до получения уведомления о том, что этот ведомый сервер записал и сбросил их на диск (но еще не применил) |
Задержка, возникшая при фиксации транзакции, когда в |
Cм. ячейку выше |
Cм. ячейку выше |
|
1 раз /10 сек |
Показывает количество записей в WAL, которые по-прежнему могут быть нужны пользователям этого слота и, таким образом, не будут автоматически удаляться при контрольных точках |
Количество записей в WAL (в байтах), которые по-прежнему могут быть нужны пользователям этого слота и, таким образом, не будут автоматически удаляться при контрольных точках |
|
Слоты репликации (оставшиеся байты): |
|
1 раз /10 сек |
Показывает количество адресов (LSN), которые нужны потребителю логического слота для репликации данных |
Количество адресов (LSN) (в байтах), которые нужны потребителю логического слота для репликации данных |
Cм. ячейку выше |
Cм. ячейку выше |
|
1 раз /10 сек |
Задержка репликации между позицией локального применения изменений и позицией применения изменений с ведомого сервера |
Общая задержка репликации в байтах |
|
Общая задержка репликации в байтах, сумма по всем репликам: |
|
1 раз /10 сек |
Задержка репликации между позицией локального применения изменений и позицией отправленных изменений ведомого сервера |
Задержка показывает, сколько WAL было создано, но еще не отправлено резервным серверам |
Cм. ячейку выше |
Задержка репликации по фазам(в байтах): |
|
1 раз /10 сек |
Задержка репликации между позицией локального применения изменений и позицией записи изменений (но еще не сброшенных на диск и не применимых) с ведомого сервера |
Задержка показывает WAL в сети, которые были отправлены, но еще не записаны |
Cм. ячейку выше |
Cм. ячейку выше |
|
1 раз /10 сек |
Задержка репликации между позицией локального применения изменений и позицией записи и сброса изменений на диск (но еще не воспроизведенных) с ведомого сервера |
Задержка показывает, что WAL был сброшен в постоянное хранилище, но еще не воспроизведен |
Cм. ячейку выше |
Cм. ячейку выше |
|
1 раз /10 сек |
Задержка репликации между позицией локального применения изменений и позицией не сброшенных изменений в постоянные хранилище с ведомого сервера |
Задержка показывает, что WAL записан, но не сброшен в постоянное хранилище |
Cм. ячейку выше |
Cм. ячейку выше |
Работа с буферами#
Название метрики |
Частота сборки метрик |
Описание метрики |
Описание результатов сбора метрик |
SQL запрос |
Пример использования Grafana-prometheus:postgres_exporter |
|---|---|---|---|---|---|
|
1 раз /10 сек |
Сколько раз дисковые блоки обнаруживались в буферном кеше, так что чтение с диска не потребовалось |
Количество блоков прочитанных из кеша в этой базе данных |
Значение из pg_stat_database |
blks_hit и blks_read: |
|
1 раз /10 сек |
Количество прочитанных дисковых блоков в этой базе данных |
Количество прочитанных дисковых блоков в этой базе данных |
Значение из pg_stat_database |
– |
|
1 раз /10 сек |
Число попаданий в буфер для этой таблицы |
Количество блоков прочитанных из буфера, прочитанных для этой таблицы |
|
heap_blks_hit и heap_blks_read: |
|
1 раз /10 сек |
Количество дисковых блоков, прочитанных из этой таблицы |
Количество дисковых блоков, прочитанных из этой таблицы |
Cм. ячейку выше |
Cм. ячейку выше |
|
1 раз /10 сек |
Число попаданий в буфер для этого индекса |
Количество блоков прочитанных из буфера, прочитанных для этого индекса |
Cм. ячейку выше |
idx_blks_hit и idx_blks_read: |
|
1 раз /10 сек |
Количество дисковых блоков, прочитанных из этого индекса |
Количество дисковых блоков, прочитанных из этого индекса |
Cм. ячейку выше |
Cм. ячейку выше |
Блокировки#
Название метрики |
Частота сборки метрик |
Описание метрики |
Описание результатов сбора метрик |
SQL запрос |
Пример использования Grafana-prometheus:postgres_exporter |
|---|---|---|---|---|---|
|
1 раз /10 сек |
Количество событий ожидания подключений СУБД |
Количество событий ожидания подключений СУБД |
|
События ожидания по типам: |
|
1 раз /10 сек |
Количество блокировок всех типов, зафиксированное в этой базе данных |
Количество блокировок всех типов, зафиксированное в этой базе данных |
Значение из pg_locks |
Блокировки: |
|
1 раз /10 сек |
Количество взаимных блокировок, зафиксированное в этой базе данных |
Количество взаимных блокировок, зафиксированное в этой базе данных |
Значение из pg_stat_database |
Взаимные блокировки: |
Статистика по запросам#
Название метрики |
Частота сборки метрик |
Описание метрики |
Описание результатов сбора метрик |
SQL запрос |
Пример использования Grafana-prometheus:postgres_exporter |
|---|---|---|---|---|---|
|
1 раз /10 сек |
Топ 5 запросов с максимальным общим временем, затраченным на запрос, в миллисекундах, запрос обогащен текстом запроса |
Топ 5 запросов с максимальным общим временем, затраченным на запрос, в миллисекундах, запрос обогащен текстом запроса |
|
Топ запросов по общему времени выполнения: |
|
1 раз /10 сек |
Топ 5 запросов с максимальным средним временем, затраченным на запрос, в миллисекундах, запрос обогащен текстом запроса |
Топ 5 запросов с максимальным средним временем, затраченным на запрос, в миллисекундах, запрос обогащен текстом запроса |
|
Топ запросов по среднему времени выполнения: |
|
1 раз /10 сек |
Топ 5 запросов по числу выполнения, запрос обогащен текстом запроса |
Топ 5 запросов по числу выполнения, запрос обогащен текстом запроса |
|
Топ запросов по количеству вызовов: |
|
1 раз /10 сек |
Топ 5 запросов с максимальным процессорным временем, запрос обогащен текстом запроса |
Топ 5 запросов с максимальным процессорным временем, запрос обогащен текстом запроса |
|
Топ запросов по использованию центрального процессора: |
|
1 раз /10 сек |
Топ 5 запросов по среднему количеству возвращенного числа строк, запрос обогащен текстом запроса |
Топ 5 запросов по среднему количеству возвращенного числа строк, запрос обогащен текстом запроса |
|
Топ запросов по среднему возвращенному числу строк: |
|
1 раз /10 сек |
Топ 5 запросов по числу, строк полученных или затронутых запросом, запрос обогащен текстом запроса |
Топ 5 запросов по числу строк, полученных или затронутых запросом, запрос обогащен текстом запроса |
|
Топ запросов по возвращенным строкам: |
|
1 раз /10 сек |
Топ 5 запросов по пропускной способности, запрос обогащен текстом запроса |
Топ 5 запросов по пропускной способности, запрос обогащен текстом запроса |
|
Топ запросов по пропускной способности: |
|
1 раз /10 сек |
Топ 5 запросов с максимальным дисковым временем, запрос обогащен текстом запроса |
Топ 5 запросов с максимальным дисковым временем, запрос обогащен текстом запроса |
Внимание! Требуется включенный параметр track_io_timing |
Топ запросов по использованию диска: |
|
1 раз /10 сек |
Общее время, затраченное на запрос, в миллисекундах |
Общее время, затраченное на запрос, по каждому запросу, сохраненному в статистике |
|
Топ запросов по общему времени выполнения: |
|
1 раз /10 сек |
Среднее время, затраченное на запрос, в миллисекундах |
Среднее время, затраченное на запрос, по каждому запросу, сохраненному в статистике |
Cм. ячейку выше |
Cм. ячейку выше |
|
1 раз /10 сек |
Число выполнений запроса |
Число выполнений по каждому запросу, сохраненному в статистике |
Cм. ячейку выше |
Cм. ячейку выше |
|
1 раз /10 сек |
Общее число строк, полученных или затронутых запросом |
Общее число строк по каждому запросу, сохраненному в статистике |
Cм. ячейку выше |
Cм. ячейку выше |
|
1 раз /10 сек |
Общее число попаданий в разделяемый кеш блоков для запроса |
Общее число попаданий в разделяемый кеш блоков по каждому запросу, сохраненному в статистике |
Cм. ячейку выше |
Cм. ячейку выше |
|
1 раз /10 сек |
Общее число чтений разделяемых блоков для запроса |
Общее число чтений разделяемых блоков по каждому запросу, сохраненному в статистике |
Cм. ячейку выше |
Cм. ячейку выше |
|
1 раз /10 сек |
Общее число разделяемых блоков, «загрязненных» запросом |
Общее число разделяемых блоков, «загрязненных», по каждому запросу, сохраненному в статистике |
Cм. ячейку выше |
Cм. ячейку выше |
|
1 раз /10 сек |
Общее число разделяемых блоков, записанных запросом |
Общее число разделяемых блоков по каждому запросу, сохраненному в статистике |
Cм. ячейку выше |
Cм. ячейку выше |
|
1 раз /10 сек |
Общее число чтений временных блоков для запроса |
Общее число чтений временных блоков по каждому запросу, сохраненному в статистике |
Cм. ячейку выше |
Cм. ячейку выше |
|
1 раз /10 сек |
Общее число записей временных блоков для запроса |
Общее число записей временных блоков по каждому запросу, сохраненному в статистике |
Cм. ячейку выше |
Cм. ячейку выше |
|
1 раз /10 сек |
Общее время, затраченное запросом на чтение блоков, в миллисекундах |
Общее время, затраченное каждым запросом на чтение блоков, в миллисекундах |
Cм. ячейку выше |
Cм. ячейку выше |
|
1 раз /10 сек |
Общее время, затраченное запросом на запись блоков, в миллисекундах |
Общее время, затраченное каждым запросом на запись блоков, в миллисекундах |
Cм. ячейку выше |
Cм. ячейку выше |
|
1 раз /10 сек |
Общее число попаданий в локальный кеш блоков для данного запроса |
Общее число попаданий в локальный кеш блоков по каждому запросу, сохраненному в статистике |
Cм. ячейку выше |
Cм. ячейку выше |
|
1 раз /10 сек |
Общее число чтений локальных блоков для данного запроса |
Общее число чтений локальных блоков по каждому запросу, сохраненному в статистике |
Cм. ячейку выше |
Cм. ячейку выше |
|
1 раз /10 сек |
Общее число локальных блоков, записанных данным запросом |
Общее число локальных блоков по каждому запросу, сохраненному в статистике |
Cм. ячейку выше |
Cм. ячейку выше |
|
1 раз /10 сек |
Общее число локальных блоков, «загрязненных» данным запросом |
Общее число локальных блоков, «загрязненных», по каждому запросу, сохраненному в статистике |
Cм. ячейку выше |
Cм. ячейку выше |
Метрики etcd#
Примечание:
Подробная информация по метрикам etcd приведена в официальной документации.
Название метрики |
Частота сборки метрик |
Описание метрики |
Описание результатов сбора метрик |
|---|---|---|---|
|
1 раз /10 сек |
Существует ли лидер |
1 или 0 от каждого узла кластера. 1 - существует 0 - отсутствует |
|
1 раз /10 сек |
Количество подтвержденных смен лидера кластера |
Количество подтвержденных смен лидера кластера |
|
1 раз /10 сек |
Общее количество примененных консенсусных предложений |
Количество примененных консенсусных предложений |
|
1 раз /10 сек |
Распределение задержки fsync, вызванное процессом записи WAL-файлов |
Время задержки работы fsync с диском для каждого узла кластера |
|
1 раз /10 сек |
Распределение задержки подтверждения вызванного процессом etcd |
Время задержки, вызванное процессом etcd для каждого узла кластера |
|
1 раз /10 сек |
Общее число полученных байт от членов кластера |
Количество полученных байт от членов кластера |
|
1 раз /10 сек |
Общее число отправленных байт членам кластера |
Количество отправленных байт членам кластера |
|
1 раз /10 сек |
Гистограмма кругового обхода между членами кластера |
Время кругового обхода между участниками сети |
|
1 раз /10 сек |
Общее число полученных байт от клиентов по gRPC |
Количество полученных байт от клиентов по gRPC |
|
1 раз /10 сек |
Общее число отправленных байт клиентам по gRPC |
Количество отправленных байт клиентам по gRPC |
|
1 раз /10 сек |
Общее количество сбоев приема от узла |
Количество сбоев приема от узла |
|
1 раз /10 сек |
Общее количество сбоев отправки к узлу |
Количество сбоев отправки к узлу |
|
1 раз /10 сек |
Общее количество ошибочных консенсусных предложений |
Количество ошибочных консенсусных предложений |
|
1 раз /10 сек |
Общее количество ожидающих консенсусных предложений |
Количество ожидающих консенсусных предложений |
|
1 раз /10 сек |
Сумма распределение задержки fsync, вызванное процессом записи WAL-файлов |
Сумма распределения задержки fsync, вызванная процессом записи WAL-файлов |
|
1 раз /10 сек |
Сумма распределение задержки подтверждения вызванного процессом etcd |
Сумма распределения задержки подтверждения вызванного процессом etcd |
|
1 раз /10 сек |
Сумма распределения задержки сохранения «v3.snapshot» |
Сумма распределения задержки сохранения «v3.snapshot» |










































