Руководство по системному администрированию#

Сценарии администрирования#

Для выполнения сценариев администрирования не требуется какая-либо роль согласно ролевой модели Компонента.

При deploy в системе контейнеризации все токены, пароли, сертификаты и иная чувствительная информация хранится в одном из типов хранилищ:

в секретах системы управления контейнерами;
в файловой системе pod. Все токены, пароли, сертификаты и иная чувствительная информация получена из внешней системы хранения секретов Secret Management System.

Стратегия снятия резервных копий зависит от критичности данных, подлежащих сохранению, и определяется группой сопровождения.

Компонент Engine (BPMX) продукта Platform V Flow (BPM) (далее по тексту – BPMX) состоит из следующих модулей:

bpmx-engine;
bpmx-gateway;
bpmx-scheduler.

Для каждого из модулей есть файл application.yml, который содержит блоки для настроек. Основные настройки для сервисов:

bpmx-engine

блок persistence – настройки подключения к Kafka для хранения информации при обработке процессов (рекомендуемые параметры настройки);
блок engine – настройки для исполнения процессов;
блок management – настройки Spring actuator для получения метрик;
блок spring – настройки spring-приложения;
блок htm – настройки интеграции с компонентом UTSK;
блок grafana-config – настройки подключения к grafana;
блок available-zones – настройки зон работы приложения.

bpmx-gateway

блок auth — настройки аутентификации пользователя (рекомендуемые режимы и настройки описаны в документации компонента BPM User Plane продукта Platform V Flow);
блок persistence – настройки подключения к Kafka для хранения информации при обработке процессов (рекомендуемые параметры настройки);
блок hikari - настройки подключения к БД;
блок zookeeper - настройки подключения к Zookeeper;
блок engine – настройки для исполнения процессов;
блок management – настройки Spring actuator для формирования метрик мониторинга;
блок api – настройки для подключения к API;
блок spring – настройки spring-приложения;
блок tracing – настройки для подключения к сервису tracing;
блок audit – настройки для подключения к сервису аудита (рекомендуемые параметры настройки «Интеграция с компонентом Аудит (AUDT) Platform V Audit SE (AUD)»;
блок datasource – настройки для подключения к БД.
блок gateway - дополнительные настройки по работе сервиса.

bpmx-scheduler

блок persistence – настройки подключения к Kafka для хранения информации при обработке процессов (рекомендуемые параметры настройки);
блок management – настройки Spring actuator, необходимые для формирования метрик мониторинга;
блок spring – настройки spring-приложения.

К сценариям администрирования относятся все действия и настройки, указанные в этом разделе, а также просмотр журналов (logs) и метрик мониторинга.

Сценарий «Загрузка моделей процессов»#

Фабрики (потребители), работающие с компонентом BPMX, должны самостоятельно загружать (разворачивать) модели в BPMX.

Установка модели в среду исполнения реализуется с помощью Rest API. Для этого необходимо использовать метод:

POST /deployments

При параллельной установке версий 4.x и 5.x:

api для установки в версию 4.х: POST {хост}/user/v4/deployments/upload;

api для установки в версию 5.х: POST {хост}/system/v5/deployments.

API в формате OpenAPI представлены в Справочнике API.

Загрузка файлов с расширением bpmn на стенд возможна только с кодировкой UTF-8.

Сценарий «Управление конфигурацией»#

Настройка для хранения данных при исполнении процессов#

В BPMX для хранения данных при исполнении экземпляров процессов используется Kafka. Информация хранится в следующих topics Kafka:

bpmx-async-start – Job для запуска экземпляров процессов;
bpmx-retry-policy – информация о политиках повтора;
bpmx-processes – информация о процессах: атрибуты, xml-модели, изображения схем процессов;
bpmx-async-jobs – информация о Job для исполнения;
bpmx-processinstance-context – информация о контексте исполнения экземпляров процессов;
bpmx-scheduled-jobs – информация о таймерах/автоматических повторах шагов;
bpmx-eventsubscriptions – подписки экземпляров процессов на сообщения/сигналы.

При исполнении экземпляров процессов сервисы BPMX получают и записывают информацию в соответствующем topic.

Для сервисов BPMX (bpmx-engine,bpmx-gateway,bpmx-scheduler) в файле application.yml задаются настройки подключения к Kafka в блоке persistence:

persistence
- kafka
  - client-id – идентификатор клиента;
  - bootstrap-servers – список серверов Kafka-кластера;
  - ssl
    - key-password – пароль от приватного ключа;
    - key-store-location – путь к хранилищу сертификатов для Kafka;
    - key-store-password – пароль от хранилища сертификатов;
    - key-store-type – тип хранилища сертификатов;
    - trust-store-location – путь к хранилищу доверенных сертификатов для Kafka;
    - trust-store-password – пароль от хранилища доверенных сертификатов;
    - trust-store-type – тип хранилища доверенных сертификатов;
    - protocol – протокол безопасности (TLSv1.2, TLSv1.3);
    - security
      - protocol – протокол безопасности для соединения с Kafka-брокером;
    - listener
      - concurency – количество потоков;
    - producer
      - properties
        
        max.request.size – максимальное количество байтов в запросе;
        
        max.block.ms – время для аллокации сообщения в буфере (включая время для получения метаданных от брокера);
        
        delivery.timeout.ms – суммарное время ожидания отправки сообщения (включая время хранения сообщения в буфере, время подтверждения доставки от брокера);
        
        request.timeout.ms – время ожидания ответа на запрос от брокера;
        
        linger.ms– время задержки перед отправкой сообщений из буфера в topics Kafka;
    - consumer
      - groupId – указывает имя группы потребителей, к которой принадлежит потребитель Kafka;
      - auto-offset-reset – указывает, что делать, если в Kafka нет начального offset или если текущий offset больше не существует на сервере;
      - properties
        
        max.poll.interval.ms – максимально возможный интервал времени между запросами к серверу;
        
        session.timeout.ms – время жизни (TTL) сессии.

Также в блоке persistence доступны дополнительные настройки для topics Kafka:

name – название topic;
concurrency – количество потоков-обработчиков topic;
partitions – количество партиций topic;
replicationFactor – это количество копий данных через несколько брокеров;
consumer – настройки consumer topic (можно переопределить те, что уже заданы)
- autoOffsetReset – определяет, как consumer должен вести себя при потреблении из партиции topic, когда нет начального offset;
producer – настройки producer topic (можно переопределить те, что уже заданы)
- compressionType – тип сжатия данных topic;
topicConfig
- cleanup.policy: – политика очистки topic;
- min.cleanable.dirty.ratio – параметр определяет, как часто будет очищаться журнал (с записями из topic);
- min.insync.replicas – данные считаются закомиченными, когда они записываются во все синхронизированные реплики. Их количество настраивается в данном параметре.

Настройки для topics:

  asyncJobsTopic:
    name: bpmx-asyncjobs
    concurrency: 1
    partitions: 1
    replicationFactor: 1
    consumer:
      auto-offset-reset: latest
      properties:
        max.poll.interval.ms: 300000
        session.timeout.ms: 45000
    producer:
      compressionType: snappy
      properties:
        max.request.size: 1048576
        max.block.ms: 60000
        delivery.timeout.ms: 120000
        request.timeout.ms: 30000
        linger.ms: 0
    topicConfig:
      cleanup.policy: compact
      min.cleanable.dirty.ratio: 0.5
      min.insync.replicas: 1
  asyncStartsTopic:
    name: bpmx-asyncstart
    concurrency: 1
    partitions: 1
    replicationFactor: 1
    topicConfig:
      cleanup.policy: compact
      min.cleanable.dirty.ratio: 0.5
      min.insync.replicas: 1
  contextTopic:
    name: bpmx-instancecontexts
    concurrency: 1
    partitions: 1
    replicationFactor: 1
    consumer:
      autoOffsetReset: earliest
    topicConfig:
      cleanup.policy: compact
      min.cleanable.dirty.ratio: 0.5
      min.insync.replicas: 1
  eventSubscriptionsTopic:
    name: bpmx-eventsubscriptions
    concurrency: 1
    partitions: 1
    replicationFactor: 1
    consumer:
      autoOffsetReset: earliest
    topicConfig:
      cleanup.policy: compact
      min.cleanable.dirty.ratio: 0.5
      min.insync.replicas: 1
  scheduledJobsTopic:
    name: bpmx-scheduledjobs
    concurrency: 1
    partitions: 1
    replicationFactor: 1
    topicConfig:
      cleanup.policy: compact
      min.cleanable.dirty.ratio: 0.5
      min.insync.replicas: 1
  processDefinitionTopic:
    name: bpmx-process
    concurrency: 1
    partitions: 1
    replicationFactor: 1
    topicConfig:
      cleanup.policy: compact
      min.cleanable.dirty.ratio: 0.5
      min.insync.replicas: 1
  retryPolicyTopic:
    name: bpmx-retrypolicy
    concurrency: 1
    partitions: 1
    replicationFactor: 1
    topicConfig:
      cleanup.policy: compact
      min.cleanable.dirty.ratio: 0.5
      min.insync.replicas: 1

Важно! В настройках topics 'contextTopic', 'eventSubscriptionsTopic', 'scheduledJobsTopic', 'processDefinitionTopic', 'retryPolicyTopic' значение параметра 'cleanup.policy' обязательно должно быть равно 'compact'. В случае автоматического создания topics Kafka значения также установятся автоматически (не рекомендуется). Если topics Kafka создаются вручную, то параметр требуется указать самостоятельно.

Блок настроек BPMX#

Настройка асинхронного взаимодействия с компонентом TaskList (UTSK) продукта Platform V Flow (BPM)#

По умолчанию используется синхронное взаимодействие с компонентом UTSK. Существует возможность включить асинхронное взаимодействие в части API по операциям над пользовательскими задачами.

Для транспорта от BPMX к UTSK:

create – создание user task
abort – прерывание user task

Для транспорта от UTSK к BPMX:

complete – завершение user task
abort – прерывание user task

При создании задачи в асинхронном режиме со стороны BPMX отсутствует передача callback url инфо для операций complete, abort (abortCallback, completeCallback поля DTO соответственно). По этой причине переключение с асинхронного режима взаимодействия (kafka) на синхронный (HTTP) невозможно в штатном режиме.

Настройки работы асинхронного взаимодействия для указанных выше операций осуществляются через файл application.yml, блок engine.htm.async. Настройки присутствуют в сервисах bpmx-engine, bpmx-gateway.

Общие настройки асинхронного взаимодействия:

enabled – включение или выключение асинхронного взаимодействия с компонентом UTSK;
format – формат событий, доступны варианты "cloud-events-spec" или "none";
userTaskOutboundEventsTopic – topic исходящих событий в UTSK;
userTaskInboundEventsTopic – topic входящих событий от UTSK;
acceptedModuleIds – дополнительные модули, сообщения от которых будут приниматься (фильтрация работает при наличии параметра).

Блок kafka, настройки подключения к Kafka серверу:

engine:
  htm:
    async:
      enabled: false
      format: cloud-events-spec
      userTaskOutboundEventsTopic: toHtmUserTaskEvents
      userTaskInboundEventsTopic: fromHtmUserTaskEvents
      acceptedModuleIds: htm-app
      kafka:

При успешном завершении одной multitask и завершением всего подпроцесса по условию блок с данной UserTask подсвечивается как ошибочный. Это обусловлено тем, что остальные UserTask были прерваны с использованием метода abort.

Настройка отправки событий истории исполнения процесса#

Публикация событий может осуществляться по следующим каналам:

брокер сообщений Kafka;

Подробнее о публикуемых событиях в документе Руководство разработчика, «Публикация истории». Настройки для отправки событий присутствуют в сервисе bpmx-engine, в блоке engine.events

Настройки отправки событий в Kafka:

enableProcessModelEvents – включение/отключение отправки событий по моделям процессов;
enableProcessInstanceEvents – включение/отключение отправки событий по экземплярам процессов;
format – формат событий (none, cloud-events-spec, synapse-eda-spec);
processInstanceUpdateEventTopic – имя topic для событий обновления экземпляра процесса;
processModelUpdateEventTopic – имя topic для событий изменения модели;
source – источник события (в формате URI);
kafka.producer – параметры подключения к kafka брокеру:
- bootstrap-servers – список node kafka кластера (пример: localhost:9093,localhost:9193);
- client-id – идентификатор клиента, нужен для логирования на стороне брокера;
- retries – количество повторных попыток отправки сообщения в случае ошибки;
- buffer-memory – размер буфера отправки сообщений (байт);
- batch-size – размер пакета сообщений (байт);
- compression-type – тип сжатия (none, gzip, snappy, lz4, zstd);
- acks – необходимое количество подтверждений для успешной записи;
- ssl:
  - key-password – пароль от приватного ключа;
  - key-store-location – путь к хранилищу ключей;
  - key-store-password – пароль от хранилища;
  - key-store-type – тип хранилища (JKS, PKCS12, PEM);
  - trust-store-location – путь к доверенному хранилищу ключей;
  - trust-store-password – пароль от хранилища;
  - trust-store-type – тип хранилища (JKS, PKCS12, PEM);
  - protocol – протокол безопасности (TLSv1.2, TLSv1.3).
- security:
  - protocol – протокол взаимодействия с брокером (PLAINTEXT, SSL, SASL_PLAINTEXT, SASL_SSL).
- properties:
  - max.block.ms – время для аллокации сообщения в буфере (включая время для получения метаданных от брокера);
  - delivery.timeout.ms – суммарное время ожидания отправки сообщения, включая время хранения сообщения в буфере, время подтверждения доставки от брокера (должен быть не менее суммы параметров request.timeout.ms и linger.ms);
  - request.timeout.ms – время ожидания ответа на запрос от брокера;
  - linger.ms – время задержки перед отправкой сообщений из буфера в topics.

engine:
  events:
    enableProcessModelEvents: false
    enableProcessInstanceEvents: false
    format: none
    processInstanceUpdateEventTopic: process-instance-update-event
    processModelUpdateEventTopic: process-model-update-event
    source: bpms
    kafka:
      producer:
        bootstrap-servers: host1:9093, host2:9093
        client-id: bpms
        retries: 0
        buffer-memory: 1m
        batch-size: 16384
        compression-type: none
        acks: 1
        ssl:
          key-password: secret
          key-store-location: /path/to/key-store.jks
          key-store-password: secret
          key-store-type: JKS
          trust-store-location: /path/to/trusted-store.jks
          trust-store-password: secret
          trust-store-type: JKS
          protocol: TLSv1.2
        security:
          protocol: SSL
        properties:
          max.block.ms: 1000
          delivery.timeout.ms: 10000
          request.timeout.ms: 5000
          linger.ms: 1000

Далее будут описаны схемы событий, которые не меняются в зависимости от канала отправки сообщения.

Схема события при установке архива моделей процессов

Элемент	Описание
processId	Идентификатор процесса
processDefinitionId	Идентификатор модели процесса
resourceName	Должно быть использовано в случае мультитенантности
processName	Наименование модели процесса
processVersion	Внешняя (задаваемая в design time) версия модели процесса
processVersionInternal	Версия процесса в BPMX
businessFamily	Семейство процессов
ownerRole	Роль владельца процесса
created	Дата загрузки версии модели процесса
schema	Base64 encoded XML модель процесса (как получена при установке в BPMX)
bamProjectId	Идентификатор тенанта платформы
moduleId	Идентификатор BPMX, из которого генерируется событие
deleteReason	Причина удаления (при удалении пакета)
instancesSuspended	Статус процесса: 0 – приостановлен, 1 – активный
state	Статус модели процесса, 0 – снята с публикации, 1 – опубликована
suspended	Статус модели процесса, 0 – снята с публикации, 1 – опубликована

Схема события для экземпляров процессов

Поле	Описание*
id	Идентификатор экземпляра процесса
parentInstanceId	Идентификатор экземпляра родительского процесса
rootInstanceId	Идентификатор экземпляра корневого процесса
processId	Идентификатор типа процесса
processDefinitionId	Идентификатор модели процесса
resourceName	Должно быть использовано в случае мультитенантности
rootProcessId	Идентификатор родительского типа процесса
processName	Человекочитаемое имя процесса
startDate	Дата-время старта экземпляра процесса
endDate	Дата-время завершения экземпляра процесса
state	Статус экземпляра процесса
businessKey	Бизнес-ключ процесса
bamProjectId	Идентификатор тенанта платформы
extIds	Набор внешних идентификаторов экземпляра процесса, обычно используется для систем трассировки. Набор – пары «ключ-значение» (Map)
nodeInstances	Массив шагов экземпляра процесса
NodeInstance	Шаг экземпляра процесса
id	Идентификатор экземпляра шага экземпляра процесса
nodeId	Идентификатор шага в рамках контейнера (в текущей реализации равен nodeDefinitionId)
nodeDefinitionId	Идентификатор типа шага процесса
nodeName	Человеко-читаемое наименование экземпляра шага экземпляра процесса
nodeType	Тип шага процесса
triggerTime	Дата-время старта выполнения экземпляра шага
leaveTime	Дата-время завершения выполнения экземпляра шага
state	Статус шага
htmTaskId	Идентификатор пользовательской задачи в UTSK
error	Текст ошибки на шаге
retries	Массив с информацией о повторах шага
retry	Повтор
id	Идентификатор повтора
reason	Причина повтора
result	Результат повтора
time	Дата-время повтора
strategy	Стратегия выполнения retry (линейный\интервальный)
plannedDate	Плановая дата старта
factStartDate	Фактическая дата старта
factEndDate	Фактическая дата завершения
variables	Массив переменных экземпляра процесса
Error	В данном блоке хранится последняя ошибка исполнения экземпляра процесса
nodeId	Идентификатор шага
errorMessage	Текст ошибки

Информация, доступная о контексте процесса:

GlobalInstanceID – ID процесса (в формате UUID), который пользователи могут передавать со стартовым сообщением. Если GlobalInstanceID не задан явно, то он генерируется произвольно, также в формате UUID (BusinessKey не выводится в Контекст процесса, но фактически имеет то же значение, что и GlobalInstanceID);

FLOW_PID – служебное поле контекста (processInstanceID – идентификатор экземпляра процесса).

Настройки для отправки/получения сообщений по событиям в процессах#

Для поддержки исполнения событий-сообщений (catch-принимающих и throw-отправляющих) реализовано взаимодействие с брокером сообщений Kafka.

В части данного функционала один кластер BPMX работает только с одним кластером Kafka.

Описание и сценарии использования доступны в Руководстве разработчика, «Отправка/получение сообщений по событиям в процессах».

Данные настройки присутствуют в сервисах bpmx-engine, bpmx-gateway в блоке engine.messages.

В блоке engine.messages задаются следующие настройки для отправки/получения сообщений:

enabled – включение/отключение функционала взаимодействия с Kafka для отправки/получения сообщений по событиям (false*/true**);
format – формат конверта для отправляемых/получаемых сообщений. Возможные значения: cloud-events-spec**, synapse-eda-speс**, none*;
retry: параметры повторных запросов, если потребитель присылает сообщение раньше, чем активен соответствующий шаг;
- back-off-period – период между повторными запросами (200 ms*);
- max-attempts – количество попыток повторных запросов (15*);
source – источник событий для сообщений в Kafka (bpms*);
kafka:
- client-id – идентификатор клиента;
- bootstrap-servers – список серверов Kafka-кластера (пример: localhost:9093,localhost:9193);
ssl:
- key-password: пароль от приватного ключа;
- key-store-location – путь к хранилищу сертификатов для Kafka (file:///home/jboss/messages/keystore.jks);
- key-store-password – пароль от хранилища сертификатов;
- key-store-type – тип хранилища сертификатов (JKS*);
- trust-store-location – путь к хранилищу доверенных сертификатов для Kafka;
- trust-store-password – пароль от хранилища доверенных сертификатов;
- trust-store-type – тип хранилища доверенных сертификатов;
- protocol – протокол безопасности (TLSv1.2*, TLSv1.3**);
security:
- protocol – протокол безопасности для соединения с Kafka-брокером (SSL*);
producer:
- properties:
  - max.request.size: максимальное количество байтов в запросе (1048576*);
  - max.block.ms: время для аллокации сообщения в буфере (включая время для получения метаданных от брокера) (1000 ms*, 30000 ms**);
  - delivery.timeout.ms: суммарное время ожидания отправки сообщения (включая время хранения сообщения в буфере, время подтверждения доставки от брокера) (10000 ms*, 120000 ms**);
  - request.timeout.ms: время ожидания ответа на запрос от брокера (5000 ms*, 30000 ms**);
  - linger.ms: время задержки перед отправкой сообщений из буфера в topics Kafka (1000 ms*, 0 ms**);
consumer:
- properties:
  - max.poll.interval.ms: максимально возможный интервал времени между запросами к серверу (300000 ms*);
  - session.timeout.ms: время жизни (TTL) сессии (45000 ms*);
  - max.poll.records : максимальное количество записей для обработки за один вызов (500 *);

Для коректной работы важно чтобы значение engine.messages.kafka.consumer.properties.max.poll.interval.ms было больше чем engine.messages.kafka.consumer.properties.max.poll.records * engine.persistence.kafka.producer.properties.linger.ms

* – рекомендованное значение/значение по умолчанию;

** – возможное значение.

Описание генерации блока engine.messages.events приведено в Руководстве по установке, «Настройки для отправки/получения сообщений по событиям в процессах».

Пример блока с настройками:

engine:
  messages:
    enabled: false
    format: none
    retry:
      back-off-period: 200
      max-attempts: 3
    source: bpms
    kafka:
      client-id: bpms
      bootstrap-servers: server1:9093, server2:9093
    ssl:
      key-password: secret
      key-store-location: /path/to/key-store.jks
      key-store-password: secret
      key-store-type: JKS
      trust-store-location: /path/to/trusted-store.jks
      trust-store-password: secret
      trust-store-type: JKS
      protocol: TLSv1.2
  security:
    protocol: PLAINTEXT
  producer:
    properties:
      max.request.size: 1048576
      max.block.ms: 1000
      delivery.timeout.ms: 10000
      request.timeout.ms: 5000
      linger.ms: 1000
  consumer:
    properties:
      max.poll.interval.ms: 300000
      session.timeout.ms: 45000
      max.poll.records: 500

Для принимающих событий в конфигурации обязательно добавлять настройки topics Kafka и consumer group.

Для отправляющих событий настройка topic Kafka является опциональной, по умолчанию название сообщения является topic Kafka. Эти настройки добавляются в блок engine.messages.events.

Возможные форматы сообщений, отправляемых в Kafka:

cloud-events;
synapse.

Подробнее примеры отправляемых сообщений в конверте CloudEvent и Synapse описаны в Руководстве прикладного разработчика, раздел «Сценарии использования».

Пример блока с настройками:

engine: 
  messages:
    events:
      firstProcessId: // Идентификатор модели процесса
        firstMessage: // Имя сообщения
          topic: testMessageTopic // Имя очереди
          consumerGroup: testConsummerGroup // вводится при необходимости
          concurrency: 1 //значение по умолчанию, вводится при необходимости
        secondMessage:
          topic: testMessageTopic // Второе имя сообщения
          consumerGroup: testConsummerGroup // вводится при необходимости
      secondProcessId: // Идентификатор модели процесса (при необходимости)
        firstMessage: // Имя сообщения (при необходимости)
          topic: testMessageTopic // Имя очереди (при необходимости)
          consumerGroup: testConsummerGroup // вводится при необходимости

Для генерации блока engine.messages.events добавлена переменная:

bpmx.sberflow-engine.ose.configmap.application.engine.messages.events.processes_map

Пример заполнения переменной:

Процессы разделяются по ";"
ID процесса и его сообщения по "!" (так как количество сообщений - произвольное)
Сообщения одного процесса разделяются по "&"
Параметры сообщения (имя, топик, группа консьюммера, concurrency) - разделяются по ":"

firstProcessId!firstMessage:testMessageTopic1:testConsummerGroup1:1;
secondProcessId!firstMessage:testMessageTopic2:testConsummerGroup2&secondMessage:testMessageTopic3:testConsummerGroup3"

Необходимо обязательно указывать в настройках ID процесса и название сообщения, для которых задаются настройки

Для корректной работы функционала (защиты от дублей) необходимо совместное использование идемпотентного старта (см. Раздел "Настройки идемпотентного старта")

Настройка белых списков разрешенных классов/методов в скриптах внутри моделей процессов#

Данные настройки присутствуют в сервисе bpmx-engine в блоке engine.scriptengine.

В файле конфигурации application.yml в блоке engine.scriptengine должны быть настроены следующие переменные:

engine.scriptengine.enableScriptSandbox – включение исполнения скриптов через исполнения скриптов sberflow-script-sandbox;
engine.scriptengine.enableSecurityScriptTask – включение безопасного исполнения скриптов;
engine.scriptengine.whitelistPaths – путь к файлу, содержащему перечень методов/классов, которые могут использоваться в действиях типа Выполнение сценария.

engine:
  scriptengine:
    enableScriptSandbox: true
    enableSecurityScriptTask: true
    whitelistPaths: 
      - "classpath:whitelists/generic-whitelist"

При использовании безопасного исполнения скриптов:

для скриптов на Groovy применяются ограничения на использование методов/функций согласно разрешенному белому списку (все, что не указано в whitelist запрещено для использования);
запрещены методы/классы, указанные ниже (даже при добавлении соответствующих сигнатур в whitelist данные методы/классы нельзя будет исполнить):
- "method java.lang.Runtime exit int";
- "method java.lang.Runtime halt int";
- "staticMethod java.lang.System exit int";
- "new org.kohsuke.groovy.sandbox.impl.Checker$SuperConstructorWrapper java.lang.Object[]";
- "new org.kohsuke.groovy.sandbox.impl.Checker$ThisConstructorWrapper java.lang.Object[]".
- для скриптов на JavaScript будет недоступен вызов Java при исполнении.

Примеры содержимого файла whitelist#

Конструкторы (с параметром и без):

new java.util.ArrayList java.util.Collection  
new groovy.json.JsonBuilder 

Статические методы (с параметром и без):

staticMethod java.util.Arrays asList java.lang.Object[]  
staticMethod java.util.Arrays toString java.lang.Object[]  
staticMethod java.util.Base64 getDecoder  
staticMethod java.util.Base64 getEncoder

Методы (с параметром и без):

method java.lang.Object equals java.lang.Object
method java.io.Reader read

Статическое поле:

staticField java.lang.Integer MAX_VALUE

Если в методе или конструкторе более одного параметра, тогда их типы перечисляются через пробел:

method java.io.Reader read char[] int int
new java.lang.Enum java.lang.String int

Настройка ограничения исполнения пользовательских скриптов#

Ограничение времени исполнения пользовательских скриптов производится в блоке engine.scriptengine:

engine.scriptengine.executeInSeparateThread – включение исполнения скрипт-таски в отдельном потоке. По умолчанию: false;
engine.scriptengine.timeout – тайм-аут исполнения скрипта-таски, после которого произойдет ее прерывание (выполнится только в случае, если engine.scriptengine.executeInSeparateThread=true). По умолчанию 10000.

engine:
  scriptengine:
    executeInSeparateThread: false
    timeout: 10000

Настройки персистирования#

Точки персистирования – это точки сохранения информации для внутреннего использования BPMX (сохраняется текущее состояние процесса (execution)).

Список возможных точек персистирования:

START_EVENT(StartEvent);
END_EVENT(EndEvent);
SERVICE_TASK(ServiceTask);
SCRIPT_TASK(ScriptTask);
USER_TASK(UserTask);
CATCH_EVENT(IntermediateCatchEvent) – промежуточное событие-перехватчик (шаг процесса для которого необходим определенный триггер);
RECEIVE_TASK(ReceiveTask);
DEACTIVATE(Deactivate) – выключение точек персистирования.

Настройки персистирования в BPMX присутствуют в сервисе bpmx-engine в блоке engine:

persistPoints – перечисление точек персистирования для шагов бизнес-процессов (для отключения необходимо указать Deactivate).

Пример:

persistPoints: 'StartEvent,UserTask,IntermediateCatchEvent,ReceiveTask,ServiceTask'

Выполнение конкретного экземпляра процесса не может быть приостановлено на шагах с типом:

scriptTask;
gateway;
manualTask;

Настройка времени нахождения экземпляра процесса в статусе "Инцидент"#

Если в процессе выполнения шага процесса после срабатывания политик повтора (если таковые были настроены) в экземпляре процесса произошла ошибка, то он переходит в статус Инцидент для возможности вручную перезапустить экземпляр процесса из панели для администрирования.

Время нахождения экземпляра процесса в этом статусе определяется настройкой deadLetterJobExpirationTimeSeconds.

deadLetterJobExpirationTimeSeconds: 2592000

Значение параметра по умолчанию – 1 месяц (30 дней).

Настройка префикса для идентификатора экземпляра процесса#

Параметр pidPrefix в конфигурации BPMX позволяет задать префикс для processinstanceid.

Значение параметра по умолчанию не задается. В качестве значения pidPrefix можно использовать значение standId. Для этого в файле bpmx-engine.conf необходимо указать:

bpmx-engine.ose.configmap.application.engine.pidPrefix={{ lookup('custom_vars', 'bpmx.ose.common.stand.id') }

При ручной настройке параметра необходимо внести изменения в файл application.yml (файлы template bpmx-gateway-config.yaml и bpmx-engine-config.yaml) для двух модулей: bpmx-gateway, bpmx-engine.

Ограничения:

Длина значения pidPrefix не более 218 символов.
В случае превышения допустимого значения в 218 символов pod стартовать не будет.

Пример блока с настройками:

engine:
  pidPrefix: myfavprefix

При такой конфигурации PID в БД будет выглядеть, например, как "myfavprefix_6F9619FF-8B86-D011-B42D-00CF4FC964FF".

Настройка автоматических повторов для REST, JSON-RPC и User Tasks#

Функция автоматических повторов применима для REST Tasks, JSON-RPC Tasks и User Tasks.

Функция автоматических повторов будет выполняться перед политиками повторных вызовов, настроенных вручную.

Для User Tasks функция автоматических повторов будет работать только для запроса прерывания пользовательской задачи.

Настройка функции автоматических повторов производится в блоке engine.http.retry.stateless:

engine.http.retry.stateless.maxAttempts – количество повторных вызовов;
engine.http.retry.stateless.minBackOffMills – начальный интервал повтора. Каждый последующий интервал повтора равен: начальный интервал * 2 ^ (номер повтора);
engine.http.retry.stateless.httpCodesToRetry – список HTTP кодов, при которых будут выполнены повторные вызовы.

engine:
  http:
    retry:
      maxAttempts: 3
      minBackOffMills: 300
      httpCodesToRetry: 429, 502, 503, 504

Настройка интервала планировщика, отвечающего за приостановку и возобновление экземпляров#

Планировщик необходим для простановки соответствующих статусов экземпляров процессов в случае приостановки/активации процесса.

Настройка интервала планировщика, отвечающего за приостановку и возобновление экземпляров, производится в блоке engine.:

engine.suspend.instances.scheduler.interval – интервал времени в формате ISO8601, через который будет производиться поиск и приостановка/возобновления экземпляров процессов. По умолчанию: PT5S.

Настройка spring actuator#

Блок Management содержит настройки spring actuator, необходимые для формирования метрик мониторинга. Данные настройки присутствуют в сервисах bpmx-engine, bpmx-gateway, bpmx-scheduler в блоке mamagement.

Для настройки доступа к данным spring actuator необходимо указать порт, на котором будут доступны данные: server.port 8888. А также список endpoint, по которым необходимо получать данные.

endpoint	Описание
auditevents	Предоставляет информацию о событиях аудита для текущего приложения. Требуется bean AuditEventRepository
beans	Отображает полный список всех компонентов Spring в приложении
caches	Открывает доступные cache
conditions	Показывает условия, которые были созданы для классов конфигурации и авто-конфигурации, а также причины, по которым они совпадают или не совпадают
configprops	Отображает упорядоченный список @ConfigurationProperties
env	Показывает свойства от Spring's ConfigurableEnvironment
health	Показывает информацию о состоянии приложения
httptrace	Отображает информацию HTTP-трассировки (по умолчанию последние 100 обменов HTTP-запросом-ответом). Требуется bean HttpTraceRepository
info	Отображает произвольную информацию о приложении
integrationgraph	Показывает график интеграции Spring. Требуется зависимость от spring-integration-core
loggers	Показывает и изменяет конфигурацию logger в приложении
liquibase	Показывает все примененные миграции базы данных Liquibase. Требуется один или несколько компонентов Liquibase beans
metrics	Показывает информацию «метрики» для текущего приложения (список метрик приведен ниже)
mappings	Отображает упорядоченный список всех @RequestMapping путей
scheduledtasks	Отображает запланированные задачи в приложении
sessions	Позволяет получать и удалять пользовательские сеансы из хранилища сеансов Spring Session. Требуется веб-приложение на основе servlets, использующее Spring Session
shutdown	Позволяет корректно завершить работу приложения. По умолчанию отключено
startup	Показывает данные о шагах запуска, собранные платформой ApplicationStartup. SpringApplication требуется, чтобы был настроен файл BufferingApplicationStartup
threaddump	Выполняет дамп потока
heapdump	Возвращает hprof дамп файл
logfile	Возвращает содержимое файла журнала (если установлены свойства logging.file.name или logging.file.path). Поддерживает использование Range заголовка HTTP для получения части содержимого файла журнала
prometheus	Предоставляет метрики в формате, который может быть извлечен сервером Prometheus. Требуется зависимость от micrometer-registry-prometheus

Настройка Prometheus/Объединенный мониторинг Unimon (MONA) Platform V Monitor (OPM)#

Настройка производится в блоке management.

Пример:

management:
  server: 
    port: 8088 
  endpoints:
    enabled-by-default: false
    web.exposure.include: health,metrics,threaddump,prometheus
  endpoint:
    metrics.enabled: true
    health:
      enabled: true
      show-details: always
    threaddump.enabled: true
    prometheus.enabled: true

Для подключения компонента MONA требуется указание дополнительных аннотаций в service.

prometheus.io.path	/actuator/prometheus
prometheus.io.port	8088
prometheus.io.scrape	true

Список метрик доступен в разделе «События мониторинга».

Настройка spring-части системы#

Настройки присутствуют в файле конфигурации application.yml в сервисах bpmx-engine, bpmx-gateway, bpmx-scheduler в блоке spring.

Должны быть настроены следующие переменные:

spring
- main
  - allow-bean-definition-overriding: true
- cloud
  - config
    - enabled: false – выключение конфигурации через cloud config server (т.е. все настройки будут взяты из текущего файла);
- application
  - name – наименование сервиса.

Пример:

spring:
  main:
    allow-bean-definition-overriding: true
  cloud:
    config:
      enabled: false
  application:
    name: bpmx-engine

Настройка интеграции с компонентом UTSK#

Настройка подключения к стенду UTSK присутствует в файле конфигурации application.yml в сервисе bpmx-engine в блоке htm.

Для конфигурирования доступны следующие параметры:

htm
- engineBalancerHost – url балансировщика BPMX;
- app
  - url – url основного приложения управления задачами пользователя (UTSK);

Пример:

htm:
  engineBalancerHost: 'https://XXXX.XX'
  app:
    url: 'http://XXXX.XX/htm-portal'

Настройка трассировки#

Структура идентификаторов OpenTracing (трассировка — процесс пошагового выполнения программы) должна позволять отслеживать информацию по бизнес-процессам, исполняемым в среде исполнения BPMX. Информация должна позволять понять, в рамках исполнения какого процесса и на каком шаге был сделан тот или иной удаленный вызов. Для обеспечения такой возможности стандартизирована трансляция определенных HTTP заголовков из входящих запросов в среду исполнения BPMX во все исходящие вызовы, реализованные с помощью поддерживаемых протоколов интеграции. Заголовки трассировки будут сгруппированы в переменной контекста tracingHeaders.

Поддерживается транслирование заголовков в следующие типы взаимодействий:

REST API;
JSON-RPC API.

Настройки работы Tracing осуществляются через файл application.yml в сервисе bpmx-gateway, блок tracing.

Общие настройки для работы трассировки:

tracing
- enabled – включение/выключение трассировки;
- url – URL Tracing-коллектора;
- name – наименование элемента трассировки;
- spanKind – вид интервала (span);
- responseSuccessCode – код успешного ответа от сервера;
- apiVersion – версия API системы трассировки;
- threadCount – размер пула потоков для отправки сообщений трассировки.

Настройки фильтрации заголовков:

useUFSHeaders – использование заголовков ufs-*;
useMTHeaders – использование заголовков x-mt-*;
useBaseHeaders – использование заголовков x-*;
useX3Headers – использование заголовков x-b3-*;

Пример:

tracing:
  enabled: true
  enableTraceIncomingRequests: true
  url: http://some-host:8080/
  name: BPMS
  spanKind: CLIENT
  responseSuccessCode: 202
  apiVersion: 2
  threadCount: 20
  useUFSHeaders: true
  useMTHeaders: true
  useBaseHeaders: true
  useX3Headers: true

Транслируемые заголовки#

Группа заголовков	Заголовки HTTP	Описание
OpenTracing	x-request-id; x-b3-traceid; x-b3-spanid; x-b3-parentspanid; x-b3-sampled; x-b3-flags; x-ot-span-context	Заголовки OpenTracing передаются в исходящие вызовы REST, JSON-RPC 2.0
CorePlatform	x-request-chain-id; x-mt-request-chain-depth; x-mt-session-id; x-mt-login; x-mt-source-system-id; ufs-client-id; ufs-business-id; ufs-user-login; ufs-forward-sid	Заголовки CorePlatform передаются в исходящие вызовы REST, JSON-RPC 2.0 без изменений их названий и содержимого

Блок настроек Gateway#

Данные параметры доступны для настройки в сервисе Gateway компонента BPMX, блок настроек gateway.

Настройки идемпотентности#

При запуске нового экземпляра процесса пользователь может указать ключ идемпотентности. Если повторно произвести запуск экземпляра процесса в течение определенного времени с тем же ключом идемпотентности, то повторный запуск не производится, пользователю возвращается идентификатор уже запущенного ранее экземпляра процесса. Указанный определенный период времени называется окном идемпотентности и задается в настройках следующим образом:

gateway.idempotence.windowMs – время окна идемпотентности (в миллисекундах). Если требуется изменить окно идемпотентности, то необходимо расширить значение.

Траблшутинг идемпотентного старта#

Если стартовали два разных процесса с одним и тем же ключом:
- проверьте значение окна идемпотентности и дату старта экземпляров процесса. Возможно, необходимо увеличить окно идемпотентности.

Настройки при переходе процессов из версии 4.х на 5.х#

В связи с тем, что невозможно обеспечить обратную совместимость для версии BPMX 5.х и предыдущих версий BPMX, то для перехода процессов на новую версию необходимо ставить 2 версии BPMX параллельно.

Вариант установки – в одну проектную область (NameSpace) с одним набором Ingress/Egress и разделением трафика через rout и Gateway Service (стоит в версии 5.Х).

Для настройки доступны:

параметры запуска экземпляров процессов,
параметры подключения к BPMX версии 4.х.

Параметры запуска экземпляров процессов:

canary
- enabled - включение блока настроек (true/false);
- defaultVersion- версия для запуска экземпляров процессов по умолчанию (4/5);
- exclusion - список идентификаторов процессов-исключений (будут запускаться в версии, отличной от версии для запуска по умолчанию). Идентификаторы необходимо указывать через запятую.

Рекомендации:

Если модели процессов еще не установлены в версию 5.х, то необходимо указать версию для запуска по умолчанию – 4.

Если все модели процессов уже установлены в версию 5.х, то необходимо указать версию для запуска по умолчанию – 5.

Если часть моделей еще не установлена в версию 5.х (или не надо запускать в версии 5.х), то необходимо указать версию для запуска по умолчанию – 5, а в списке исключений указать идентификаторы процессов, которые еще не установлены в 5.х (или наоборот, например, в зависимости от того, каких процессов больше – установленных в 5.х или 4.х).

Параметры подключения к BPMX версии 4.х:

engine4g
- url – это url сервиса engine;
- datasource – блок настроек для подключения к БД BPMX версии 4.х;
  - driverClassName – имя класса драйвера для подключения к БД;
  - idleTimeout – максимальное время бездействия, по истечении этого времени соединение будет автоматически прервано (мс);
  - jdbcUrl – адрес подключения к БД;
  - maximumPoolSize – максимальное количество соединений в пуле;
  - minimumIdle – минимальное количество незанятых соединений пула;
  - username – имя пользователя;
  - maxLifetime – максимальное время жизни подключения (мс);
  - leakDetectionThreshold – время, в течение которого соединение может быть вне пула, прежде чем будет зарегистрировано сообщение, указывающее на возможную утечку соединения (мс);
  - connectionTimeout – максимальное количество миллисекунд, в течение которых клиент будет ожидать подключения из пула.

Алгоритм маршрутизации запросов:

BPMX1 – компонент BPMX версии 4.x

BPMX2 – компонент BPMX версии 5.x

Входящий запрос поступает на Ingress. На нем реализована следующая маршрутизация:

Если в URL запроса версия API V5, то запрос направляется в BPMX2.
Если в URL запроса версия API V4 И используется SYSTEM API, то запрос направляется в BPMX2.
Если в URL запроса версия V4 И используется USER API, то запрос направляется в BPMX1.
Если используется BPMU (DataIndex) API, то запрос направляется в BPMX2.

Поступивший запрос в BPMX2 обрабатывается Gateway Service. На нем установлены следующие дополнительные правила маршрутизации запросов:

Если это метод для запуска экземпляра процесса, то Gateway Service по идентификатору процесса в настройках сервиса (блок gateway.canary) получает информацию о версии BPMX, в которой необходимо осуществлять запуск. Либо запускает в версии 5.x, либо маршрутизирует на версию 4.x (url в настройке gateway.engine4g.url).
Если это метод отправки сообщения в экземпляр процесса, то Gateway Service проверяет в базе для BPMX1 (таблица bpmxexecutionentityimpl) наличие экземпляра процесса в BPMX1. Если экземпляр есть в BPMX1, то запрос маршрутизируется в BPMX1 (url в настройке gateway.engine4g.url), иначе обрабатывается в BPMX2.
Если это метод получения информации об экземпляре процесса (GET /instances/{instanceId}), то Gateway Service маршрутизирует запрос в BPMX1 (url в настройке gateway.engine4g.url) и получает ответ. Если ответ не 200 (ОК), то запрос обрабатывается в BPMX2, иначе возвращается полученный ответ.
Если это метод отправки сигнала, то запрос маршрутизируется в BPMX1 (url в настройке gateway.engine4g.url) и обрабатывается в BPMX2.
Если метод GET /signals/{signalName}/readyCount или GET /signals/{signalName}/listReady, то запрос маршрутизируется в BPMX1 (url в настройке gateway.engine4g.url) и обрабатывается в BPMX2.
Если метод POST /usertasks/notifycomplete или POST /usertasks/notifyabort, то Gateway Service проверяет в базе для BPMX1 (таблица bpmxtaskentityimpl) наличие соответствующей пользовательской задачи в BPMX1. Если задача есть, то запрос маршрутизируется в BPMX1 (url в настройке gateway.engine4g.url), иначе обрабатывается в BPMX2.
Остальные запросы, поступившие в BPMX2, обрабатываются в BPMX2.

В поставке предоставляются рекомендуемые значения настроек.

Пример настройки блока gateway:

gateway:
  idempotence.windowMs: 3600000
  canary:
    enabled: true
    defaultVersion: 5
    exclusion: process1,process2,process3
    engine4g:
      url: 'http:\\localhost:8080'
      datasource:
        hikari:
          driverClassName: org.postgresql.Driver
          idleTimeout: 30000
          jdbcUrl: jdbc:postgresql://....
          maximumPoolSize: 100
          minimumIdle: 10
          username: bpmx_ose
          maxLifetime: 1800000
          leakDetectionThreshold: 120000
          connectionTimeout: 11000

Настройка подключения к компоненту BPMU#

Настройки работы с компонентом BPMU осуществляется через настройку взаимодействия с сервисом bpmu-data-index: в файле application.yml в сервисе bpmx-gateway, блок dataindex.

Параметры:

dataindex
- url – адрес сервиса bpmu-data-index.

Настройка дросселирования нагрузки#

Дросселирование нагрузки – это принудительное ограничение работы приложения, применяемое для защиты от чрезмерной нагрузки и потери данных.

Для настройки дросселирования нагрузки в BPMX необходимо настроить следующие параметры в файле application.yml блок engine:

engine.startProcessRateLimit.tps— максимальное количество процессов, запускаемых в секунду на одном pod.
engine.asyncJobRateLimit.tps— максимальное количество AsyncJobs, запускаемых в секунду на одном pod.

Пример:

engine:
  deadLetterJobExpirationTimeSeconds: 2592000
  deadLetterScannerIntervalInSeconds: 300
  alwaysAcknowledge: false
  startProcessRateLimit.tps: 20

Параметр startProcessRateLimit.tps необходим для ограничения скорости вычитывания сообщений из topic bpmx-asyncstart. Минимальное значение вычисляется по формуле: (persistence.asyncStartsTopic.concurrency * persistence.asyncStartsTopic.consumer.properties.max.poll.records * 2 ) / (persistence.kafka.consumer.properties.max.poll.interval.ms / 1000)

Параметр asyncJobRateLimit.tps необходим для ограничения скорости вычитывания сообщений из topic bpmx-asyncjob. Минимальное значение вычисляется по формуле: (persistence.asyncJobsTopic.concurrency * persistence.asyncJobsTopic.consumer.properties.max.poll.records * 2 ) / (persistence.kafka.consumer.properties.max.poll.interval.ms / 1000)

Настройка лимитирования объема данных#

Под лимитированием объема данных понимается возможность задать ограничение на размер системных и бизнес данных экземпляра процесса, занимаемых в хранилище. Настройка лимитирования не является обязательной, но рекомендуемой, так как позволяет обеспечить более стабильный уровень обслуживания.

Вводятся понятия hard limit и soft limit.

Soft limit – ограничение на размер объема данных экземпляра процесса (рекомендуемое), при превышении которого будет отброшено предупреждение в лог-записи.

Hard limit – ограничение на размер объема данных экземпляра процесса (максимум), при превышении которого исполнение процесса будет приостановлено с ошибкой и контекст процесса сохранен не будет.

Параметры конфигурации#

По умолчанию параметры конфигурации, отвечающие за лимитирование не заданы. Рекомендуется провести нагрузочное тестирование исполнения моделей процесса перед настройками конфигурации для определения допустимых значений hard limit и soft limit. Затем полученные значения в байтах внести в следующие параметры в конфигурации приложения bpmx-engine (bpmx-engine.conf):

engine.instanceContextSize.hardLimitBytes
engine.instanceContextSize.softLimitBytes

и следующий параметр приложения bpmx-gateway (bpmx-gateway.conf):

gateway.apiPayloadSize.limitBytes

Описание параметров конфигурации#

Название параметра	Описание	Поведение системы
engine.instanceContextSize.softLimitBytes	Рекомендуемое ограничение на размер объема данных экземпляра процесса	Отбросить в лог-записи сообщение уровня WARN, сохранить данные по экземпляру и продолжить его исполнение
engine.instanceContextSize.hardLimitBytes	Максимальное ограничение на размер объема данных экземпляра процесса	Отбросить в лог-записи сообщение уровня ERROR, не сохранять данные по экземпляру и остановить его исполнение со статусом "Прерван"
gateway.apiPayloadSize.limitBytes	Максимальное ограничение на размер payload, отправляемый в API при обращении к bpmx-gateway	Ответить ошибкой 413 Payload too large, исполнение экземпляра не приостанавливать

Пример сообщений в лог-файлах можно посмотреть в разделе "События системного журнала". Также, помимо логирования превышения ограничений, осуществляется мониторинг объема данных экземпляра при исполнении и при превышении лимитов. Метрики и их описание доступны в разделе "События мониторинга".

Примечание

В случае, если экземпляр процесса стартует по сообщению из внешней системы и на это сообщение будет передан payload, превышающий лимит, допустимо прерывание исполнения экземпляра процесса на первом шаге после стартового.
Ограничения на payload, задаваемые на bpmx-gateway, отрабатывают только при использовании bpmx-engine версии 5.х. Для приложений более ранних версий функциональность лимитирования недоступна.

Настройка количества экземпляров процессов для массовых операций#

В рамках исполнения операции прерывания или повтора шагов с ошибкой экземпляров процессов предусмотрено задание лимита количества инстансов при массовых операциях.

Название параметра	Описание
bpmx-gateway.ose.configmap.gateway.bulkOperations.countLimit	Рекомендуемое ограничение на максимальное количество экземпляров процессов, для которых может быть запланирована операция повтора или прерывания

Использование компонента#

Доставка моделей процессов#

Общая схема#

delivery of process models

На схеме выше описан путь доставки моделей процессов до BPMX в зависимости от этапа непрерывной поставки модели на стенд. BPM – централизованный сервис BPMX, в котором исполняются процессы, доставленные от разных потребителей по описанному пути.

Формат поставки#

Плоский zip архив с XML моделями процесса.

Для поставки дистрибутива в платформу архив с моделями должен находиться в каталоге <other/bpmModels.zip>.

Варианты импорта моделей процессов#

Импорт через компонент BPMU#

Есть два возможных сценария:

Импорт модели с использованием графического интерфейса компонента BPMU.
Импорт модели с использованием CURL через GraphQL.

Оба сценария описаны в Руководстве администратора компонента BPMU.

Импорт с помощью CURL через /system namespace (для загрузки архива)#

Также существует возможность импорта модели с использованием приложения BPMX-Gateway.

Необходимо выполнить запрос к BPMX-Gateway:

POST http://укажите URL bpmx-gateway/system/v5/deployments

Необходимо указать следующие параметры в запросе в виде form-data:

–form 'file=@"…/archivename.zip"' (полный путь до архива)

В данном случае Endpoint указывается в самом запросе.

Интеграция с внешними системами#

Интеграция с компонентом Аудит (AUDT) Platform V Audit SE (AUD)#

В связи с требованиями безопасности рекомендуется осуществлять передачу информации о произведенных действиях в компонент AUDT.

Журнал регистрации событий, отправляемых в компонент Аудит, хранится в компоненте AUDT.

В файле конфигурации application.yml в сервисе bpmx-gateway в блоке audit представлены настройки подключения к аудиту:

Название	Описание	Значение
audit.enabled	Разрешить запись в компонент AUDT	true
audit.proxyUri	Идентификатор прокси-сервера AUDT	https://proxyhost:8443
audit.proxyVersion	Версия протокола взаимодействия	v1
audit.openApiVersion	Источник для определения версии метамодели	v4
audit.ssl.enabled	Разрешить ssl соединение	true
audit.ssl.keystore.location	Расположение keystore	/opt/keystore.jks
audit.ssl.keystore.password	Пароль для keystore	***
audit.ssl.truststore.location	Расположение truststore	/opt/truststore.jks
audit.ssl.truststore.password	Пароль для truststore	***
audit.ssl.keyPassword	Пароль закрытого ключа	***

Взаимодействие производится через Rest API.

Среда исполнения осуществляет отправку следующих данных для фиксации события в компоненте AUDT:

Метамодель;
Событие.

Вызываемое API:

Регистрация метамодели
- $audit_URL/v1/metamodel.
Отправка события:
- $audit_URL/v1/event.

Интеграция с компонентом Журналирование (LOGA) Platform V Monitor (OPM)#

Протоколирование операций для их дальнейшего анализа осуществляется в следующую директорию:

-DloggingDir = home/logs
-DloggingJSONFile = log.json

Для отправки событий журнала в sidecar компонента LOGA контейнер должен быть подключен к тому же каталогу, что обеспечит ему возможность чтения и обработки событий.

Для корректного разбора событий необходимо, чтобы формат событий соответствовал шаблону разбора fluent-bit. Формат событий описан в xml-файле конфигурации для библиотеки logback-spring.xml.

logback-spring.xml содержит дополнительные атрибуты:

traceId – идентификатор trace, с которым связан log (тип строка), получение из заголовка x-b3-traceid.

Запись (log) производится в json формате.

Информация по изменению уровня логирования указана в документе Руководство по установке, «Изменение уровня логирования».

Управление потоками данных (фильтрация)#

При необходимости включения фильтрации переменных контекста в события Kafka, вычитываемые в целях бизнес-мониторинга, необходимо включить фильтрацию с помощью настройки bpmx-engine.ose.configmap.application.engine.events.filtered.enabled и задать конфигурацию подключения к Kafka из блока bpmx-engine.ose.configmap.application.engine.events.filtered.

В случае включения признака фильтрации запись в настроенные topics будет осуществляться по следующим правилам:

Если при проектировании модели разработчик процесса не поставил признак наличия доступа к контексту в компоненте BPMD (чек-бокс Доступ к просмотру контекста в окне настройки процесса), то отправка данных в фильтрованный topic будет осуществляться без контекста ("variables": {}). По умолчанию для всех моделей применяется этот механизм.
Если признак доступа к контексту проставлен, то маскирование осуществляется согласно тегу masked: значения ключей, помеченных тегом masked, полностью скрывается символом *. Количество звездочек равно длине значения. В случае, если ключ - объект или массив, он целиком скрывается одним символом *.

Настройка контроля businessFamily при загрузке моделей процессов#

Для включения валидации заполненности атрибута businessFamily в загружаемой модели необходимо выставить параметр bpmx-gateway.ose.configmap.application.deployer.validation.businessFamily.enabled в значение true, а в параметре bpmx-gateway.ose.configmap.application.deployer.validation.businessFamily.pattern указать регулярное выражение, соответствие которому будет проверяться для businessFamily.

В случае, если при включенном признаке в загружаемой модели не указан businessFamily, либо он не соответствует паттерну, при загрузке будет выведена ошибка.

События системного журнала#

Все события, собираемые компонентом во время работы, публикуются в компоненте LOGA, далее по тексту – Журналирование.

Настройки интеграции с компонентом описаны в разделе «Интеграция с внешними системами».

События регистрируются в формате json. Журнал регистрации событий располагается в АРМ сервиса LOGA. Местоположение АРМ сервиса Журналирования необходимо уточнять у администраторов сред.

Регистрируются события уровней:

TRACE – менее приоритетные записи (logs) для отладки, с наименьшим уровнем логирования;
DEBUG – записи (logs), необходимые для отладки приложения. Для уверенности в том, что приложение делает именно то, что от нее ожидают, или описания действия приложения;
INFO – записи (logs), которые записывают важные действия в приложении. Это не ошибки, это не предостережение, это ожидаемые действия приложения;
WARN – обозначаются записи (logs), которые содержат предостережение. Произошло неожиданное действие, несмотря на это приложение устояло и выполнило запрос;
ERROR – уровень ошибок, когда есть проблемы, которые нужно решить. Ошибка не останавливает работу приложения в целом. Остальные запросы могут работать корректно;
FATAL – ошибка, после которой приложение уже не сможет работать и будет остановлено.

События уровней Trace и Debug не рекомендуется включать в ПРОМ среде.

Перечень событий

Уровень		Текст/шаблон сообщения	Перевод
ERROR	bpmx-engine	Unknown process instance state	Неизвестное состояние экземпляра процесса
ERROR	bpmx-engine	Exception in PID={} while executing {} : {}	Ошибка в в PID={} во время выполнения {} : {}
ERROR	bpmx-engine	ProcessInstance with PID={}, errorCode={} has been already error propagated	Экземпляр процесса с PID={}, код ошибки={} уже был запущен с ошибкой
ERROR	bpmx-engine	Error with exception message: {} \n PID: {} , GPID: {}	Ошибка с сообщением об ошибке: {} \n PID: {} , GPID: {}
ERROR	bpmx-engine	Error in error propagation. Max nesting level has been exceeded PDKey {} PID {}	Ошибка в распространении ошибок. Превышен максимальный уровень вложенности PD Key {} PID {}
DEBUG	bpmx-engine	No parent execution found. Verifying if process instance {} can be stopped	Ошибка в родительском процессе. Проверка того, может ли экземпляр процесса {} быть остановлен
DEBUG	bpmx-engine	Execute end process {}	Исполнение конечного процесса {}
DEBUG	bpmx-engine	PID = {} currentFlow is null!!! currentActivityId = {}	PID = {} текущий поток равен нулю !!! идентификатор текущей активности = {}
DEBUG	bpmx-engine	currentFlow is null and activity is null!!!	Текущий поток и активность равны нулю!!!
DEBUG	bpmx-engine	Execute job start (processInstanceId = {}, processDefinitionId={}, executionId {}, jobId={}	Выполнить запуск задания (идентификатор экземпляра процесса = {}, идентификатор определения процесса={}, идентификатор выполнения {}, идентификатор задания={})
DEBUG	bpmx-engine	Execution of {} is leaved	Выполнение {} оставлено
DEBUG	bpmx-engine	Flush into database error	Ошибка отправки в БД
DEBUG	bpmx-gateway	Processing deployment {}	Развертывание обработки {}
DEBUG	bpmx-engine	PID = {} current thread is interrupted	PID = {} текущий поток прерван
WARN	bpmx-engine	Exception class {} is not found	Класс исключения {} не найден
WARN	bpmx-engine	Propagate error for wrong singleResult failed. Execution: {}	Ошибка запуска для неправильного singleResult не удалась. Исполнение: {}
WARN	bpmx-gateway	Внимание! Модель процесса "%s" создана в нецелевой среде разработки!!!	_______________
WARN	bpmx-engine, bpmx-gateway	retry count {}, error: {}	Количество повторных попыток {}, ошибка: {}
WARN	bpmx-engine	No parent scope execution found for boundary event. PID: {} ActivityID: {}. Skipped	Не найдено выполнение родительского процесса для граничного события. PID: {} Идентификатор действия: {}. Пропущено
WARN	bpmx-engine	Boundary has left defId {} PID {} executionId {} activityId {}	Граничное событие defId {} PID {} идентификатор выполнения {} идентификатор активности {}
WARN	bpmx-engine	Process instance not found for activity {}	Экземпляр процесса для activity не найден {}
WARN	bpmx-engine	Interrupted while waiting for the reset expired timer jobs thread to terminate	Прерывание во время ожидания завершения потока заданий. Сброс таймера с истекшим сроком действия
WARN	bpmx-engine	Application is shutting down. Skip error propagation!	Приложение завершает работу. Обработка ошибок пропускается!
WARN	bpmx-engine	Process with key={} and externalVersion={} has been already deployed	Процесс с ключом={} и внешней версией={} уже развернут
WARN	bpmx-engine	property not found in task name expression	Свойство не найдено в имени задачи
WARN	bpmx-engine	Interrupted while waiting for the jobs executors to terminate	Прервано во время ожидания завершения работы исполнителей задач
WARN	bpmx-engine	Interrupted while waiting for the reset expired timer jobs thread to terminate	Прерван во время ожидания завершения потока задач таймера сброса с истекшим сроком действия
INFO	bpmx-gateway	Temporary files with a prefix in the 'preprocessed_model' successfully deleted!	Временные файлы с префиксом в 'preprocessed_model' успешно удалены!
INFO	bpmx-gateway	Entered addZipInputStream method	Введен метод add ZipInputStream
INFO	bpmx-engine	Execution tree while executing operation {} :	Дерево выполнения во время выполнения операции {} :
INFO	bpmx-engine	FAIL.process save failed data in GG PID = {}	Ошибка. Процесс сохранения ошибочных данных в GG PID = {}
INFO	bpmx-engine	FAIL.process set end date PID = {}	Ошибка. Процесс установил дату окончания PID = {}
INFO	bpmx-engine	FAIL.process set endAllHistoricActivities PID = {}	Ошибка. Процесс устанавливает endAllHistoricActivities PID = {}
INFO	bpmx-engine	FAIL.process set deleteExecutionEntities PID = {} execution = {}	Ошибка. Набор параметров процесса deleteExecutionEntities PID = {} выполнение = {}
INFO	bpmx-engine	FAIL.process Process wasn't found in GG PID = {}	Ошибка. процесс Process не был найден в GG PID = {}
INFO	bpmx-engine	FAIL.process deleteJobsForEndedProcess PID = {}	Ошибка. Процесс удаляет задачи для завершенного процесса PID = {}
INFO	bpmx-engine	Shutting down BpmsAsyncJobExecutor	Завершение работы BpmsAsyncJobExecutor
INFO	bpmx-engine	BpmsAsyncJobExecutor has not shut down yet	BpmsAsyncJobExecutor еще не завершен
INFO	bpmx-engine	BpmsAsyncJobExecutor shut down	BpmsAsyncJobExecutor завершен
INFO	bpmx-engine	BpmsUserTaskActivityBehavior.execute userTask.id = {} userTask.name= {}	BpmsUserTaskActivityBehavior выполнение пользовательской задачи. Идентификатор = {} имя пользовательской задачи = {}
INFO	bpmx-gateway	previous definition (key = {}) version = {}	Предыдущее состояние (ключ = {}) версия = {
INFO	bpmx-gateway	MessageEventSubscriptions.count for remove = {}	Количество MessageEventSubscriptions для удаления = {}
INFO	bpmx-gateway	remove all MessageEventSubscriptions for id = {}	удалить все MessageEventSubscriptions для id = {}
INFO	bpmx-engine	planTriggerExecutionOperation will be created {}, pid = {}, activityid = {}	Будет создана planTriggerExecutionOperation {}, pid = {}, идентификатор действия = {}
DEBUG	bpmx-scheduler	Start scheduledJobsListener	Запуск scheduledJobsListener
DEBUG	bpmx-scheduler	Clear scheduler cache on partition revoked	Очистка кеша scheduler в отписке партиции
DEBUG	bpmx-scheduler	Job scheduled. Pid:{}, Type:{}, Delay:{}	Job запланирована. Pid:{}, тип:{}, задержка:{}
DEBUG	bpmx-scheduler	Trying to cancelJob with id {}	Попытка отменить job с идентификатором {}
WARN	bpmx-scheduler	{} perhaps is interrupted. JobID: {}, PID: {}	{} возможно прервана. Идентификатор job: {}, PID: {}
WARN	bpmx-engine	The recommended process instance context size for pid = {} has been exceeded. Current size is { contextSize }. If the size in { hard_limit } is exceeded, the execution of the instance will be suspended.	Превышен рекомендуемый размер объема данных экземпляра процесса для pid = {}. Текущий размер составляет { contextSize }. При превышении размера в { hard_limit } исполнение экземпляра будет приостановлено
ERROR	bpmx-engine	The maximum allowed size of the process instance context for pid = {} has been exceeded. Current size is { contextSize }. The maximum allowed context size is { hard_limit }	Превышен максимально допустимый размер контекста экземпляра процесса для pid = {}. Текущий размер составляет { contextSize }. Максимально допустимый размер контекста составляет { hard_limit }
ERROR	bpmx-engine	Failed to deliver message {} to process instance {} (Root PID {}) in {} attempts	Ошибка при доставке сообщения {} экземпляру процесса {} (корневой PID {}) за {} раз
ERROR	bpmx-gateway	BusinessFamily cannot be verified. The value of the configuration parameter {configValue} is not a valid regExp.	Контроль businessFamily не может быть осуществлен. Значение конфигурационного параметра {configValue} не является корректным regExp.
ERROR	bpmx-gateway	Deploy error. BusinessFamily validation is enabled. The businessFamily parameter does not match the {regExp} expression.	Deploy error. BusinessFamily validation is enabled. The businessFamily parameter does not match the {regExp} expression.
ERROR	bpmx-gateway	Invalid mask file <*mask.json> - same jsonPath specified more than once.	Невалидный файл маскирования <*mask.json> - один и тот же jsonPath указан несколько раз.
ERROR	bpmx-gateway	Could not deploy: Process does not have access to display the context.	Невозможно загрузить: у процесса нет доступа для отображения контекста.
ERROR	bpmx-gateway	Invalid masking file <*mask.json> - an invalid regular expression is specified in the regular expression for the variable.	Невалидный файл маскирования <*mask.json> - в регулярном выражении для переменной указано невалидное регулярное выражение.
ERROR	bpmx-gateway	Invalid masking file <*mask.json> - an empty string is specified in the regular expression for the variable.	Невалидный файл маскирования <*mask.json> - в регулярном выражении для переменной указана пустая строка.
ERROR	bpmx-gateway	Invalid masking file <*mask.json> - incorrect setting of the regExpMode field. Possible setting values: "show", "hide".	Невалидный файл маскирования <*mask.json> - некорректная настройка поля regExpMode. Возможные значения настройки: "show", "hide".

Трассировка запросов#

В некоторые события логирования после включения и настройки сервиса трассировок (группа настроек tracing) будут добавлены заголовки x-request-chain-id входящих HTTP-запросов. Также при вызове API bpmx-gateway будет отправляться span с фиксацией времени выполнения входящих запросов (при настроенном подключении к сервису трассировок и включенном значении параметра enableTraceIncomingRequests). Настройка категорий логирования осуществляется в файлах bpmx-engine-logback-spring.yaml и bpmx-gateway-logback-spring.yaml для engine и gateway соответственно.

Категории логирования bpmx-engine#

Отправка message через ThrowEvent.

<logger name="org.activiti.grid.gain.impl.delegate.KafkaThrowMessageDelegate" level="DEBUG"/>

В сообщении можно посмотреть, что message из экземпляра процесса отправился в Kafka, а также ID экземпляра процесса и наименование сообщения.

[DEBUG] (org.activiti.grid.gain.impl.delegate.KafkaThrowMessageDelegate) [SE. Throw message send. ProcessInstanceId: Process_13849e6. Message: StartProcess]

Логирование внешних HTTP вызовов для JSON и RPC Task.

<logger name="org.springframework.web.reactive.function.client.ExchangeFilterFunction" level="DEBUG"/>

В сообщении можно посмотреть ID экземпляра процесса, HTTP метод запроса, url, заголовок и параметры запроса, traceId (уникальный идентификатор запроса в системе tracing, который позволяет в деталях проследить за историей выполнения запроса). TraceId генерируется на HTTP-вызовы, в случае если включен tracing (tracing.enabled: true).

[DEBUG] (org.springframework.web.reactive.function.client.ExchangeFilterFunction) [org.activiti.grid.gain.webclient.WebClientFacade::lambda$logExternalRequestFilter$6:95] mdc:(traceId=null)| SE. External request to http://***. Method: GET. Headers: [Accept:[application/json], Content-Type:[application/json], ott-sberflow-process-id:[Process_13849e6]]. Params: [org.springframework.web.reactive.function.client.WebClient.uriTemplate:http://***, org.springframework.web.reactive.function.client.ClientRequest.LOG_ID:2c5795d0]

Логирование внешних вызовов HTM Task.

<logger name="com.sbt.bpms.integration.config.LoggingHtmRequestInterceptor" level="DEBUG"/>

В сообщении можно посмотреть traceId (уникальный идентификатор запроса в системе tracing, который позволяет в деталях проследить за историей выполнения запроса), HTTP метод, заголовки и url запроса. TraceId генерируется на HTTP-вызовы, в случае если включен tracing (tracing.enabled: true).

[DEBUG] (com.sbt.bpms.integration.config.LoggingHtmRequestInterceptor) [com.sbt.bpms.integration.config.LoggingHtmRequestInterceptor::traceRequest:34] mdc:(traceId=null)| SE. Sync mode. Request to HTM: http://***/system/v1/task-templates/<id>/user-task. Method: POST. Headers: [Accept:"text/plain, application/json, application/*+json, */*", Content-Type:"application/json", Content-Length:"774"].

Категории логирования bpmx-gateway#

Логирование вызовов API.

<logger name="com.sbt.bpms.configuration.filter.RequestLoggingFilter" level="INFO"/>

В сообщении можно посмотреть HTTP метод, url и заголовки запроса.

[INFO] (com.sbt.bpms.configuration.filter.RequestLoggingFilter) [com.sbt.bpms.configuration.filter.RequestLoggingFilter::beforeRequest:38] mdc:()| GW. Request eb638a7d-a56c-4845-8fb6-b2aef7fd146c started. POST /system/v5/processes/bcb68f52-aac5-4fe6-a683-418840792606, headers=[host:"gateway-pub2-tribe-pc-ift2-bpmx.apps.ocp.devpub.solution.sbt"]

Если включить фильтрацию в logback, то можно смотреть лог-записи только по-данному process definition. Фильтрация включается двумя следующими свойствами:

<property name="loggingByProcessIdEnabled" value="true">
<property name="loggedProcessIds" value="bcb68f52-aac5-4fe6-a683-418840792606">

По умолчанию данные категории имеют уровень логирования "ERROR".

События мониторинга#

Настройки интеграции с компонентом описаны в разделе «Настройка Prometheus/Объединенный мониторинг Unimon (MONA) Platform V Monitor (OPM)».

Предварительно потребитель должен создать подключение к компоненту MONA, используя соответствующий resourceName.

Метрики выставляются в формате prometheus. Подробная информация о выставляемых метриках в документации:

Метрики Engine, Gateway и Scheduler

Модуль	Метрика	Описание	Лейблы
bpmx-gateway	bpmx_start_process_counter_total	Счетчик количества запущенных экземпляров процессов за единицу времени. Только успешные	–
bpmx-gateway	bpmx_send_message_total	Счетчик количества переданных сообщений в экземпляры процессов (sendMessage) за единицу времени. Только успешные	–
bpmx-engine	bpmx_async_job_executed	Количество исполненных Job	–
bpmx-engine	bpmx_async_job_execution_time_seconds_max	Время исполнения Job (максимум) в секундах	–
bpmx-engine	bpmx_async_job_execution_time_seconds_count	Количество исполненных Job	–
bpmx-engine	bpmx_async_job_execution_time_seconds_sum	Суммарное время исполнения Job в секундах	–
bpmx-engine	application_ready_time_seconds	Время, необходимое (мс) для того, чтобы приложение было готово к обслуживанию запросов	main_application_class
bpmx-gateway	application_ready_time_seconds	Время, необходимое (мс) для того, чтобы приложение было готово к обслуживанию запросов	main_application_class
bpmx-scheduler	application_ready_time_seconds	Время, необходимое (мс) для того, чтобы приложение было готово к обслуживанию запросов	main_application_class
bpmx-engine	application_started_time_seconds	Время, необходимое (мс) для запуска приложения	main_application_class
bpmx-engine	bpmx_schedule_to_start_latency_milliseconds	Время между созданием и исполнением Job (разница времени между датой выполнения Job и датой создания Job) в миллисекундах	–
bpmx-scheduler	bpmx_scheduler_cache_size	Количество cache таймеров/автоматических повторов	–
bpmx-engine	bpmx_process_instance_context_cache_size	Количество cache контекста экземпляров процессов	–
bpmx-engine	bpmx_process_instance_context_loading_cache_size	Размер загруженного кеша контекста экземпляров процессов	–
bpmx-gateway	bpmx_event_subscription_cache_size	Количество cache подписок на события	–
bpmx-scheduler	bpmx_scheduled_tasks_executed_total	Количество исполненных scheduled tasks	–
bpmx-engine	bpmx_bpmx_schedule_to_start_latency_milliseconds_seconds_count	Время между созданием и исполнением Job (количество Job)	–
bpmx-engine	bpmx_bpmx_schedule_to_start_latency_milliseconds_seconds_max	Время между созданием и исполнением Job (максимальное время между созданием и исполнением Job)	–
bpmx-engine	bpmx_bpmx_schedule_to_start_latency_milliseconds_seconds_sum	Время между созданием и исполнением Job (сумма Job)	–
bpmx-engine	reactor_netty_http_client_response_time_seconds_count	Количество запросов во внешние сервисы	method, remote_address, status, uri
bpmx-engine	reactor_netty_http_client_response_time_seconds_sum	Время выполнения запросов во внешние сервисы в секундах	method, remote_address, status, uri
bpmx-engine	reactor_netty_http_client_response_time_seconds_max	Максимальное время выполнения запросов во внешние сервисы в секундах	method, remote_address, status, uri
bpmx-engine	reactor_netty_connection_provider_active_connections	Количество активных соединений в пуле	id, name, remote_address
bpmx-engine	reactor_netty_connection_provider_max_connections	Максимально допустимое количество активных соединений. По умолчанию не больше 500. Необходим мониторинг достаточности такого порогового значения	id, name, remote_address
bpmx-engine	bpmx_activity_started_count_total	Количество запущенных шагов. Метрика была переименована, ранее использовалось название bpmx_activity_started_count	pdkey, version, process_version, business_family, process_name
bpmx-engine	bpmx_activity_ended_count_total	Количество завершенных шагов. Метрика была переименована, ранее использовалось название bpmx_activity_ended_count	pdkey, version, process_version, business_family, process_name
bpmx-engine	bpmx_instance_incident_count_total	Количество экземпляров процессов в статусе "Инцидент"	pdkey, version, process_version, business_family, process_name
bpmx-engine	bpmx_instance_failed_count_total	Количество экземпляров процессов в статусе "Ошибка"	pdkey, version, business_family, process_version, process_name
bpmx-engine	bpmx_instance_started_count_total	Количество запущенных экземпляров процесса в разрезе модели процесса	pdkey, version, process_version, business_family, process_name
bpmx-engine	bpmx_instance_completed_count_total	Количество успешно завершенных экземпляров процессов	pdkey, version, process_version, business_family, process_name
bpmx-engine	bpmx_instance_incident_current_count	Количество экземпляров процессов в статусе "Инцидент" в данный момент времени (gauge).	–
bpmx-engine	pmx_instance_running_current_count	Количество экземпляров процессов в статусе "Исполняется" в данный момент времени (gauge).	–
bpmx-engine	bpmx_instance_completed_time_count	Количество выполнения процесса	pdkey, version, process_version, business_family, process_name
bpmx-engine	bpmx_instance_completed_time_sum	Время выполнения процесса в миллисекундах	pdkey, version, process_version, business_family, process_name
bpmx-engine	bpmx_instance_completed_time_max	Максимальное время выполнения процесса в миллисекундах	pdkey, version, process_version, business_family, process_name
bpmx-engine	bpmx_rest_task_retry_count_total	Количество автоматических повторных запросов из моделей во внешние сервисы по REST	uri
bpmx-engine	bpmx_call_activity_retry_count_total	Количество повторных запросов на выполнение call activity	activity_name
bpmx-engine	bpmx_json_rpc_task_retry_count_total	Количество повторных запросов из моделей во внешние сервисы по JSON RPC	uri
bpmx-engine	application_availability	Доступность приложения. Значение метрики равно readiness probe. Приложение начнет отбрасывать данную метрику только после того, как будет готово к работе.	app
bpmx-gateway	application_availability	Доступность приложения. Значение метрики равно readiness probe. Приложение начнет отбрасывать данную метрику только после того, как будет готово к работе.	app
bpmx-scheduler	application_availability	Доступность приложения. Значение метрики равно readiness probe. Приложение начнет отбрасывать данную метрику только после того, как будет готово к работе.	app
bpmx-scheduler	bpmx_timer_tasks_latency_sum	Разница времени в миллисекундах между due_date таймера и текущим временем, только по просроченным таймерам	–
bpmx-scheduler	bpmx_timer_tasks_latency_count_total	Количество просроченных таймеров	–
bpmx-gateway	http_server_requests_seconds_count	Количество входящих запросов	exception, method, outcome, status, uri
bpmx-gateway	http_server_requests_seconds_sum	Время обработки входящих запросов в секундах. Разделив данное значение на http_server_requests_seconds_count, получим среднее время выполнения запроса	exception, method, outcome, status, uri
bpmx-gateway	http_server_requests_seconds_max	Максимальное время обработки входящих запросов в секундах	exception, method, outcome, status, uri
bpmx-engine	bpmx_instance_incident_count_aborted_scripttask	Количество экземпляров в статусе "Инцидент" по причине прерывания scriptTask	process_name, activity_name, version, process_version
bpmx-engine	bpmx_instance_context_size	Размер объема данных экземпляра процесса в байтах. В разрезе модели процесса. Метрика отбрасывается в успешных случаях без превышения лимита	pdkey, version, process_version, business_family, process_name
bpmx-engine	bpmx_instance_context_size_hard_limit_excess	Размер объема данных экземпляра процесса в байтах в случае, если он превысил hard limit. В разрезе модели процесса	pdkey, version, process_version, business_family, process_name
bpmx-engine	bpmx_instance_context_size_soft_limit_excess	Размер объема данных экземпляра процесса в байтах в случае, если он превысил soft limit. В разрезе модели процесса	pdkey, version, process_version, business_family, process_name
bpmx-gateway	bpmx_instances_to_terminate_count	Количество экземпляров процессов, запланированных на выполнение операции прерывания	—
bpmx-gateway	bpmx_instances_to_recover_count	Количество экземпляров процессов, запланированных на выполнение операции повтора	—
bpmx-gateway	bpmx_instances_to_terminate_exceed_limit_count	Количество экземпляров процессов, запланированных на выполнение операции прерывания, спровоцировавших превышение допустимого количества экземпляров процессов	—
bpmx-gateway	bpmx_instances_to_recover_exceed_limit_count	Количество экземпляров процессов, запланированных на выполнение операции повтора, спровоцировавших превышение допустимого количества экземпляров процессов	—
bpmx-engine	bpmx_user_task_count_started	Количество созданных userTask	pdkey, version, business_family, process_name, process_version
bpmx-engine	bpmx_user_task_count_failed	Количество userTask попавших в ошибку (FAILED)	pdkey, version, business_family, process_name, process_version
bpmx-engine	bpmx_user_task_count_completed	Количество завершенных userTask (COMPLETED)	pdkey, version, business_family, process_name, process_version
bpmx-engine	bpmx_user_task_count_aborted	Количество прерванных userTask (INTERRUPTED)	pdkey, version, business_family, process_name, process_version

В целях мониторинга ограничения максимально выполняемого количества AsyncJobs в секунду следует:

Задать значение настройки bpmx-engine.ose.configmap.application.engine.asyncJobRateLimit.tps
Настроить инсталляцию с выбранным ограничением (например, 10 AsyncJobs в секунду), подать нагрузку и по мониторингу увидеть, что количество AsyncJobs не превысило данное значение.
Для запущенных экземпляров процессов, которые попали в очередь, при перезапуске подов BPMX не потеряны данные и jobs продолжили свое выполнение.

Часто встречающиеся проблемы и пути их устранения#

Коды ошибок и возможные механизмы устранения#

Код ошибки	Текст/шаблон сообщения	Причина возникновения	Пути решения
SE-001	Exception in PID={} while executing {}: {}	Ошибка при исполнении скрипт-таски.	Необходимо проверить бизнес-логику модели и переменные, имеющиеся в контексте
GW-002	Required property audit.nodeId is empty. Audit is disabled	В настройках модуля bpmx-gateway не заполнено обязательное свойство audit.nodeId	Заполнить в настройках модуля bpmx-gateway обязательное свойство audit.nodeId
GW-003	Audit event for {} failed: {}	Ошибка регистрации события аудита из модуля bpmx-gateway.	Необходимо проверить корректность настроек audit.proxyUri, а также физическую доступность коннекта до аудита с pod приложения
GW-004	Audit register metamodel failed: {}	Ошибка регистрации метамодели аудита из модуля bpmx-gateway.	Необходимо проверить корректность настроек audit.proxyUri, а также физическую доступность коннекта до аудита с pod приложения
SE-005	Exception while invoking TaskListener: Unknown property used in expression: {}. PID={}, activityId={};	Ошибка обработки завершения пользовательской задачи, как правило, связана с тем, что в контекст не пришли необходимые данные.	Необходимо проверить бизнес-логику модели и параметры, полученные полученные при завершении задачи
SE-006	Condition expression returns {}. ActivityId: {}	Ошибка возникает при вычислении условия перехода по данному направлению.	Необходимо проверить бизнес-логику модели и переменные, имеющиеся в контексте
SE-008	There is no context for instance with id = {}	Ошибка возникает при отсутствии в Kafka сообщения с контекстом данного экземпляра процесса.	Необходимо убедиться в этом, используя средства просмотра данных в topic bpmx-processinstance-contex. Во избежание очистки данных topic bpmx-processinstance-contex необходимо выставить настройку topicConfig.cleanup.policy: compact
GW-009	Idempotent start disabled	В настройках модуля bpmx-gateway выключен идемпотентный старт: gateway.idempotence.enabled: false	В настройках модуля bpmx-gateway включить идемпотентный старт: gateway.idempotence.enabled: true
GW-010	Unable to acquire JDBC connection	Ошибка соединения с БД из модуля bpmx-gateway	Необходимо проверить корректность настроек datasource.hikari.*, в том числе пользователя и пароля, наличие возможностей для подключения со стороны БД (максимальное количество подключений), а также физическую доступность подключения до БД с pod приложения
GW-011	ProcessInstance (processInstanceId={}) is not waiting for message with name {}	Не удалось найти подписку на определенное событие в иерархии процессов. Возможно, процесс встал на ожидание сообщения после его получения модулем, в данном случае возможно выполнить повторную отправку сообщения	Выполнить повторную отправку сообщения
SE-012	Exception in PID={}. Process param name={} not initialized.	Ошибка получения значения переменной	Необходимо проверить стартовое сообщение или корректность инициализации переменной во время исполнения процесса

SE - отправитель ошибки bpmx-engine
GW - отправитель ошибки bpmx-gateway

Проблемы с внешними интеграциями#

Алгоритм для диагностирования и решения проблем с внешними интеграциями:

Проанализируйте журнал BPMX на наличие ошибок/успешных запросов.
Проанализируйте журнал Istio Proxy в pod сервиса на наличие ошибок/успешных запросов.
Проанализируйте журнал Egress Gateway на наличие ошибок/успешных запросов.
Проанализируйте журнал OTT Sidecar на Egress на наличие ошибок/успешных запросов.

Проблемы с пользовательскими задачами#

Алгоритм для диагностирования и решения проблем с пользовательскими задачами (BPMX 5.x):

При исполнении complete для пользовательской задачи может возникать ошибка вида: sbp.bpm.htm.app.service.callback.CallbackException: Callback error: Server returned HTTP response code: 500. В этом случае необходимо изменить настройки модуля bpmx-gateway для параметра canary в файле bpmx-gateway.conf следующим образом: canary: false (по умолчанию в сборке стоит true).

Проблемы при старте процессов#

При старте процесса экземпляр не отображается на UI, а в лог-файлах присутствует запись [WARN] "Context cache size limit exceeded ({} > {}). New instances will not be started." Необходимо освободить текущий кеш (завершив процессы, находящиеся в статусе Инцидент, если это возможно) или увеличить размер параметра engine.instanceCacheSoftLimit в совокупности с лимитами памяти pod 'bpmx-engine'.
Процесс стартовал, но его не видно на UI, а в лог-файлах присутствует запись [WARN] (org.activiti.kafka.asyncJobs.JobExecutionManager) [org.activiti.kafka.asyncJobs.JobExecutionManager::getAssignedPartitionNumbers:140] mdc)| There is a difference in assigned asyncJobs and asyncStart partition numbers! Возможные причины проблемы: два стенда bpmx-engine (с разными настройками партиций) настроены на одну Kafka или заведены разные настройки на модулях engine в рамках одного стенда.
Не стартуют процессы, а в лог-файлах присутствует запись [INFO] (org.activiti.kafka.asyncJobs.JobExecutionManager) [org.activiti.kafka.asyncJobs.JobExecutionManager::startJobExecutionIfPossible:168] mdc)| Context cache size limit exceeded (5042 > 5000). New instances will not be started. Необходимо увеличить значения лимита в конфигурации bpmx-engine (engine.instanceCacheSoftLimit), либо масштабировать решение (увеличить количество pod).

Проблемы с событием получения сообщения#

Если при исполнении экземпляра процесса отбрасывается ошибка "ProcessInstance (processInstanceId=<id>) is not waiting for message with name 'message13_1'", то для отправки сообщения рекомендуется использовать API POST system/v5/instances/{instanceId}/messages/{messageName}.

Ограничение: в случае, если в экземпляре процесса есть несколько шагов на получение сообщения с одинаковым messageName, но разным payload, исполнение такого процесса может встать в ошибку. Не рекомендуется использовать одинаковый messageName при неодинаковом payload.

Проблема зависания экземпляров при рестарте pod engine#

При большом количестве экземпляров в незавершенном статусе, при рестарте pod engine есть вероятность зависания экземпляров процессов.

Решение:

Изменить значения конфигурационного параметра bpmx-engine contextLoadPartitionIdleEventMs с 20000 на 40000.

Проблемы при исполнении экземпляров процесса#

Экземпляр процесса исполнился, но не видно исполнение на UI. Возможная причина: ошибка сериализации данных. Необходимо проверить лог-записи на наличие записи com.fasterxml.jackson.databind.exc.InvalidDefinitionException: Type id handling not implemented for type java.lang.Object (by serializer of type com.fasterxml.jackson.databind.ser.impl.UnsupportedTypeSerializer). В случае, если запись найдена, необходимо проанализировать контекст экземпляра процесса и в случае, если это уместно, пересмотреть типизацию данных в модели. В противном случае обратиться к разработчикам сервиса.

В случае возникновения ответа от REST Task:

process instance was failed errorCode = ACTIVITY_EXCEPTION Did not observe any item or terminal signal within 10000ms in 'flatMap' (and no fallback has been configured) [Original exception: org.activiti.grid.gain.impl.exception.HttpTaskExceptionWrapper, Nested exception: org.activiti.engine.ActivitiException]

необходимо проверить доступность вызываемого сервиса или увеличить значение тайм-аута в модели.

Руководство по системному администрированию#

Сценарии администрирования#

Сценарий «Загрузка моделей процессов»#

Сценарий «Управление конфигурацией»#

Настройка для хранения данных при исполнении процессов#

Рекомендация по выбору количества партиций#

Рекомендация по настройке кафки для функционала Kafka Throw Events#

Рекомендация по настройке размера сообщений в Kafka#

Блок настроек BPMX#

Настройка асинхронного взаимодействия с компонентом TaskList (UTSK) продукта Platform V Flow (BPM)#

Настройка отправки событий истории исполнения процесса#

Настройки для отправки/получения сообщений по событиям в процессах#

Настройка белых списков разрешенных классов/методов в скриптах внутри моделей процессов#

Примеры содержимого файла whitelist#

Настройка ограничения исполнения пользовательских скриптов#

Настройки персистирования#

Настройка времени нахождения экземпляра процесса в статусе "Инцидент"#

Настройка префикса для идентификатора экземпляра процесса#

Настройка автоматических повторов для REST, JSON-RPC и User Tasks#

Настройка интервала планировщика, отвечающего за приостановку и возобновление экземпляров#

Настройка spring actuator#

Настройка Prometheus/Объединенный мониторинг Unimon (MONA) Platform V Monitor (OPM)#

Настройка spring-части системы#

Настройка интеграции с компонентом UTSK#

Настройка трассировки#

Транслируемые заголовки#

Блок настроек Gateway#

Настройки идемпотентности#

Траблшутинг идемпотентного старта#

Настройки при переходе процессов из версии 4.х на 5.х#

Настройка подключения к компоненту BPMU#

Настройка дросселирования нагрузки#

Настройка лимитирования объема данных#

Параметры конфигурации#

Описание параметров конфигурации#

Настройка количества экземпляров процессов для массовых операций#

Использование компонента#

Доставка моделей процессов#

Общая схема#

Формат поставки#

Варианты импорта моделей процессов#

Импорт через компонент BPMU#

Импорт с помощью CURL через /system namespace (для загрузки архива)#

Интеграция с внешними системами#

Интеграция с компонентом Аудит (AUDT) Platform V Audit SE (AUD)#

Интеграция с компонентом Журналирование (LOGA) Platform V Monitor (OPM)#

Рекомендации по использованию механизмов безопасности#

Управление потоками данных (фильтрация)#

Настройка контроля businessFamily при загрузке моделей процессов#

События системного журнала#

Трассировка запросов#

Категории логирования bpmx-engine#

Категории логирования bpmx-gateway#

События мониторинга#

Часто встречающиеся проблемы и пути их устранения#

Коды ошибок и возможные механизмы устранения#

Проблемы с внешними интеграциями#

Проблемы с пользовательскими задачами#

Проблемы при старте процессов#

Проблемы с событием получения сообщения#

Проблема зависания экземпляров при рестарте pod engine#

Проблемы при исполнении экземпляров процесса#