Часто встречающиеся проблемы и пути их устранения#
Код ошибки |
Пример ошибки |
Решение |
|---|---|---|
Pod RL Service завершается с ошибкой |
time="2022-08-04T14:30:21Z" level=warning msg="connecting to redis on mymaster,redis-sentinel-0.redis-sentinel:26379,redis-sentinel-1.redis-sentinel:26379,redis-sentinel-2.redis-sentinel:26379 with pool size 10" panic: dial tcp: lookup redis-sentinel-2.redis-sentinel on { IP_ADDRESS }:53: no such host |
Необходимо удостовериться, что 3 Pod StatefulSet redis-sentinel запущены корректно |
Некорректная балансировка запросов от Ingress Gateway до RL Service |
В случае перезапуска Pod RL Service или увеличения числа Pods, трафик на вновь созданный Pod почти не поступает |
Убедиться, что в артефакте GlobalRateLimit указан Headless Service RL Service, а не обычный. Headless Service — это Service, у которого параметр clusterIP выставлен в None |
Не срабатывает RateLimit |
- |
Проверить, что: |
Не запускается Pod RL Service или RL Operator |
panic: dial tcp: address radish-0.radish.da-dp2-sy-dev-srls-03.svc.cluster.local:2181,radish-1.radish.da-dp2-sy-dev-srls-03.svc.cluster.local:2181,radish-2.radish.da-dp2-sy-dev-srls-03.svc.cluster.local:2181: too many colons in address |
Выставьте корректный тип Radish (standalone или scarecrow) и укажите корректный список серверов. Для standalone должен быть указан только один адрес подключения |
Не запускается Pod |
Failed to pull image "registry.mydomain.ru/ci90000055_srls/operator@sha256:9f45c61299009bf91a63514680230151e02bc2bde35f38c14b381edacd291992": rpc error: code = Unknown desc = Error reading manifest sha256:9f45c61299009bf91a63514680230151e02bc2bde35f38c14b381edacd291992 in registry.mydomain.ru/domain/srls/operator: unauthorized: authentication required |
Предоставьте права на доступ к образу для пользователя, прописанного в ImagePullSecret rls-image-pull-secret |
Не применяется конфигурация GlobalRateLimit |
Ошибка в блоке status: endpoint [test-server1-endpoint-tribe-sy-srls-dev-03.apps.stands-vdc01.solution.test:8080] tenant.Name [server1.path] tenant.ResourceName [account-3] duplicate error: GlobalRateLimit manifest not valid |
Значение поля resourceName должно быть уникальным при конфигурировании endpoint. Скорректируйте значение поля resourceName |
Не запускается Pod RL Operator |
W0816 16:15:07.596714 1 reflector.go:424] sigs.k8s.io/controller-runtime/pkg/cache/internal/informers_map.go:262: failed to list *v1alpha1.GlobalRateLimit: globalratelimits.ratelimit.service is forbidden: User "system:serviceaccount:some-namespace:rate-limiter-service" cannot list resource "globalratelimits" in API group "ratelimit.service" at the cluster scope |
Убедитесь, что созданы артефакты ClusterRole и ClusterRoleBinding, предоставляющие права на артефакт GlobalRateLimit для ServiceAccount |
Warning в статусе GlobalRateLimit |
Сообщения с подобным текстом могут появляться в |
В сообщении говорится о некритичной ошибке конфигурации: |
Не запускается Pod RL Operator |
error controller-runtime.source.EventHandler failed to get informer from cache {"error": "failed to get restmapping: failed to get server groups: Get "https://kubernetes.default.svc.cluster.local:443/api": read tcp { IP_ADDRESS }:44884->{ IP_ADDRESS_EXTERNAL }:443: read: connection reset by peer - error from a previous attempt: read tcp { IP_ADDRESS }:44878->{ IP_ADDRESS_EXTERNAL }:443: read: connection reset by peer"} |
Проверьте корректность маршрута проброса трафика к Kube API через Egress. Должны быть созданы артефакты VirtualService с названием |