Автомониторинг в service mesh: как следить за сервисами без ручного труда?
Service mesh не только управляет трафиком, но и автоматически собирает метрики, логи и трейсы. Как это работает:
Что мониторится «из коробки»:
задержки (latency) между сервисами;
ошибки (HTTP 5xx, gRPC-статусы);
загрузка (RPS);
топология (кто с кем общается).
Инструменты:
Prometheus — метрики (Istio, Linkerd);
Grafana — дашборды;
Jaeger/Zipkin — трейсы;
Kiali — визуализация зависимостей.
Что это даёт:
SLO-мониторинг;
автовыявление аномалий (например, рост 500-х ошибок);
оптимизацию ресурсов (ищем «узкие места»).
Пример:
Kiali показывает, что payment-service тормозит из-за медленных запросов к БД.
Решение → добавляем кеш.
Детально автоматический мониторинг с service mesh мы будем изучать в день старта интенсива «Service mesh» — 27 июня. Задания построены вокруг учебного приложения — онлайн-кинотеатра, состоящего из нескольких микросервисов. Вы изучите концепцию работы и сможете применить полученный опыт на любом service mesh решении, реализованном на основе Envoy Proxy.