Блог Слёрм

Автомониторинг в service mesh: как следить за сервисами без ручного труда?

Service mesh не только управляет трафиком, но и автоматически собирает метрики, логи и трейсы. Как это работает:

Что мониторится «из коробки»:

задержки (latency) между сервисами;
ошибки (HTTP 5xx, gRPC-статусы);
загрузка (RPS);
топология (кто с кем общается).

Инструменты:

Prometheus — метрики (Istio, Linkerd);
Grafana — дашборды;
Jaeger/Zipkin — трейсы;
Kiali — визуализация зависимостей.

Что это даёт:

SLO-мониторинг;
автовыявление аномалий (например, рост 500-х ошибок);
оптимизацию ресурсов (ищем «узкие места»).

Пример:

Kiali показывает, что payment-service тормозит из-за медленных запросов к БД.

Решение → добавляем кеш.

Детально автоматический мониторинг с service mesh мы будем изучать в день старта интенсива «Service mesh» — 27 июня. Задания построены вокруг учебного приложения — онлайн-кинотеатра, состоящего из нескольких микросервисов. Вы изучите концепцию работы и сможете применить полученный опыт на любом service mesh решении, реализованном на основе Envoy Proxy.

Занять место на интенсиве — по ссылке.

2025-06-23 03:00 Service mesh