Блог Слёрм

Автомониторинг в service mesh: как следить за сервисами без ручного труда?

Service mesh не только управляет трафиком, но и автоматически собирает метрики, логи и трейсы. Как это работает:

Что мониторится «из коробки»:

  • задержки (latency) между сервисами;
  • ошибки (HTTP 5xx, gRPC-статусы);
  • загрузка (RPS);
  • топология (кто с кем общается).

Инструменты:

  • Prometheus — метрики (Istio, Linkerd);
  • Grafana — дашборды;
  • Jaeger/Zipkin — трейсы;
  • Kiali — визуализация зависимостей.

Что это даёт:

  • SLO-мониторинг;
  • автовыявление аномалий (например, рост 500-х ошибок);
  • оптимизацию ресурсов (ищем «узкие места»).

Пример:

Kiali показывает, что payment-service тормозит из-за медленных запросов к БД.

Решение → добавляем кеш.

Детально автоматический мониторинг с service mesh мы будем изучать в день старта интенсива «Service mesh» — 27 июня. Задания построены вокруг учебного приложения — онлайн-кинотеатра, состоящего из нескольких микросервисов. Вы изучите концепцию работы и сможете применить полученный опыт на любом service mesh решении, реализованном на основе Envoy Proxy.

Занять место на интенсиве — по ссылке.
2025-06-23 03:00 Service mesh