У меня есть 100 микросервисов, я умею мерить надёжность каждого, но бизнес хочет что-то простое и понятное, а не 100 независимых метрик
Хочу научиться замечать инцидент в зачатке на графике и по алерту, чтобы предотвратить панику и стресс в моменте
Достало, что про сбои в работе я узнаю от пользователей и саппорта, но я не знаю, как это изменить
Хочу объяснить руководителю, зачем собирать бизнес-метрики приложения, и сколько он теряет в моменте инцидента
Хочу договориться с бизнесом о расстановке приоритетов: выкатывать фичи или работать над надёжностью