Блог Слёрм

Chaos Engineering в service mesh: зачем ломать систему?

Chaos Engineering – это практика намеренного внесения сбоев в систему, чтобы проверить, выдержит ли она реальные аварии. Можно назвать его краш-тестом, который помогает найти слабые места до того, как случится реальный инцидент.

А микросервисная архитектура – это сложный механизм, который управляет трафиком, безопасностью и отказоустойчивостью. Важно убедиться, что он справится с неожиданными сбоями.

Как это сделать в service mesh:

1️⃣ выключаем случайные sidecar-прокси 👉 смотрим, как mesh балансирует нагрузку;

2️⃣ искусственно вводим задержки и потери пакетов 👉 проверяем механизмы ретраев и таймаутов;

3️⃣ генерируем случайные 500, 503, 404 ошибки 👉 проверяем fallback-стратегии.

Лучше самому накостылять системе, чем ждать, пока её положит реальный баг.

Подробно Chaos Engineering, Deploy с возможностями service mesh, ограничения нагрузки и многое другое будем разбирать во второй день интенсива «Service mesh».

Интенсив продлится 3 дня, стартуем 28 февраля. За одни выходные вы получите все необходимые навыки по service mesh и сможете применить их в работе уже в понедельник!

Полную программу всех 3 дней обучения можно найти на сайте.

Занять место на интенсиве — по ссылке.
Service mesh