Блог Слёрм

ТОП-5 вопросов, на которые поможет ответить Chaos Engineering

Все знают: продакшен может лечь в любой момент. Сервер упадёт, сеть заглючит, база зависнет... Если система к этому не готова, случится катастрофа.

Но хороший инженер не ждёт, когда что-то сломается случайно. Он сам создаёт хаос, чтобы проверить, выживет ли система.

Это и есть Chaos Engineering — методология, которая помогает намеренно создавать сбои, чтобы:

  • понять, как ведёт себя система под нагрузкой;
  • найти слабые места до того, как они приведут к реальному инциденту;
  • улучшить отказоустойчивость и снизить риски.

Netflix, Amazon и Google давно используют Chaos Engineering, чтобы находить ответы на эти и другие важные вопросы:

  • Что происходит, когда сервис по какой-то причине становится недоступным?
  • Каким будет результат сбоев, если приложение получит слишком много трафика или если оно недоступно?
  • Столкнёмся ли мы с каскадными ошибками, если из-за единой точки отказа приложение выйдет из строя?
  • Что происходит, когда наше приложение выходит из строя?
  • Что происходит, когда возникают неполадки с сетью?

14 июля у нас стартует курс «Chaos Engineering», на котором вы заберёте лучшие практики и научитесь ломать систему так, чтобы она не ломалась сама.

👉 Полную программу и условия участия смотрите на этой странице.
Инженерам