Chaos Engineering: научитесь тестировать гипотезы надёжности
м
Курс для тех, кто хочет проводить контролируемые испытания с помощью хаоса, улучшить надёжность и избежать катастрофических сбоев в работе системы
Вы на практике сформируете гипотезы об устойчивом поведении системы, самостоятельно проведёте эксперименты с помощью ChaosBlade и ChaosMesh.
е
мы
о
ПОТОК
Ведется набор группы
старт курса
Курс для тех, кто хочет проводить контролируемы испытания, улучшить надёжность и избежать катастрофических сбоев в работе систе
Вы на практике сформируете гипотезы об устойчив поведении системы, самостоятельно проведёте эксперименты с помощью ChaosBlade и ChaosMesh.
Разрабатывал различные распределённые системы, мигрировал монолиты в микросервисы, внеднял практики Chaos Engineering сквозь корпоративных архитекторов, разрабатывал системы принятия решений на основе AI.
RnD-архитектор, техлид
Максим Козлов
Сколько денег вы теряете, если баг будет обнаружен не на этапе тестирования, а в продакшене
Или возьмите число инцидентов за определенный период и число потерянных транзакций пользователей. Разберите проблемы, которые были, а затем посчитайте в человекоднях / часах стоимость их проверки при выкатывании новой версии.
Рассчитайте сами
С увеличением количества компонентов и взаимосвя-зей возрастает сложность систем, а, следовательно, и риск непредвиденного поведения системы. Если баг будет обнаружен не на этапе тестирования, а в про-дакшене, компания столкнется со следующими затратами:
Вы можете воспользоваться формулой экспертов Netflix:
  • Потери прибыли и репутации из-за проблем в работе продукта
  • Затраты на возмещение ущерба клиентам, если это применимо
  • Потери времени и ресурсов на расследование проблемы и выявление причин ее возникновения
ROI =
Cost of chaos indused harm + Cost of effort doing chaos
Cost of outages preventable by chaos - Cost of chaos indused harm - Cost of effort doing chaos
Результаты обучения
Понимаю, зачем разбираться в Chaos Engineering и какие эксперименты существуют.
Понимаю, какими инструментами эти эксперименты можно реализовать. И как мне выбрать подходящий
Получил навык тестирования нескольких гипотез в рамках нескольких экспериментов.
Понимаю, как генерить гипотезы.
Могу объяснить результаты экспериментов руководству.
Могу научить коллег этому подходу.
3
4
2
5
6
1
Результаты внедрения Chaos Engineering
Повысите надёжность
за счёт проведения тестов и экспериментов, которые улучшат устойчивость систем к различным нештатным ситуациям. Вы сможете обнаружить слабые места в работе системы и проблемы, которые могут привести к крупным сбоям. Это позволит компании принять меры заранее и предотвратить возможные проблемы.
Снизите риски
С помощью Chaos Engineering компании снижают вероятность крупных сбоев и потерь, что приводит к увеличению прибыли и улучшению репутации.
так как ваша система станет более устойчивой к инцидентам по сравнению с другими игроками рынка.
Повысите конкурентоспособность
Повысите скиллы сотрудников
Работая с Chaos Engineering вы будете лучше понимать свой продукт и быстрее реагировать в нестандартных ситуациях.
Программа

Overview технологии Chaos engineering:
Разбираем каждую из проблем (деградация сети, забивание диска логами и др.). Почему именно эта проблема может случиться, и каким видом эксперимента мы можем это повторить. Определяем ожидаемый результат и думаем, как проверить, что он трастовый.
Купить курс
Chaos Engineering
Лекции
Онлайн-встречи со спикером
15 000
Доступ к материалам на 2 года
Ведется набор группы
30 000 ₽
Предпродажа
это может быть интересно
Углубленный курс о продвинутых SRE- метриках. Вы узнаете, как выбрать технические метрики оценки надежности для своего сервиса SLO и SLI, научитесь их отслеживать, а также увидите вживую, как они деградируют.
SRE Observability
Старт в июне
это может быть интересно
В результате обучения на курсе вы сможете составить план действий по внедрению SRE в своей компании, поймёте, как коммуницировать с бизнесом и коллегами в случае аварии, как принимать сервисы на поддержку.
SRE База
Cтарт: 27 июня