На нашем сайте включены cookies, потому что мы используем услуги Facebook Pixel, Google Analytics и Yandex.Metrika. Вы можете отказаться от них и продолжить пользоваться сайтом.
Ок, не показывать больше
Close
 
Митап «Программирование для админа», 26 мая в 19:00
Close
На нашем сайте включены cookies, потому что мы используем услуги Facebook Pixel, Google Analytics и Yandex.Metrika. Вы можете отказаться от них и продолжить пользоваться сайтом.
Ок, не показывать больше
Close
Error get alias

21–23 мая

На интенсиве по SRE вы будете поддерживать приложение, состоящее из нескольких микросервисов. Определите для него метрики SLI и SLO и настроите мониторинг, алертинг, а потом разберете практические кейсы, близкие к реальной работе SRE-инженера.
Цена: 70 000 ₽
Онлайн-интенсив

Интенсив по SRE

Интенсив даёт больше, чем теория из книги от Google. Во время обучения будем поддерживать приложение из нескольких микросервисов — онлайн-кинотеатр. За три дня с сервисом случится несколько проблем. Эти кейсы не придуманы, а основаны на практике спикеров.
Будем работать в командах, собранных так, чтобы в каждой были люди с разными скиллами и опытом. Прикреплённый куратор следит за взаимодействием и качеством образовательного процесса. Каждый студент активно участвует в решении задач.
Мы формируем сообщество и культуру SRE в России. Наши спикеры — практикующие специалисты и участники конференций, каждый из которых приносит свою экспертизу.
Во время учебы можно узнать, какие практики используют коллеги из разных компаний.
Чего хотят пользователи? Сколько стоит минута простоя?
БИЗНЕСУ
Научим дружить с пользователями, выставлять правильные метрики
РАЗРАБОТЧИКУ
Научим правильно залезать в код программистов...
ИНЖЕНЕРУ

Программа

Первый день (21 мая, пятница)
День знакомства с теорией SRE, настройки мониторинга и алертинга. А еще это день, когда вы станете командой с другими студентами интенсива.

Будут метрики SLO, SLI, SLA и как они соотносятся с требованиями бизнеса. Best Practiсes по настройке мониторинга. Правила для пожарной команды. И конечно же первые КЕЙСЫ. По отзывам студентов предыдущих потоков, метрики для многих оказались важной и сложной темой.

Тема №1: Мониторинг
  • Зачем нужен мониторинг,
  • Symptoms vs Causes,
  • Black-Box vs White-Box Monitoring,
  • Golden Signals,
  • Перцентили,
  • Alerting,
  • Observability.
Практика: Делаем базовый дашборд и настраиваем необходимые алерты.

Тема №2: Теория SRE
  • SRE vs DevOps;
  • SLO, SLI, SLA;
  • Durability;
  • Error budget.
Практика: Добавляем на дашборд SLO/SLI + алерты.
Практика: Первая нагрузка системы.

Тема №3: SRE онбординг проекта

Тема №4: Управление инцидентами
  • Введение в управление инцидентами,
  • Resiliencе Engineering.
Практика, решение 1 кейса: зависимость downstream.

  • Как выстраивается пожарная бригада.
  • Насколько ваша команда эффективна в инциденте?
  • 7 правил для лидера инцидента.
  • 5 правил для пожарного.
  • HiPPO – highest paid person's opinion. Communications Leader.
Практика, решение 2 кейса: SLO в опасности, зависимость upstream.
Второй день (22 мая, суббота)
Второй день практически полностью построен вокруг решения двух кейсов: проблемы с окружением и проблемы с архитектурой. В рамках первого кейса подробно разберем тему Health Checking. Помимо примеров отказа системы, спикеры расскажут про работу с постмортерами (post mortem) и дадут примеры, которые вы сможете использовать в своей команде. Оба кейса злободневные и могу возникнуть в реальном проекте SRE специалиста.

Тема №5: Концепция контекст запроса

Тема №6: Health Checking
  • Health Check в Kubernetes.
  • Жив ли наш сервис?
  • Exec probes.
  • initialDelaySeconds.
  • Secondary Health Port.
  • Sidecar Health Server.
  • Headless Probe.
  • Hardware Probe.
Практика, решение 3 кейса: проблема с окружением, билеты купить невозможно.

Тема №7: Практика работы с постмортемами
Практика: Пишем постмортем по предыдущему кейсу и разбираем его со спикерами.

Тема №8: Решение проблем с инфраструктурой
  • Мониторинг MySQL;
  • SLO/SLI для MySQL;
  • Anomaly detection
    Практика, решение 4 кейса: проблема с БД.

Третий день (23 мая, воскресенье)
Тут два кейса про отказоустойчивость и высокодоступность продакшена: traffic shielding и canary deployment. Оба кейса — важные практики SRE. Они нужны для разного: traffic shielding позволит допустить до прода только ту часть трафика, которую он выдержит. Такая ситуация может случиться скорее из-за ошибки разработки при неверном перенаправлении трафика, чем из-за злоумышленников. В теме Canary deployment спикеры расскажут, как выкатить обновления на часть пользователей, а не на всех сразу — даже если тесты на стейджинге прошли, остается вероятность, что обновление сломает прод.

Мы полагаем, что третий день будет больше для того, чтобы посмотреть «какие подходы бывают и как их применять». Прямо хардкорной настройки руками не планируем.


Тема №9: Traffic shielding
  • Поведение графиков роста количества запросов и бизнес операций,
  • Понятие saturation и capacity planning,
  • Traffic shielding и внедрение rate limiting,
  • Настройка sidecar с rate-limiting на 100 запросов в секунду.
Практика, решение 5 кейса: Traffic shielding, исследуем поведение провайдера под нагрузкой, которую он не в состоянии выдержать.

Тема №10: Canary Deployment
  • Стратегии деплоя в k8s (RollingUpdate vs Recreate);
  • Canary и blue-green стратегии;
  • Обзор инструментов для blue-gree/canary release в k8s;
  • Настройка canary release в GitLab CI/CD;
  • Пояснение схемы работы canary release;
  • Внесение изменений в .gitlab-ci.yml.
Практика, решение 6 кейса: проблема с кодом.
Спикеры интенсива
Иван Круглов
Staff Software Engineer в Databricks


Имеет опыт в enterprise компаниях по:
— распределенной доставке и обработке сообщений;
— BigData и web-stack;
— поиску;
— построению внутреннего облака;
— service mesh.
Павел Селиванов
Senior DevOps Engineer в Mail.ru Cloud Solutions


— На счету десятки выстроенных инфраструктур и сотни написанных пайплайнов CI/CD;
— Сертифицированный администратор Kubernetes;
— Автор нескольких курсов по Kubernetes и DevOps;
— Регулярный докладчик на Российских и международных IT-конференциях.
Артём Артемьев
Lead SRE в Inspectorio


Знает, как помочь команде встретиться с SLI и жить дружно.
Имеет успешный опыт в:
— Инцидент-менеджменте и мониторинге сложных решений;
— Performance-тестировании и борьбе за каждый RPS.
Требования к участникам:
Свободное владение Linux;
Любой язык программирования: уровень Junior;
GitLab: навыки автоматизации;
Prometheus: навыки мониторинга;
Kubernetes: навыки работы в кластере.

Для обучения необходимы:
- SSH-клиент,
- наличие Docker у себя локально,
- текстовый редактор/IDE.

Если у вас нет навыков работы в Kubernetes, вы можете принять участие в предстоящих интенсивах База и Мега Kubernetes или пройти видеокурсы Kubernetes.
Площадка: конференц-зал отеля «Севастополь»
Москва, Большая Юшуньская улица, 1А, корпус 5
Бронирование номеров в корпусе «Модерн» — скидка 10% по промокоду «Слёрм».
В комплекте SRE


— доступ к записям в личном кабинете;
— доступ в git Слёрма;
— стенд для практики;
— помощь спикеров и инженеров техподдержки в выполнении заданий;
— доступ в «Клуб инженеров» – закрытое сообщество выпускников, где можно обсуждать технические кейсы, задавать вопросы и помогать коллегам из других компаний.

Вы научитесь
Формировать метрики, которые реально показывают здоровье приложения, позволяют не только понять, когда уже случился инцидент, но и видеть и предусматривать деградацию сервиса.
Переводить технические метрики на язык бизнеса и пользователей.
Организовывать пожарную команду в рамках своей компании, сможете показать слаженную работу, даже когда «все горит».
Проходить через те сложности, которые могут случиться с вашим продом. Работать с инцидентами и писать постмортемы. В дальнейшем сможете предотвращать инциденты.
Отзывы прошедших интенсив SRE
Рассрочка
Процесс оформления:
1. Оставляете заявку и получаете на почту анкету для оформления рассрочки.
2. Банк принимает решение в течение нескольких минут.
3. Заключаете сделку с банком онлайн.
4. Мы отправляем кассовый чек на эл. почту
и предоставляем доступ к курсу.

Условия рассрочки:
Срок: 4 месяца
Первый платеж: от 0 руб.
Переплата: 0 руб. Вы оплачиваете только стоимость курса, без процентов.
Предоставляется только физическим лицам.