SRE: Мега

Расширенный курс о продвинутых инструментах SRE и о том, как их применять на практике.
серия воркшопов
10 ноября — 1 декабря 2022
Зачем это надо
Вы в полевых условиях протестируете редкие для российского рынка подходы, которые принципиально отличают SRE от DevOps и администрирования. После курса вы поймете, какие инструменты экономически выгодно внедрять бизнесу для сокращения инцидентов и повышения скорости разработки проекта.
Кому подходит
02
SRE-инженерам, которые хотят повысить отказоустойчивость системы и высвободить время на другие задачи
03
Компаниям, которые уже внедрили SRE-практики, хотят усовершенствовать их применение и наладить внутренние процессы в команде
01
Тем, кто прошел базовый курс SRE

Формат обучения
Если какой-то из пунктов мешает вам пойти на курс. У нас есть программы, которые помогут вам получить новые знания: Посмотреть программы →
Навыки программирования: вам предстоит писать код на Python
Навыки работы с Linuх
Опыт настройки мониторинга: Prometheus, Grafana и др.
Опыт работы с Kubernetes
Стабильная работа системы важна для любой компании, которая хочет оставаться конкурентоспособной и гарантировать удобный доступ к сервисам для пользователей. Однако есть ряд отраслей, где необходимо обрабатывать данные на лету с «зелеными графиками».
В каких компаниях внедряют SRE
Программа
Внедрение SRE
Бывает так, что инициатива внедрить SRE в компании исходит не от управления, а со стороны инженера. Тут не помешает знать, как продать идею начальству и внедрить все с ноля. Расскажем не про технологии, а именно про выстраивание процесса и его согласование.
SRE Adoption
Prerequisites
Choosing team and product for the pilot Most likely the most problematic team
Skills needed for SRE kickstart
Understanding where you are SRE Rollout plan is somewhere here
Formalising win criteria
Planning steps and outcomes
Team setups
SRE person integrated into product teams
Central on-call SRE team
Central infra/tool SRE team
Бесплатно
Блок 1: Observability
Приложения уходят из монолита в микросервисы. Их становится много, а зоны ответственности размываются. Становится сложно понять, как рассчитать надежность приложения и как она коррелирует с микросервисами. В этом блоке мы расскажем, как агрегировать множество SLO/SLI в одну или несколько высокоуровневых метрик.
Non Functional Requirements: требования для оценки качества технической работы системы.
Бюджеты ошибок: что это и зачем надо
Как и зачем измерять надежность в приложении
Классические воронки
Надежность точек входа и как ее измерить
10 ноября, 18:00
15 000 ₽
Блок 2: Reliability architecture patterns
Паттерны того, как построить архитектуру надежной. На практике разбираемся, как сделать так, чтобы вся система работала стабильно именно с точки зрения архитектуры.
Exponential backoff & jitter
Failovers & dummy server
Graceful degradation (don't let new functionality fail main one)
15 и 17 ноября, 18:00
35 000 ₽
Блок 3: Proactive reliability testing
Все, что связано с проактивным тестированием надежности системы. Здесь два больших компонента – Chaos Engineering и Capacity planning.
Chaos Engineering
Обзор инструментов: Gremlin / ChaosMesh / ChaosBlade / ChaosKube / СhaosMonkey
Основные тесты: Slowness injection и Failure injection
Подготовка и планирование:
формулирование целей и ожидаемого результата
коммуникации
анализ данных

Capacity Planning
Load testing vs capacity testing
Виды capacity planning: Request mirroring/ shadowing / Traffic amplification / Предсказания на основе исторических данных
22 и 24 ноября, 18:00
35 000 ₽
Блок 4: Intelligent delivery of changes
Затронем умный и безопасный деплой изменений. Разберем практики разбиения больших изменений на много мелких, а именно, как правильно эти мелкие изменения выкатывать.
Feature Flags
Обзор продуктов – LaunchDarkly
Флагов может быть очень много
Как отслеживать
Incremental rollouts
29 ноября, 18:00
15 000 ₽
Блок 5: Incident management
SRE-инженер должен знать, как хендлить инцидент, как организовать дежурства в команде, выстраивать Shifts handovers, оформлять воркбуки и правильно вводить новичков в on-call.
On-call shift management
Convert incidents to money
1 декабря, 18:00
10 000 ₽
Вся программа SRE Мега 95 000 ₽
Автор курса

Иван Круглов, Автор
Senior Staff Engineer в Databricks


  • Отвечает за стабильность ключевого сервиса Databricks
  • Ex-Principal Developer в Booking. com, где создавал и поддерживал несколько масштабных сервисов
  • Разработал сервис персональных данных по GDPR (General Data Protection Regulation)
  • Создал внутренне облако Booking.com
Спикеры
Сергей Бухаров
SRE в компании Dodo Engineering

Павел Селиванов
Архитектор Yandex Cloud

  • На счету десятки выстроенных инфраструктур и сотни написанных пайплайнов CI/CD
  • Certified Kubernetes Administrator
  • Автор нескольких курсов по Kubernetes и DevOps Регулярный докладчик на российских и международных IT-конференциях
Владимир Федорков
Эксперт в области высоких нагрузок

  • Спикер Highload++ 2022
  • Десятки успешных проектов по подъему нагрузки в США, Европе и России
  • Серьезный опыт кризис-менеджмента и ведения инцидентов
Максим Гусев
Tech Lead SRE

  • Тысячи выстроенных пайплайнов CI/CD
  • Более 100 инсталляций Kubernetes в продакшен
  • Автор нескольких курсов по DevOps и его внедрению
Спецпредложения
При покупке интенсива "SRE: Мега" вы получаете в подарок курс для детей и подростков "Разработка игр на Юнити". Для этого достаточно иметь своего / знакомого ребенка от 10 до 17 лет с желанием заниматься разработкой.
Для физических лиц
Чтобы получить этот бонус, напишите в ТГ @Lisa_Sarycheva и сообщите, с какой почты вы регистрировались на "SRE: Мега" и данные ребенка, которого надо записать на "Разработку игр на Юнити".
Для юридических лиц
SRE База
90 000 ₽
Знакомство с базовыми инструментами и метриками.
Решение практических кейсов, понимание подходит ли SRE вам и вашей компании
SRE Мега
95 000 ₽
Серия воркшопов для тех, кто хочет совершенствовать существующие и внедрять новые sre-практики
Комплект курсов
При покупке всех интенсивов вместе вы получите консультацию по внедрению конкретно в вашей компании от спикера и мерч в подарок