• Закройте пробелы в SRE и почувствуйте уверенность в своих скиллах
длительность 3 недели
старт: 17 ноября
  • Внедрите SRE-практики в команду и избавьтесь от хаоса с инцидентами
SRE: data-driven подход к управлению надежностью систем
Видеокурс «Мониторинг в Grafanа» в подарок!
Упор на практику
20 часов практики
Работа в команде
поделим на группы, распределим роли и научим работать в коллективе
Имитация реальной работы
решайте задачи и кейсы, которые возникают на вашем сервисе
Прямое общение со спикерами
разборы кейсов, Q&A и отдельный чат
15 часов теории
Курс для вас, если
Начинающие DevOps, младшие сисадмины, разработчики, которые присматриваются к SRE
DevOps, SRE, тимлиды инфраструктурных команд, архитекторы, сисадмины, разработчики с «инфра-ответственностью»
Вы хотите познакомиться с SRE, понять, что это такое и зачем оно вам нужно, а также получить фреймворки для старта в новой сфере
Вы устали «тушить пожары» и хотите внедрить метрики, алерты и постмортемы в команду, а также систематизировать свои знания по SRE
Получите готовый план внедрения SRE, сможете рассчитать ROI и обосновать его руководству
На обучении вы
На обучении вы
Сделаете первые шаги в SRE, получите полезные чек-листы и шаблоны, которые сразу сможете внедрить в работу
DevOps/SRE инженеры уровня middle/middle+ и разработчики, которые хотят сделать апгрейд в SRE
Вы хотите закрыть пробелы в знаниях, сделать крупный шаг в карьере или избавиться от «синдрома самозванца»
На обучении вы
Прокачаете ваши скиллы, повысите экспертизу в SRE и станете увереннее как специалист
После курса вы
  • настроите мониторинг, SLO/SLA, алертинг в своей команде, чтобы бизнесу было спокойно, а инженеры перестали жить в режиме тушения пожаров
  • поймете, как пройти сопротивление команды при внедрении практик
  • сможете уверенно решать инциденты и выстраивать postmortem-процессы
  • получите полную картину SRE-практик, адаптированных под реалии российского бизнеса
  • систематизируете знания, почувствуете уверенность в скиллах и станете тем специалистом, которого не нужно доучивать
  • осознаете, какие метрики надо собирать и как это делать правильно
  • сможете снизить ущерб от отказов в будущем
  • сможете устранять конкретные проблемы, связанные с надежностью сервиса
Вы получите не гугловскую теорию, а рабочий опыт инженеров из российских компаний
Начни учиться бесплатно
Познакомьтесь с материалами и спикерами курса. Даем демодоступ на 3 дня
Зачем компании внедрять SRE-подход?
Повышение
надежности сервисов
Улучшение производительности
Снижение
количества инцидентов
Эффективное
управление нагрузкой
Автоматизация и стандартизация
Кросс-функциональное взаимодействие команд
Обратная связь и улучшения
Снижение затрат
SRE обеспечивает высокую доступность и стабильность сервисов. Это критически важно для удовлетворенности пользователей.
Использование SRE-практик позволяет оптимизировать производительность систем. Задержки снижаются, скорость отклика повышается.
Внедрение превентивного мониторинга и автоматизации процессов минимизирует количество инцидентов и время их решения.
SRE позволяет анализировать и прогнозировать нагрузку на системы, что помогает лучше справляться с пиковыми периодами.
SRE внедряет автоматизированные процессы, что снижает количество рутинных задач и повышает эффективность работы команд.
SRE способствует более тесному сотрудничеству между разработчиками и операционными командами. Это улучшает коммуникацию и общий процесс разработки.
SRE-практики включают анализ инцидентов и создание постмортемов, что помогает выявлять слабые места и улучшать процессы.
Оптимизация процессов и автоматизация помогают сократить операционные расходы.
Формат обучения
Обучение проходит в условиях имитации реальной работы — в специально разработанном приложении кинотеатра, в котором у каждого будет своя роль
Учебное приложение состоит из нескольких микросервисов. Он агрегирует данные о сеансах, ценах и свободных местах со всех кинотеатров, показывает анонсы фильмов, дает выбрать кинотеатр, сеанс, зал и место, забронировать и оплатить билеты.

Мы сформулируем показатели SLO, SLI, SLA для сервиса, разработаем архитектуру и инфраструктуру, которая их обеспечит, настроим мониторинг и алертинг.
Ошибки разработчиков, отказы инфраструктуры, наплыв посетителей, DoS-атаки приводят к тому, что SLO ухудшаются.

Мы разберем устойчивость, error budget, практику тестирования, управление прерываниями и операционной нагрузкой.
Ломаем
Чиним
Произошла авария. Сервис обработки платежей лег. Как действовать, чтобы восстановить работоспособность в минимальные сроки?

Мы организуем работу группы по ликвидации аварии: подключение коллег, оповещение интересантов (stakeholders), выстраивание приоритетов. Будем тренироваться под давлением в условиях предельно ограниченного времени.
Разберем подход к сайту с точки зрения SRE. Проанализируем инциденты (причины возникновения, ход устранения).

Примем решение по их дальнейшему предотвращению: улучшим мониторинг, изменим архитектуру, подход к разработке и эксплуатации, регламенты. Автоматизируем процессы.
Изучаем
Строим
Внутренние и внешние факторы начинают «портить» SLO
Incident response
Cмотрим на сайт и инциденты с точки зрения SRE
С чем предстоит работать
Вы будете поддерживать приложение, написанное на python, которое взаимодействует с базой данных MySQL для хранения информации. Оно будет развернуто микросервисной архитектурой на наших кластерах Kubernetes, к которым у вас будет доступ для решения проблем, возникших на инцидентах.
Это один из самых распространенных, простых и доступных языков программирования. Вы легко сможете разобраться в его коде и внести изменения, если это потребуются.
7 видеоуроков
5 командных кейсов
20
6
ч практики
встреч со спикерами
3 Q&A-сессии
45
ч итого
На изучение теории, работу в командах и общение со спикерами
15
ч теории
Видеокурс «Мониторинг в Grafana»
+ работа с дашбордами
3 практикума с кейсами
Шаг 1
Шаг 2
Встречаемся со спикерами и делимся на команды
Шаг 3
Шаг 4
Шаг 5
Шаг 6
Делаем домашние задания, получаем фидбек от эксперта
Изучаем видеоуроки и читаем теорию
Выполняем практические задания и решаем кейсы в командах, имитируем работу SRE
Разбираем практические задания и кейсы со спикерами +задаем вопросы
Сдаем все практические задания и получаем сертификат
Что мы ожидаем от вас
Без этих знаний обучаться будет трудно!
Будет большим плюсом, если вы:
  • Работали в кластере Kubernetes или просто знаете принципы работы
  • знаете, как работать в Grafana и Prometheus
  • умеете писать код на Python
  • Вы умеете читать код на Python
  • Знаете Linux на уровне администратора
  • Знание принципов работы Баз данных (любые: SQL, NoSQL, KeyVal)
Вступайте в наш канал Путь SRE
Если вы чувствуете себя неуверенно в работе с Kubernetes, вы можете дополнительно пройти подготовительный модуль.
Чтобы вы успели его пройти и подготовиться к обучению, рекомендуем занять место на курсе до 1 ноября
Павел Селиванов
Архитектор в Yandex Cloud
Опытный DevOps-инженер, автор курсов. В Yandex Cloud развивает Managed Kubernetes, Observability и Dev Tools. Спикер на конференциях: DevOops, DevOpsConf, Kuberconf и т. д.
Владимир Федорков
Эксперт в области высоких нагрузок
Регулярный докладчик на конференциях и митах. Десятки успешных проектов по подъему нагрузки в США, Европе и России
Павел Лакосников
Unit Lead ArchGovernance в Авито
Регулярный докладчик на конференциях и митапах. Фанат метрик
Максим Гусев
SRE в Dodo Engineering
Автор нескольких курсов по DevOps и его внедрению. 100+ инсталляций Kubernetes в продакшен. 1000+ выстроенных пайплайнов CI/CD
Сергей Бухаров
Infrastructure Platform Technical Lead в Dodo Engineering
Спикер конференций HighLoad, DevOps Live, DevOops и Podlodka Crew. Технический лидер Dodo Engineering, внедрение культуры SRE
Спикеры курса
Вы познакомитесь с основами архитектуры Kubernetes и её ключевыми компонентами. Вы узнаете, для чего нужны и как взаимодействуют основные объекты, такие как поды, репликасеты, деплойменты и сервисы.
17 ноября, пн – старт обучения. Открываем доступ к Telegram-чату потока
  • Подходы к мониторингу. Blackbox & Whitebox, 4 golden signals, RED, USE
  • Grafana, Prometheus & Alertmanager. Установка и настройка
  • Prometheus. Модель данных и типы метрик. Особенности мониторинга latency
  • Prometheus. PromQL
  • Grafana. Первый dashboard
  • Grafana. Tips & tricks
  • Alerting. Grafana vs Prometheus
  • Alerting. Тестирование
  • Обсудим цели и задачи курса
  • Расскажем, что такое SRE
  • Распределим студентов на команды
  • Monitoring и Observability
  • SLO, SLI, SLA
  • Error budget
  • Добавляем на дашборды SLO, SLI и Error budget (Первичная нагрузка)
  • Работаем с k8s, исправляем ошибки в коде, разбираем архитектуру приложения
  • SRE в других компаниях: как устроена работа с метриками
  • Ответы на вопросы по предыдущим темам
  • Обратная связь по домашнему заданию
  • Resiliencе Engineering и устройство команды
  • Инструменты варрума
  • Postmortem
  • Работаем в команде и устраняем проблемы в приложении, развернутом в Kubernetes кластере, на основе метрик
  • По окончании практики вы получите комплект шаблонов постмортемов
  • Работа с инцидентами, продом и прочие практики SRE
  • Ответы на вопросы по предыдущим темам
  • Health Check в Kubernetes
  • Exec probes
  • InitialDelaySeconds
  • Secondary Health Port
  • Sidecar Health Server
  • Headless Probe
  • Hardware Probe
  • Реализация Fail-fast подхода: учимся быстро выявлять проблемы и минимизировать их последствия
  • Реализация канареечных деплоев: работаем с Argo Rollouts и учимся деплоить с минимальным аффектом пользователей
  • Тренды и технологии, карьера и развитие в SRE
  • Ответы на вопросы по предыдущим темам
  • Подведение итогов и завершение обучения
Сертификат
Именной сертификат с индивидуальным номером получает студент, если:
  • прошёл 80% курса
  • посетил все 3 субботние практики
  • успешно сдавал домашние задания
В случае, если студент изучил 80% курса, но не выполнял домашние задания или не посетил все практики, вместо сертификата выдаётся свидетельство.
Этот курс может оплатить ваша компания
Если вы считаете, что знания, полученные на курсе, могут быть полезными на вашем текущем месте работы, оставляйте заявку с контактами компании в форме ниже или обсудите покупку курса с вашим руководителем. Как это организовать, что говорить и куда идти — написали здесь.
Как купить курс
старт 17 ноября
Стандарт
Мок интервью с экспертом
Помощь в подготовке к резюме и портфолио
Видеокурс «Мониторинг в Grafana»
Видеоуроки
Проверка домашних заданий экспертом
Командные практикумы и кейсы
Q&A-сессии со спикерами
Персональные сессии с экспертом и IT-рекрутером
Мок интервью с экспертом
Помощь в подготовке к резюме и портфолио
Персональные сессии с экспертом и IT-рекрутером
Поддержка от куратора группы
Чат-группы Телеграм со спикерами
Виртуальные стенды для практики
Подготовительный модуль по Kubernetes
в рассрочку на 4 месяца или 60 000 ₽ единовременно
15 000 ₽/мес
Написать нам
В 75% случаев обучение готова оплатить компания. Напишите нам, и мы поможем.
Курс за счёт работодателя
Написать нам
Узнать про вычет
Узнать про вычет
Предоставим все необходимые документы для получения вычета.
Налоговый вычет 13%
старт 17 ноября
Карьера
Видеокурс «Мониторинг в Grafana»
Подготовительный модуль по Kubernetes
Видеоуроки
Проверка домашних заданий экспертом
Командные практикумы и кейсы
Q&A-сессии со спикерами
Виртуальные стенды для практики
Чат-группы Телеграм со спикерами
Поддержка от куратора группы
в рассрочку на 4 месяца или 100 000 ₽ единовременно
25 000 ₽/мес
Налоговый вычет 13%
Предоставим все необходимые документы для получения вычета.
Узнать про вычет
Написать нам
Курс за счёт работодателя
В 75% случаев обучение готова оплатить компания. Напишите нам, и мы поможем.
Написать нам
Узнать про вычет
Рассрочка
только для физических лиц
Условия рассрочки:
Процесс оформления:
Командное предложение
от 10 человек
специальные условия
от 5 человек
-10%
от 3 человек
-7%
Перейти
Выгодно и быстро обучим целые команды. Единоразовое оформление и быстрый доступ к курсам.
Универсальные доступы
Перейти
Перейти
Перейти
Подарите своему сотруднику скидку или курс целиком. А мы упакуем ;)
Подарочный сертификат
старт 17 ноября
Стандарт
Мок интервью с экспертом
Помощь в подготовке к резюме и портфолио
Видеокурс «Мониторинг в Grafana»
Видеоуроки
Проверка домашних заданий экспертом
Командные практикумы и кейсы
Q&A-сессии со спикерами
Персональные сессии с экспертом и IT-рекрутером
Мок интервью с экспертом
Помощь в подготовке к резюме и портфолио
Персональные сессии с экспертом и IT-рекрутером
Поддержка от куратора группы
Чат-группы Телеграм со спикерами
Виртуальные стенды для практики
Подготовительный модуль по Kubernetes
100 000 ₽
старт 17 ноября
Карьера
Видеокурс «Мониторинг в Grafana»
Подготовительный модуль по Kubernetes
Видеоуроки
Проверка домашних заданий экспертом
Командные практикумы и кейсы
Q&A-сессии со спикерами
Виртуальные стенды для практики
Чат-группы Телеграм со спикерами
Поддержка от куратора группы
130 000 ₽
Подарочный сертификат
Подарите своему сотруднику скидку или курс целиком. А мы упакуем ;)
Перейти
Перейти
Универсальные доступы
Выгодно и быстро обучим целые команды. Единоразовое оформление и быстрый доступ к курсам.
Перейти
Перейти

Часто задаваемые вопросы

Кастомизируем курс для вашей компании
Если ваша задача — обучить больше 30 сотрудников, мы готовы предложить вашей компании корпоративный формат обучения или адаптировать обучение под вас
Пример корпоративного обучения по Kubernetes для сотрудников Тинькофф банка →
Нужна консультация?
задайте нам свой вопрос