Научитесь строить отказоустойчивый кластер без тонны документации. Разберётесь, как Kafka работает изнутри, чтобы предотвращать инциденты и держать систему стабильной под нагрузкой
Чтобы убедиться, что курс вам подходит, — проконсультируйтесь с менеджером
Итоговый проект
Вы развернёте полноценный кластер из трёх брокеров, настроите мониторинг через Prometheus и Grafana, запустите тестовые клиенты и проведёте chaos-тестирование.
С помощью Trogdor симулируете падения брокеров, разрывы сети и рост задержек: научитесь анализировать метрики, искать узкие места и составлять disaster-recovery план для настоящего боевого кластера.
Администрирование и отказоустойчивость Kafka (ZooKeeper или kraft)
2
Приложение в реальном времени обрабатывает платежи из Kafka. Оно фильтрует успешные транзакции, агрегирует статистику по минутам и отправляет результаты в отдельный топик.
В процессе вы познакомитесь с обработкой потоков, окнами, exactly-once семантикой и тонкостями работы с временем в распределённых системах.
Реальное потоковое приложение
1
Cпикеры курса
Василий Калугин
Эксперт Kafka, Страховой дом ВСК
5 лет опыта работы с продуктовыми кластерами Kafka
Постоянно глубже погружаюсь в мир Kafka, чтобы понимать её механизмы
Пишет инфраструктурные сервисы на go, которые добавляют хранилищам новые возможности (например, очереди поверх Kafka)
Подробнее о спикере
Александр Миронов
Infrastructure Engineer в Stripe, ex-Booking
Опыт командной разработки в компаниях 2ГИС и Lingualeo
Создавал мобильную версию сайта Booking.com
Автор
4 года возглавлял инфраструктурную команду разработки внутренних сервисов стриминга данных в Booking.com
Подробнее о спикере
Всеволод Севостьянов
Staff engineer в Lokalise
Специализируется на построении high-throughput systems (от 20К запросов в секунду)
С командой поддерживает несколько сотен клиентов, имеющих свои собственные инстансы
Автор и спикер
Отвечает за пайплайны и deployment, а также за менторство разработчиков в разрезе CI/CD
Сочетает в себе сильные технические знания с более чем 5-летним опытом управления командой
Подробнее о спикере
Всеволод Севостьянов
Staff engineer в Lokalise
Специализируется на построении high-throughput systems (от 20К запросов в секунду)
С командой поддерживает несколько сотен клиентов, имеющих свои собственные инстансы
Отвечает за пайплайны и deployment, а также за менторство разработчиков в разрезе CI/CD
Сочетает в себе сильные технические знания с более чем 5-летним опытом управления командой
Александр Миронов
Infrastructure Engineer в Stripe, ex-Booking
Опыт командной разработки в компаниях 2ГИС и Lingualeo
Создавал мобильную версию сайта Booking.com
4 года возглавлял инфраструктурную команду разработки внутренних сервисов стриминга данных в Booking.com
Анатолий Солдатов
Data Engineer в Unity
Работал PostgreSQL DBA/Developer
Много работает с Kafka, Zookeeper и ClickHouse
Пишет инфраструктурные сервисы на go, которые добавляют хранилищам новые возможности (например, очереди поверх Kafka)
Василий Калугин
Эксперт Kafka, Страховой дом ВСК
4+ года опыта разработки и администрирования геораспределённого кластера Kafka
Создание комьюнити Kafka в компании и регулярные обучения разработчиков
Разработчик курсов и спикер Слёрм
Примеры заданий
63 часа практики и работы со стендами
Мы предоставляем инфраструктуру для выполнения практических заданий на учебных стендах
Программа
7 часов практики
4 со спикерами
5
4
онлайн встреч
часа
на выполнение итогового проекта
63 часа практики
73
часа всего
10 часов теории
10
часов в неделю
3 часа теории
1 установочная
Шаг 1
Смотрим видео с теорией
Шаг 2
Шаг 3
Шаг 4
Шаг 5
Делаем практические задания на стендах в личном кабинете
Обсуждаем задания в чате с другими участниками
Встречаемся со спикерами и задаём вопросы
Сдаём итоговую практическую работу
Подготовка
введение
Основные термины Kafka
Время жизни сообщений
Offset: позиция сообщения в топике
Принципы работы Kafka
Топик, партиция, ключ
Producer, Consumer, Consumer-груп
Введение в Apache Kafka
тема 1
1.1. Введение. Как эффективно учиться на курсе? 1.2. Актуальность технологии: что такое Apache Kafka и где она используется? 1.3. История создания 1.4. Примеры использования в крупных компаниях 1.5. Резюме вводного модуля
Архитектура и базовые термины Kafka
тема 2
2.1. Введение: Kafka vs. Message Queues 2.2. Структура данных: топики, партиции, офсеты 2.3. Consumer groups 2.4. Обзор Apache Zookeeper 2.5. Новинка: протокол KRaft 2.6. Резюме урока
Установка и работа с кластером из одного брокера
тема 3
3.1. Введение и подготовка окружения 3.2. Практика: Запуск Kafka на основе ZooKeeper 3.3. Практика: Запуск Kafka с использованием KRaft 3.4. Практика: Запись и чтение сообщений 3.5. Topic Retention (хранение данных) 3.6. Структура партиции на диске 3.7. Log Compaction (сжатие логов) 3.8. Практика: Изучение метаданных в ZooKeeper 3.9. Практика: Просмотр метаданных в кластере KRaft 3.10. Резюме урока
Клиентские библиотеки
тема 4
4.1. Введение 4.2. Producer API 4.3. Consumer API 4.4. Transactions и семантика Exactly-Once 4.5. Резюме урока 4.6. Практика: Симуляция потери данных и Exactly-Once
Отказоустойчивость кластера в рамках одного дата-центра
тема 5
5.1. Введение 5.2. Как сломать кластер (на основе ZooKeeper) 5.3. Как сломать кластер на KRaft 5.4. Репликация данных 5.5. Контроллер в архитектуре с ZooKeeper 5.6. Понятие контроллера в KRaft 5.7. Бэкапы и полезные практики 5.8. Бэкапы метаданных в KRaft 5.9. Ограничения одного дата-центра 5.10. Резюме урока 5.11. Практика: Конфигурация брокеров и симуляция сбоев
Работа с распределенным кластером
тема 6
6.1. Введение 6.2. Когда нужны несколько дата-центров? 6.3. Stretched кластер (на основе ZooKeeper) 6.4. Распределённый кластер KRaft 6.5. Асинхронный кластер и репликаторы 6.6. Особенности работы в двух дата-центрах 6.7. Резюме урока 6.8. Практика: Работа с распределенным кластером
Мониторинг
тема 7
7.1. Введение 7.2. Основные метрики для мониторинга 7.3. SLI/SLO для Kafka 7.4. Резюме урока 7.5. Практика: Настройка мониторинга (JMX Exporter, Prometheus, Grafana)
Анализ производительности
тема 8
8.1. Введение 8.2. Терминология производительности 8.3. Почему Kafka такая быстрая? 8.4. Инструменты для бенчмаркинга 8.5. Резюме урока 8.6. Практика: Producer & Consumer Benchmark
Поддержка и траблшутинг
тема 9
9.1. Введение 9.2. Балансировка нагрузки в кластере 9.3. Обновление версии кластера и клиентов 9.4. Утилиты для траблшутинга 9.5. Истории сбоев из жизни 9.6. Резюме урока 9.7. Практика: Типовые задачи администратора 9.8. Дополнительная практика
Защита Кафки
тема 10
10.1. Обзор механизмов безопасности (ACL, SASL, SSL)
Итоговый проект
тема 11
11.1. Итоговый проект: Развертывание и администрирование кластера 11.2. Заключение и благодарность
Рассрочка
только для физических лиц
Условия рассрочки:
Процесс оформления:
Сертификат
Именной сертификат с индивидуальным номером получает студент, если:
прошёл 80% курса
принимал участие в решении практик, которые входят в курс
успешно сдал итоговое задание/проект/сертификацию.
В случае, если студент изучил 80% курса, но не выполнил или не сдал финальное задание, вместо сертификата выдаётся свидетельство.
Этот курс может оплатить ваша компания
Если вы считаете, что знания, полученные на курсе, могут быть полезными на вашем текущем месте работы, оставляйте заявку с контактами компании в форме ниже или обсудите покупку курса с вашим руководителем. Как это организовать, что говорить и куда идти — написали здесь.
Как купить курс
старт 23 марта 2026
Эксперт
Видеоуроки, доступ 2 года
Практические задания
Встреча с экспертами
Чат со студентами и спикерами
в рассрочку на 4 месяца или 65 000 ₽ единовременно