System Design. HighLoad ML-инфраструктура для 100к+ запросов

Бесплатный воркшоп для системных аналитиков, посвящённый архитектуре высоконагруженных рекомендательных систем. Мы спроектируем систему, способную обрабатывать 100 000 запросов в секунду с гарантированным временем ответа.

ИТ и интернет 16+

Формат: Теория → Практика → Обсуждение на каждом этапе

Ведущий: Иван Синицын, руководитель подгруппы разработки рантайма рекомендаций, Ozon Tech

 

План воркшопа

Требования и ограничения
— Сбор функциональных и нефункциональных требований
— Бюджетирование задержки для P99 < 200 мс
— Определение строгих SLA/SLO для системы

Проектирование онлайн-компоненты
— Многоэтапный пайплайн: обогащение контекстом → генерация кандидатов → ранжирование
— Two-Tower модели и векторный поиск для быстрого подбора кандидатов
— Двухуровневое ранжирование: легкие и тяжелые модели
— Распределение бюджета задержки по этапам пайплайна

ML-инфраструктура и фичи
— Feature Store: единый источник фичей для онлайн и оффлайн
— CI/CD для ML-моделей в production
— Feedback Loop: потоковая обработка кликов и показов для обновления в реальном времени

Хранилище, отказоустойчивость и мониторинг
— Многоуровневое хранение: горячий кэш (Redis/Valkey) и холодное хранилище
— Стратегии шардирования и репликации для 100к RPS
— Механизмы защиты: Fallbacks, Circuit Breakers, Rate Limiting
— Проектирование отказоустойчивой архитектуры

System Design. HighLoad ML-инфраструктура для 100к+ запросов
9 дней назад
6 декабря 10:00–13:00

Событие пройдет онлайн

Уже есть билет
Ссылка на онлайн-событие рассылается за час до его начала.
Получить ссылку

Поделиться:

Связь с организатором

На этот адрес придёт ответ от организатора.

По номеру с вами свяжется организатор

Подпишитесь на рассылку организатора

Возврат билета

Если вы хотите вернуть билеты, вы можете сделать это по ссылке из письма с билетами или оформить запрос организатору в вашем  личном кабинете.

Подробнее о возврате билетов