Проекты:

Чёрная пятница без падений: гиперскейлинг для онлайн-ритейла

В 2024-м владелец крупного маркет-плейса попросил «сайт без обморока» на Чёрную пятницу. Годом ранее 12 000 RPS обрушили монолитную Java-платформу: корзины зависали, оплата обрывалась, репутация упала. Мы подготовили новую архитектуру за три месяца и доказали, что пиковая распродажа может пройти без единого «ой».

1. Раздробить монолит до распродажи

Главная боль — единственный сервис, где хранились каталог, корзина и платёжные сценарии. Мы выделили шесть микросервисов (каталог, корзина, ценообразование, промокоды, заказ, платёж) на Spring Boot и Go. Фронт перенесли на Vue 3 SSR: SEO не пострадал, а статические бандлы отдаются через CDN VK Cloud.

2. Автоскейлинг Kubernetes, который реально работает

Кластер развёрнут в Yandex Cloud; HPA и VPA считывают метрики Prometheus Adapter. Служебная метрика — p95 latency, а не CPU: если отклик превышает 250 мс, добавляются поды. «Тепловой» пул узлов (8 vCPU, 16 GB) готов к быстрому масштабированию; «холодный» поднимается за 90 секунд.

3. Кэш, очередь и база — каждому своё

Сессии пользователей и flash-sale таймеры перешли в Redis Cluster (трёхшардовый, репликация AOF). Запросов к PostgreSQL стало на 67 % меньше. Заказ и оплата идут через Kafka; offset-commit подтверждается после записи в Postgres и успешного вызова платёжного шлюза, что исключило «двойные» списания.

4. CDN и граница сети

CDN-каскад внутри страны сократил загрузку карточки товара до 0,8 с с медиа и графикой. Для динамики использовали geobalancer Layer7 → трёхуровневое кеширование Nginx → Origin. От DDoS спас geo-rate-limit и заранее купленная полоска от РТК.

5. Ночь распродажи: цифры

Пик достиг 58 600 RPS, отклик API — 180 мс, процент ошибок 5xx — 0,08. HPA нарастил кластер до 220 подов, через два часа уменьшил до 45. Средний чек вырос на 18 %, а инфраструктура стоила на 35 % дешевле предыдущего года за счёт pay-per-second биллинга.

6. Что важно запомнить

Секрет не в «магическом» железе, а в подготовке: разделить монолит, автоматизировать скейлинг по бизнес-метрике и тренировать инфраструктуру под реальной нагрузкой. Тогда маркетинг может обещать минус 90 %, а техдиректор спокойно спит в самую продажную ночь года.