Hot Sale 2023 (29 may - 6 jun): pre-flight para escalar tu infraestructura sin colapsar
La AMVO confirmó que Hot Sale 2023 corre del 29 de mayo al 6 de junio, nueve días en lugar de los siete tradicionales. La edición pasada movió poco más de 23 mil millones de pesos según reportes de la propia asociación, y todo indica que esta edición va a superar esa marca con holgura, empujada por una base de compradores en línea que sigue creciendo y por marcas que están tratando el evento como su tercer pico anual junto con Buen Fin y Navidad.
Si tu equipo ya ha pasado un Hot Sale o un Buen Fin con caídas de checkout, latencias inaceptables o procesos de devolución desbordados, sabes que el costo de no estar listo es mayor que la inversión de prepararse. Este es el pre-flight que recomendamos correr en las próximas tres semanas.
El estado real de tu plataforma hoy
Antes de listar acciones, hay que aterrizar la foto actual. La pregunta no es "¿cuánta carga aguanta la plataforma?", es "¿cuánta carga aguanta el componente más débil de la cadena de checkout completa?".
La cadena suele ser: CDN, frontend, API, autenticación, catálogo, carrito, checkout, pasarela de pagos, antifraude, sistema de inventario, ERP, correo transaccional. Una falla en cualquier eslabón tira la conversión. La infraestructura más cara escalada de un lado no compensa un cuello de botella del otro.
Las 10 acciones de las próximas tres semanas
Lo que ordenamos en pilotos de e-commerce mediano antes de cada Hot Sale.
1. Pruebas de carga realistas
No alcanza con probar el endpoint del catálogo. Hay que simular flujos completos de compra con herramientas como k6, Artillery o Locust, replicando proporción real de navegación, búsqueda, agregar al carrito y checkout. Apuntar al doble del pico esperado, no al pico exacto.
2. Autoescalado afinado
Auto Scaling Groups en AWS o equivalentes en otras nubes deben estar configurados con métricas que reaccionen rápido. CPU al 70 por ciento es tarde para el pico inicial; conviene escalar por número de peticiones por instancia o por latencia p95. Y warm-up de instancias antes del evento, no en el momento.
3. Réplica de lectura en base de datos
El catálogo y la búsqueda generan el grueso de las lecturas. Una réplica de lectura en RDS, Aurora o el equivalente, con la aplicación dirigiendo lecturas a la réplica y escrituras al primario, libera al primario para el flujo crítico de checkout.
4. CDN agresivo
Páginas de producto, listados, imágenes y assets estáticos cacheados en CloudFront, Cloudflare o Akamai con TTL adecuado. El objetivo es que el origen vea solo tráfico que realmente requiere lógica de negocio.
5. Eliminar cold starts en serverless
Si tienes Lambdas en el camino crítico, configurar concurrencia provisionada para los handlers de checkout y pago. Un cold start de 800 ms en el momento equivocado pierde ventas.
6. Cola para procesos no críticos
Confirmaciones por correo, generación de PDFs, sincronización con ERP, actualización de inventario para canales secundarios: nada de eso debe bloquear la respuesta al usuario. Cola con SQS, RabbitMQ o equivalente, y procesamiento asíncrono.
7. Circuit breakers en integraciones externas
Pasarela de pagos, antifraude, mensajería, integraciones con marketplaces. Si alguno se degrada, tu plataforma debe degradarse con elegancia, no caerse. Patrones de circuit breaker y timeouts agresivos.
8. Antifraude calibrado y stock con reserva
El fraude se dispara en Hot Sale. Reglas de antifraude revisadas y un proceso ágil para revisar falsos positivos. En inventario, lógica de reserva temporal mientras se completa el pago, para evitar overselling.
9. Observabilidad en vivo
Dashboards específicos del evento con conversión por minuto, latencia p95 y p99 de los endpoints críticos, errores 5xx, ratio de checkout completado. Alertas dirigidas al equipo de guardia, no a un buzón general.
10. Runbook de respuesta a incidentes
Antes del 28 de mayo, documento corto con los cinco escenarios más probables y los tres primeros pasos de cada uno. Quién decide degradar funcionalidades, quién comunica al cliente, quién habla con la pasarela de pago. Practicado al menos una vez con el equipo.
Durante el evento
Los nueve días requieren coordinación distinta a operación normal. Una guardia con turnos definidos, una sala de chat dedicada al evento, un canal de comunicación con marketing y customer service para alinear mensajes, y una bitácora de incidentes que sirva para el post-mortem.
Comunicar al cliente cuando algo falla es subestimado. Un banner honesto que diga "estamos atendiendo un alto volumen, los pagos pueden tardar más de lo normal" salva conversiones y reputación más que pretender que nada pasa.
Cuidar el bill
Escalar agresivo cuesta. Para que el costo no se desborde, presupuestos de AWS Budgets activados con alertas al 50, 80 y 100 por ciento del esperado. Etiquetas de costo específicas del evento para poder medir después con precisión cuánto costó cada peso de venta extra. Y reglas claras de cuándo escalar manualmente y cuándo no.
Después del 6 de junio
El Hot Sale termina pero el trabajo serio empieza ahí. Post-mortem honesto en la primera semana de junio, métricas comparadas contra 2022, lista de los tres ajustes prioritarios para Buen Fin de noviembre. Las empresas que tratan cada temporada como aprendizaje compuesto llegan a Navidad con una plataforma cualitativamente distinta.
¿Quieres una revisión rápida de tu setup pre-Hot Sale? Te ayudamos. En ALCA hacemos un assessment de cuatro horas con tu equipo técnico que entrega los cinco riesgos prioritarios y un plan de mitigación. Agenda la revisión antes del 20 de mayo.