FinOps en la nube para empresas mexicanas: cómo bajar 30% del bill sin tocar el rendimiento

FinOps en la nube para empresas mexicanas: cómo bajar 30% del bill sin tocar el rendimiento

El bill de la nube está apretando a casi todos los clientes con los que trabajamos este 2024. Tres factores se sumaron al mismo tiempo: el dólar pegado a 17 pesos, los servicios de IA con precios premium, y los hyperscalers ajustando precios al alza después de años de relativa estabilidad. La consecuencia es que un bill que el año pasado se aceptaba sin demasiado escrutinio, este año pesa el doble en pesos.

La buena noticia, por contradictorio que suene, es que casi todo bill mediano tiene entre 25% y 35% de grasa identificable. Hemos visto esa cifra repetirse en auditorías a empresas yucatecas, fintechs en CDMX, retailers regionales y SaaS B2B. La pregunta no es si hay grasa; la pregunta es cómo cortarla sin frenar al equipo de ingeniería.

Este es el marco FinOps de 90 días que aplicamos en ALCA y que pueden ejecutar en su propia organización.

Por qué FinOps se volvió mainstream en 2024

Hasta hace dos años, "FinOps" sonaba a buzzword opcional. En 2024 se volvió mainstream por tres razones convergentes: la inflación que erosiona márgenes, el dólar fuerte que infla servicios cobrados en USD, y los costos de IA generativa que pueden crecer sin control si nadie los gobierna.

FinOps no es un equipo nuevo ni un software nuevo. Es una práctica continua de gobernanza financiera de la nube que pone en la misma mesa a ingeniería, finanzas y operaciones.

Los primeros 15 días: inventario y tagging

Antes de optimizar nada, hay que ver. La queja más frecuente que escuchamos es "no sé exactamente quién está gastando qué". Eso se resuelve con tagging serio.

Días 1-7: inventario. Listar todos los recursos por cuenta y región. AWS Cost Explorer, GCP Cost Management o Azure Cost Management son suficientes para arrancar. Herramientas como Vantage, Komiser o Cloudability dan una capa más amigable si el bill es complejo y hay múltiples cuentas.

Días 8-15: política de tagging. Tres tags mínimos en todos los recursos nuevos y retroactivos:

  • Environment: prod, staging, dev, sandbox.
  • Owner: equipo o producto responsable.
  • CostCenter: centro de costo contable o cliente final si aplica.

Aplicar tagging retroactivo a recursos viejos es tedioso pero crítico. Las herramientas como AWS Resource Groups Tagging API o Cloud Custodian ayudan a automatizar. Sin tagging, cualquier optimización se queda en "el bill bajó algo, no sabemos qué".

Días 15-45: quick wins (donde sale el primer 15-20%)

Aquí salen los ahorros rápidos, sin reestructurar arquitectura. Las cinco intervenciones que hemos visto pagar mejor:

1. Apagar instancias huérfanas. Servidores encendidos que nadie usa: viejos sandboxes, ambientes de prueba abandonados, recursos de demos. Una auditoría con AWS Trusted Advisor o GCP Recommender suele encontrar entre 5% y 15% del compute apagable de inmediato.

2. Lifecycle policies en S3 / GCS / Blob Storage. Datos viejos que no requieren acceso frecuente deben moverse a tiers más baratos: S3 Standard a Intelligent-Tiering o Glacier, GCS Standard a Nearline/Coldline. Una sola política bien diseñada puede recortar 30% a 70% del costo de storage.

3. Rightsizing de instancias. Buscar instancias con CPU promedio menor a 20% durante 14 días y bajar de tier. La regla práctica: nadie debe pagar una m5.4xlarge si una m5.xlarge bastaba.

4. NAT Gateway redesign. Uno de los costos invisibles más comunes en AWS. Tráfico entre zonas de disponibilidad y a S3 cobrado a precio de NAT Gateway. Soluciones: VPC Endpoints para S3 y DynamoDB (gratis), arquitectura multi-AZ revisada para minimizar cross-AZ.

5. Volúmenes EBS / discos persistentes huérfanos. Discos que sobrevivieron a las VMs que los usaron. Un script de limpieza mensual evita que se acumulen. Lo mismo para snapshots viejos sin política de retención.

Estas cinco intervenciones, aplicadas en las primeras 6 semanas, suelen entregar entre 15% y 20% de ahorro sin tocar arquitectura ni ralentizar al equipo.

Días 45-90: compromisos, arquitectura y cultura

Aquí entra la segunda capa de ahorro, la que requiere más decisión y compromiso pero entrega 10% a 15% adicional.

Reservas y compromisos

Reserved Instances, Savings Plans (AWS), Committed Use Discounts (GCP), Reservations (Azure). El descuento por compromiso a 1 o 3 años va de 30% a 60% sobre on-demand. La regla operativa: nunca comprometerse al 100% del baseline; quedarse en el 60% a 80% del baseline estable y dejar el resto on-demand para flexibilidad.

Para Compute Savings Plans (AWS), conviene cubrir EC2, Fargate y Lambda al mismo tiempo si hay mezcla.

Arquitectura serverless donde aplica

Lambda, Cloud Run, Azure Functions cobran por ejecución y se apagan solos. Para cargas con tráfico irregular, la migración a serverless puede recortar 50% o más del costo de cómputo. No aplica a todo (cargas con CPU sostenida pesada siguen siendo más baratas en VMs reservadas) pero conviene mapear candidatos.

Cultura: el ingrediente que define si dura

La parte que más fallamos como industria es la cultural. La optimización inicial sale rápido; mantenerla requiere proceso continuo. Lo que vemos funcionar:

Dashboard de costos visible al equipo. No solo a finanzas. Cada equipo de producto debe ver su propio costo mensual y la tendencia.

Alertas presupuestarias. Threshold del 50%, 75% y 100% del presupuesto mensual por centro de costo. AWS Budgets, GCP Budget Alerts y Azure Cost Management lo hacen de fábrica.

Revisión mensual de 30 minutos. Reunión corta entre finanzas, ingeniería líder y operaciones. Tres preguntas: ¿gastamos lo que esperábamos?, ¿qué se desvió y por qué?, ¿qué corregimos este mes?

Costo en la definición de arquitectura. Cuando se diseña un nuevo servicio, incluir un estimado de costo mensual junto con los requerimientos funcionales. La pregunta "¿cuánto va a costar correr esto?" debe ser tan natural como "¿qué SLA va a tener?".

Trampa común: volverse el enemigo de ingeniería

El error que destruye programas FinOps es convertirse en el departamento del "no". Recomendamos celebrar ahorros públicamente sin asignar culpas, permitir buen gasto cuando se justifica (consciente y dimensionado), y diferenciar deuda financiera de deuda técnica: a veces gastar más ahora evita pagar mucho más después.

Lo que esperar realísticamente

A 90 días bien ejecutados, una empresa mediana mexicana que nunca había hecho FinOps suele lograr entre 25% y 35% de reducción del bill mensual sin frenar producto.

A 12 meses, la curva se aplana: las grandes optimizaciones ya se hicieron, y el ahorro pasa a ser de 5% a 10% año contra año mientras el equipo sigue creciendo. La meta cambia de "bajar el bill" a "que el bill crezca más despacio que el negocio".

FinOps no es un proyecto. Es una capacidad continua. Las empresas que la instalan en 2024 entran a 2025 con costos bajo control y libertad para apostar fuerte en IA, escalar producto o aguantar bien una temporada baja.


Descarga la plantilla: 90 días de FinOps. Solicita el material y te enviamos el checklist completo más una sesión de 30 minutos para aterrizarlo a tu caso.

Artículos relacionados