AWS re:Invent 2025: Bedrock, agentes y los servicios de IA que tu empresa puede usar ya
Cerró re:Invent 2025 en Las Vegas con la sensación de que AWS está jugando un juego más maduro: menos servicios nuevos por el gusto de anunciar, más profundidad en lo que ya existe, especialmente en IA. La narrativa fue clara desde la keynote de Matt Garman el martes: el siguiente paso es mover proyectos de IA del piloto al production-grade, y AWS quiere ser la plataforma donde eso pase.
En este artículo destilamos lo que importa para una empresa mediana mexicana, separamos los anuncios estructurales de los anuncios decorativos y proponemos un orden de adopción razonable para el primer semestre de 2026.
Bedrock: la apuesta consolidada de AWS en IA
Bedrock fue protagonista, como esperábamos. Las novedades más sustantivas:
- Catálogo ampliado de modelos. Anthropic Claude Opus 4.5 y Sonnet 4.5 disponibles en más regiones, modelos nuevos de Mistral, integración de modelos abiertos como DeepSeek y Llama 4, y nueva familia Amazon Nova mejorada con foco en multimodal y razonamiento.
- Bedrock AgentCore en GA. El framework managed para construir agentes con orquestación multi-paso, memoria persistente, llamadas a herramientas y guardrails integrados. Es la respuesta directa a lo que en Azure se está construyendo con Copilot Studio y en Google con Vertex AI Agent Builder.
- Bedrock Knowledge Bases con mejoras serias en ingestión, soporte para gráficos de conocimiento y mejor integración con S3 Vectors (otro anuncio relevante).
- Bedrock Evaluations maduradas: ahora se puede hacer evaluación automatizada de respuestas con métricas configurables, comparación entre modelos y reportes para auditoría.
- Bedrock Guardrails suma protecciones específicas para prompt injection, denegación de servicio por costo y filtros de PII más finos.
Para empresas medianas, lo importante: el camino de "construir un asistente serio sobre datos propios" ahora es razonablemente directo dentro de AWS si ya vives ahí. La calidad del stack alcanzó la de competidores.
S3 Vectors y la base de datos vectorial nativa
Uno de los anuncios con mayor impacto operativo: S3 Vectors, almacenamiento vectorial nativo en S3 con costo significativamente menor que servicios de vectores dedicados. Para casos RAG con grandes volúmenes de documentos pero baja frecuencia de queries, puede reducir el costo de la capa vectorial entre 60% y 80% comparado con OpenSearch o pgvector escalado.
No reemplaza a soluciones dedicadas para casos de muy alta concurrencia, pero abre la puerta a casos que antes no eran rentables.
Compute: Trainium 3 y Graviton5
- Trainium 3 disponible en instancias trn3, con mejoras sustantivas en throughput por dólar versus H100 para entrenamiento e inferencia de modelos grandes. AWS dice 4x performance versus Trainium 2.
- Graviton5 en familias r8g, m8g, c8g con mejoras de 30% en performance por watt versus Graviton4. Para cargas portables a ARM, ahorro real.
- EC2 con instancias UltraServer para cargas de IA distribuidas, agrupando hasta 64 chips en topología de red de baja latencia.
Para la mayoría de empresas medianas, el anuncio de Graviton5 es el que tiene impacto inmediato: migrar workloads compatibles puede reducir costo de compute entre 15% y 25%.
Datos: Aurora, DSQL y SageMaker Lakehouse
- Aurora DSQL en GA general en más regiones (incluyendo más de LATAM). La base relacional distribuida activa-activa de AWS. Para casos de multi-región con escritura simultánea es un cambio importante.
- SageMaker Unified Studio en GA: un solo entorno para data engineering, ML y analytics. Reduce fricción entre equipos data.
- Amazon Q in QuickSight mejora con generación de dashboards desde lenguaje natural y mejor integración con datos en Lakehouse.
- OpenSearch suma capacidades de hybrid search (vectorial + textual) y mejor performance para casos RAG.
Seguridad y gobernanza
- GuardDuty Extended Threat Detection ahora cubre amenazas específicas a workloads de IA: detección de exfiltración por agentes, anomalías en uso de Bedrock, prompt injection a nivel cuenta.
- IAM Access Analyzer con razonamiento automatizado para detectar permisos demasiado amplios usando análisis formal.
- Security Hub Advanced simplifica la postura de seguridad con vista unificada y priorización con ayuda de IA.
- AWS Backup con mejoras para cargas de IA, incluyendo modelos custom en Bedrock.
Región México: el anuncio que esperábamos
AWS confirmó en re:Invent que la AWS Mexico (Central) Region, con tres zonas de disponibilidad, está operativa y abierta a clientes generales. La región fue anunciada originalmente en 2024 con apertura prevista para finales de 2025 y se concretó en este re:Invent. Para empresas mexicanas en sectores con requisitos de localidad de datos (banca, gobierno, salud, ciertos retail) es un cambio estructural.
Implicaciones inmediatas:
- Compliance: datos pueden permanecer en territorio nacional sin acuerdos especiales.
- Latencia: mejora notable para usuarios finales en México vs. servir desde us-east-1 o us-west-2.
- DR doméstico: posibilidad de arquitectura multi-AZ en territorio nacional sin depender de regiones extranjeras como secundarias.
Recomendamos a clientes con compliance estricto evaluar migración parcial durante 2026, no como Big Bang sino por servicio.
Top 5 anuncios que importan a empresa mediana
Si tuviéramos que elegir cinco anuncios para priorizar evaluación en el primer semestre de 2026:
- Región AWS México. Si tienes compliance o latencia como prioridad, evalúa qué cargas migrar.
- Bedrock AgentCore. Si ya tienes un caso de RAG o asistente interno, ahora hay un camino managed serio.
- S3 Vectors. Si gastas mucho en una base vectorial, reevalúa la economía.
- Graviton5. Migración técnica de bajo riesgo con ahorro inmediato si tu stack es portable.
- GuardDuty para IA. Si ya operas workloads de Bedrock, activarlo es low-effort y cierra gaps reales.
Lo que recomendamos no hacer
Algunos patrones que ya empezamos a ver y conviene resistir:
- Migrar todo a la región México de golpe. Una región nueva tiene menos servicios disponibles inicialmente y curva de aprendizaje operativa. Migración por capas, empezando por entornos no críticos.
- Reescribir aplicaciones existentes a AgentCore. Si tu agente actual funciona, no hay urgencia. AgentCore tiene sentido para nuevos proyectos o cuando llegues al límite de tu solución actual.
- Adoptar Trainium 3 sin caso real. Es hardware enterprise para entrenamiento serio. Para inferencia ocasional o fine-tuning ligero, sigue siendo más sencillo usar APIs.
- Cambiar bases vectoriales en producción sin tests de performance bajo tu carga real.
Plan de adopción razonable para Q1 2026
Para una empresa mediana mexicana ya en AWS, este es el ritmo que recomendamos:
- Enero: evaluación de la región México para 1 a 2 cargas candidatas. Pilot de Bedrock AgentCore en un caso interno (asistente IT, helpdesk, FAQ).
- Febrero: prueba de Graviton5 en staging para servicios candidatos. Activar GuardDuty Extended.
- Marzo: primer despliegue productivo de un agente con AgentCore. Decisión sobre S3 Vectors basada en datos reales.
La lectura larga
re:Invent 2025 confirmó que AWS dejó atrás la fase de "todo es preview" en IA y entró en operación seria. Para empresas medianas, el momento es ahora: hay caminos managed maduros para la mayoría de casos comunes, hay región nacional para los que tenían compliance como bloqueo, y hay opciones de costo que finalmente hacen rentable correr cargas de IA propias. La diferencia entre quien aprovecha esto y quien no va a ser, otra vez, la disposición a planear y experimentar con disciplina, no el presupuesto.
¿Quieres aterrizar lo nuevo de Bedrock en tu empresa? Conversemos. Agenda una sesión de 30 minutos y diseñamos contigo un plan concreto de adopción priorizado por impacto y riesgo.