Google Cloud Next 2025: Gemini 2.5, Vertex AI Agents y novedades para empresas

Google Cloud Next 2025: Gemini 2.5, Vertex AI Agents y novedades para empresas

Google Cloud Next 2025 se realizó la semana pasada en Las Vegas y, a diferencia de otros años, el mensaje no fue ambiguo: Google quiere disputarle a Microsoft y AWS el mercado empresarial de IA, y trae artillería para hacerlo. Gemini 2.5 Pro, Vertex AI Agent Builder, Sovereign Cloud disponible en más regiones, TPUs Trillium en producción y un rediseño profundo del pricing.

En este resumen filtramos el ruido y nos quedamos con lo que importa para una empresa mediana en México: qué adoptar primero, qué esperar y qué dejar madurar.

Gemini 2.5 Pro: el modelo que pone presión real al mercado

Gemini 2.5 Pro entró en disponibilidad general durante el evento. Los puntos que cambian la conversación:

  • Ventana de contexto de 1 millón de tokens (con plan a 2 millones), lo que permite procesar documentos completos, repositorios de código o transcripciones largas en una sola llamada.
  • Razonamiento nativo activable, similar al modo "thinking" de o3, con control de profundidad. Útil para análisis financiero, debugging y planeación multi-paso.
  • Multimodalidad real, no como add-on: imagen, audio, video y código en el mismo prompt.
  • Mejor latencia que Gemini 1.5 Pro, según los benchmarks que mostró Google y los que hemos corrido internamente.

Para casos empresariales en México, donde con frecuencia hay que analizar contratos, expedientes regulatorios o reportes financieros largos, el contexto de 1M de tokens no es un truco de marketing: cambia la arquitectura de las soluciones. Antes había que hacer chunking sofisticado y RAG. Ahora, en muchos casos, basta con cargar el documento completo.

Vertex AI Agent Builder: la apuesta agéntica

El anuncio más relevante en términos de roadmap es Vertex AI Agent Builder. Es el equivalente de Google a lo que Microsoft hace con Copilot Studio y AWS con Bedrock Agents, pero con tres cosas que nos llamaron la atención:

  • Agent Development Kit (ADK) open-source, en Python, para definir agentes con código y mantener control total. Compatible con orquestación multi-agente.
  • Agent2Agent (A2A) protocol, una propuesta de estándar para que agentes de distintos proveedores se comuniquen. Anthropic, Salesforce, ServiceNow y otros 50+ partners ya firmaron soporte.
  • Conectores empresariales nativos a Workspace, Salesforce, SAP, ServiceNow y bases de datos comunes.

La promesa es construir agentes que no se queden encerrados en un solo ecosistema. Para empresas que ya operan en Microsoft 365 o Salesforce, A2A puede ser la pieza que faltaba para evitar lock-in.

Sovereign Cloud: relevante para sectores regulados

Google amplió Sovereign Cloud a más regiones, incluyendo opciones operadas por partners locales. La propuesta: una nube con controles de soberanía donde datos, claves y operaciones quedan dentro de jurisdicción específica, sin que personal de Google fuera de esa jurisdicción tenga acceso.

Para sectores regulados en México (financiero, salud, gobierno), donde la salida del INAI agrega incertidumbre regulatoria, contar con opciones de soberanía verificable empieza a ser un diferenciador. Aún no hay región Sovereign en México, pero el modelo se puede aplicar con partners en LATAM y la conversación con auditores se vuelve más fácil.

TPUs Trillium en producción

Google liberó Trillium (TPU v6) para clientes de Vertex AI. Los datos: 4.7x más performance por chip que la generación anterior, 67% menos consumo energético, y disponibilidad en pods grandes para entrenamiento e inferencia masiva.

Para la mayoría de empresas medianas no es un cambio inmediato (la mayoría no entrena modelos propios), pero sí baja el costo de inferencia de Gemini 2.5, lo que se refleja en pricing. Si estás corriendo workloads de IA pesados, vale la pena pedir un benchmark con TPU vs GPU antes de cerrar capacidad para 2025.

Cambios de pricing que vale la pena revisar

Tres movimientos que cambian la matemática:

  • Gemini 2.5 Pro: pricing competitivo, alineado con o3-mini de OpenAI, más bajo que GPT-4o para contextos largos.
  • Caché de contexto extendida: si reusas el mismo contexto largo en varias llamadas (típico en RAG con documentos grandes), el descuento puede llegar a 75% sobre los tokens cacheados.
  • Compromiso anual con Vertex AI: descuentos de hasta 40% por compromisos de 1-3 años, similar a las reservas de cómputo.

Recomendación práctica: si estás usando Gemini 1.5 o GPT-4o para procesar documentos largos repetidamente, probablemente puedes bajar tu costo de IA entre 30% y 60% migrando a Gemini 2.5 con caché de contexto, sin sacrificar calidad.

Qué adoptar primero según tu stack

No todo lo anunciado merece estar en tu roadmap inmediato. Nuestro filtro práctico:

Adopta ya:

  • Gemini 2.5 Pro para procesamiento de documentos largos, análisis financiero y casos donde la ventana de 1M aporta valor real.
  • Caché de contexto si tienes RAG con documentos repetidos.

Pilotéalo en Q2:

  • Vertex AI Agent Builder para automatizaciones internas (RH, soporte, operaciones) donde puedas medir tiempo ahorrado.
  • Conectores a Salesforce, SAP o el ERP que tengas.

Observa, no adoptes aún:

  • A2A protocol: la promesa es buena, pero necesita madurar. Espera a tener al menos dos casos de uso antes de comprometerte con la arquitectura.
  • TPUs Trillium si no estás entrenando modelos propios. Te llega vía pricing de Vertex sin que muevas nada.

Evalúa solo si aplica:

  • Sovereign Cloud, si operas en sectores regulados o si el área legal está pidiendo garantías de soberanía.

Cómo se ve esto en una empresa mexicana

Para una empresa mediana en México que ya usa Google Workspace y tiene algún piloto de IA en marcha, la combinación más realista para los próximos seis meses es:

  1. Migrar workloads de IA actuales a Gemini 2.5 Pro y medir ahorro real.
  2. Levantar un agente piloto con Vertex AI Agent Builder en un proceso interno acotado (mesa de ayuda, generación de propuestas, análisis de contratos).
  3. Definir criterios de soberanía y compliance ahora, antes de que se vuelva tema urgente con el nuevo régimen post-INAI.
  4. Renegociar el compromiso anual con Google Cloud aprovechando los nuevos descuentos.

Google Cloud Next 2025 no fue una colección de demos vistosas: fue una declaración de intención. El mercado empresarial de IA dejó de ser un duopolio Microsoft-OpenAI, y eso es buena noticia para quienes compran tecnología en México.


En ALCA ayudamos a empresas mexicanas a aterrizar estas tecnologías con casos reales de negocio. ¿Quieres aterrizar Gemini 2.5 en un caso de uso? Conversemos 30 minutos sin costo.

Artículos relacionados