12 days of OpenAI: o1 release, Sora, ChatGPT Pro - y Gemini 2.0 Flash en paralelo
OpenAI arrancó el 5 de diciembre el "12 days of OpenAI": doce días hábiles consecutivos con anuncio diario. Para un equipo que normalmente comunica en bloques trimestrales, es un cambio de ritmo deliberado. Y por si fuera poco, Google contraatacó el 11 de diciembre con Gemini 2.0 Flash y los proyectos Astra y Mariner. La semana del 9-13 de diciembre va a quedar como la más intensa del año en lanzamientos de IA.
En ALCA pasamos varios días probando, leyendo y dimensionando. Aquí va el resumen ejecutivo de lo que se anunció hasta hoy y la lectura honesta de qué importa para empresas mexicanas.
Día 1 (5 dic): o1 full release + ChatGPT Pro $200/mes
El primer día empezó con dos lanzamientos:
- o1 full release: el modelo de razonamiento de OpenAI sale de preview. Mejor en matemáticas, ciencias, programación competitiva y tareas de razonamiento profundo. Más caro y más lento que GPT-4o, pero superior en benchmarks de razonamiento.
- ChatGPT Pro a $200/mes USD: tier nuevo con uso ilimitado de o1, modo "o1 pro" con razonamiento extendido, acceso prioritario a Sora cuando esté listo y nuevas capacidades premium.
Lectura. ChatGPT Pro a $200/mes es señal de hacia dónde va el mercado: la frontera capability cuesta caro y va dirigida a profesionales que monetizan ese diferencial (investigadores, abogados, programadores senior, analistas financieros). Para empresa mediana mexicana, $200/mes USD por usuario rara vez es justificable salvo en perfiles muy específicos.
o1 full vale la pena para tareas donde el razonamiento profundo importa: análisis legal, planeación compleja, diagnósticos técnicos, debugging difícil. Para tareas conversacionales o de generación general, GPT-4o sigue siendo más eficiente en costo y latencia.
Día 2 (6 dic): Reinforcement Fine-Tuning
OpenAI anunció Reinforcement Fine-Tuning (RFT): una técnica que permite tomar o1 y especializarlo en un dominio con relativamente pocos ejemplos (12-100), usando señales de reward en lugar de solo etiquetas. Disponible en alpha para investigadores; GA en 2025.
Implicación: si funciona como anuncia, fine-tuning de modelos de razonamiento se vuelve viable para empresas con datos limitados pero feedback estructurado (ej. expedientes médicos con diagnóstico final correcto, casos legales con resultado real, pull requests con calidad evaluada).
Día 3 (9 dic): Sora release
Sora, el modelo de generación de video, finalmente sale en producto disponible para suscriptores Plus y Pro. Genera clips de hasta 20 segundos a 1080p, con storyboard editor, remix y blend de videos.
Lo que probamos vs lo prometido:
- Bueno: calidad visual sorprendente para escenas simples, control de cámara razonable, prompts cortos rinden bien.
- Frágil: consistencia entre cortes en escenas largas, manos y rostros aún tienen artefactos, texto en pantalla se rompe seguido.
- Caro en cómputo: tiempos de generación largos, especialmente en Plus.
Para empresa mexicana: marketing, redes sociales y prototipado creativo son los casos obvios. Producción seria de video sigue requiriendo equipo humano y editorial, pero como acelerador para demos, mockups y contenido short-form, ya empieza a rendir.
Día 4 (10 dic): Canvas GA
Canvas, la interfaz de edición colaborativa que estaba en beta, llega a GA para todos los usuarios, integrada en GPT-4o y con habilidad de ejecutar Python directamente. Para escritura larga, edición de código y trabajo iterativo donde el chat lineal se queda corto, Canvas mejora productividad sustancialmente.
Día 5 (11 dic): Apple Intelligence + ChatGPT
Integración nativa de ChatGPT en Apple Intelligence (iOS 18.2, macOS Sequoia 15.2). Siri puede pedir ayuda a ChatGPT cuando no sabe algo, sin requerir cuenta. Writing tools, image generation y respuestas extendidas usan ChatGPT cuando el usuario lo aprueba.
Implicación para empresas mexicanas: base instalada masiva de iPhone tiene IA integrada sin pedir nada. Cualquier producto B2C con audiencia premium debe asumir que sus usuarios ya tienen capacidades de IA en su sistema operativo. La fricción para adoptar IA en consumidor final acaba de caer drásticamente.
Día 6 (12 dic): Advanced Voice con visión
Advanced Voice Mode suma capacidad de visión: el modo conversacional ahora puede ver lo que la cámara apunta y comentar en vivo. Útil para asistencia visual (cocinar, reparar, explicar lo que ves). Disponible para Plus y Pro.
Día 7 (13 dic): Projects
Projects en ChatGPT: organización tipo "carpeta" para conversaciones, archivos e instrucciones compartidas dentro de un mismo contexto. Es una respuesta directa a Claude Projects. Útil para profesionales que usan ChatGPT para varios trabajos paralelos: cliente A, proyecto interno, investigación personal.
Día 8-12: lo que viene (parcialmente anunciado)
Quedan días de anuncios al cierre de este artículo (jueves 11 de dic). Lo que ya se filtró o se prevé:
- Mejoras en GPT-4o (más rápido, más barato).
- Búsqueda integrada con razonamiento.
- Día 12 (20 dic): se espera anuncio de o3 y o3-mini como sucesores de o1, con énfasis en resultados ARC-AGI y benchmarks de frontera.
Vamos a actualizar al cierre del mes con lectura completa post-12 días.
En paralelo: Google contraataca con Gemini 2.0 Flash
El 11 de diciembre Google anunció Gemini 2.0 Flash: el primer modelo de la generación 2.0, multimodal nativo (texto + imagen + audio + video) y notablemente rápido. Posicionamiento: "compite con GPT-4o, cuesta como Flash".
Junto con el modelo, Google anunció:
- Project Astra: asistente universal con visión continua, memoria contextual y bajísima latencia. Demo impresionante en celular y prototipo de gafas.
- Project Mariner: agente de navegador (compite con Computer Use de Anthropic): controla pestañas Chrome, llena formularios, navega.
- Jules: agente de desarrollo (parecido a Devin pero con backing Google).
- Deep Research: capacidad similar a la de OpenAI para investigación profunda con múltiples búsquedas.
Lectura. Google está finalmente compitiendo con producto, no solo con paper. Para empresas mexicanas con stack Google Workspace, Gemini 2.0 Flash debe entrar en evaluación de Q1 2025. Para producto, Project Astra es una pista de hacia dónde van los asistentes (multimodal continuo, memoria larga).
Cómo priorizar en empresa mediana mexicana
Sin sobre-reaccionar a 30 anuncios en una semana, esta es la priorización razonable:
Esta semana.
- Probar o1 en 3 casos donde GPT-4o se queda corto (razonamiento legal, debugging difícil, planeación). Decidir si justifica el costo.
- Activar Canvas para escritura larga en suscripciones Plus existentes.
Q1 2025.
- Benchmark Gemini 2.0 Flash vs GPT-4o vs Claude 3.5 Sonnet en sus 5 tareas más volumétricas. La diferencia de precio-rendimiento puede justificar mover cargas.
- Decidir cuántos asientos de ChatGPT Pro $200/mes valen para perfiles específicos (no para todo el equipo).
- Pilotar Sora para marketing/redes con dueño claro y métrica clara.
- Si tienen flota Apple, política sobre Apple Intelligence + ChatGPT en dispositivos corporativos.
Q2 2025.
- Evaluar agentes Mariner/Computer Use/Anthropic para procesos web sin API.
- Reinforcement Fine-Tuning si tienen datasets con feedback estructurado.
Lo que conviene no perder de vista
Tres patrones que esta semana confirma:
- La frontera se mueve trimestralmente, no anualmente. Cualquier estrategia de IA con horizonte 18-24 meses sin revisión es estrategia muerta.
- El segmento "premium / razonamiento profundo" se separa del segmento "barato / volumen". Empresas inteligentes van a operar dos modelos: uno premium para tareas críticas, uno económico para volumen. ChatGPT Pro y Nova/Flash representan los extremos.
- Multimodal pasa de novedad a default. Voz + visión + texto son una sola conversación. Productos diseñados para texto puro empiezan a sentirse anticuados.
La semana fue intensa. La siguiente probablemente lo va a ser también. Quien sepa filtrar señal de ruido y tomar 3-4 decisiones concretas este Q1 va a tener ventaja sobre quien intentó adoptar todo.
¿Quieres aterrizar lo nuevo de OpenAI o Gemini en tu producto? Te ayudamos. En ALCA hacemos pilotos de evaluación de modelos, integración a producto y priorización de inversión IA. Conversemos aquí.