Siete IAs de vídeo, mismo prompt, una toma y cero edición. Objetivo: medir comprensión, coherencia y física con una metodología replicable
Esta semana puse a competir a 7 herramientas de vídeo con IA bajo las mismas condiciones:
- Mismo prompt
- Sin edición
- Una sola generación
- 6 pruebas técnicas reales
- Texto a vídeo, sin imágenes como referencia
Las IAs enfrentadas: Sora 2, Google VEO3, Kling, Hailuo, WAN 2.5, Grok y Meta.
Las 6 pruebas técnicas
- Manos y anatomía – Transferir una manzana de una mano a otra.
- Lógica espacial – Reflejo correcto en una ventana.
- Coherencia de iluminación – Encender una luz en una habitación oscura.
- Física y gravedad – Bicicleta saltando una rampa.
- Líquidos – Servir agua en un vaso.
- Acción y combate – Dos espartanos luchando.
Cada prueba evalúa:
- Fidelidad al prompt
- Calidad visual
- Coherencia temporal
- Física creíble
Resultados
Ganadora absoluta 2025: Google VEO3
Consistencia, estabilidad y rendimiento global superior en las 6 pruebas.
Segundo puesto: Hailuo
Tercero: Kling
Decepción del año: WAN 2.5
Promete mucho, pero en pruebas técnicas básicas se queda atrás.
Sorpresa del año: Meta
En vídeo y también en imagen. Mucho mejor de lo esperado.
Ni siquiera yo esperaba que Kling no ganara. Pero los puntos mandan.
Este test deja una verdad: gana quien es consistente, no quien muestra la demo más vistosa. Con una sola toma y sin edición, la fiabilidad pesa más que cualquier efecto bonito.
Para escenas con manos/objetos y líquidos, Kling es una apuesta segura. Si hay vidrios, espejos o reflejos, Hailuo entiende mejor el espacio. Cuando necesitas rendimiento equilibrado en varias pruebas con riesgo mínimo, Google VEO3 es la opción más estable del conjunto. Meta es la promesa a vigilar y WAN 2.5 no debería liderar proyectos críticos… por ahora.
Mi recomendación práctica: arma tu pipeline por escenas. Usa la IA más fuerte para cada tipo de plano, y no te cases con una sola herramienta. Ese enfoque reduce retrabajo y te da resultados previsibles.
Si quieres saber más sobre los movimientos de cámara ve a: Mejora tus videos con IA usando movimientos de cámara
Aquí tienes el vídeo con todas las pruebas
Preguntas frecuentes
¿Hubo edición o selección de mejores tomas?
No. Una generación por prompt, sin edición.
¿Se usaron imágenes como referencia?
No. Todas las pruebas fueron texto→vídeo.
¿Por qué no aparecen puntos detallados por IA?
La transcripción solo recoge ganadores por ronda y el podio final.
¿Esto define la mejor IA universal?
No. Define desempeño bajo estos seis prompts. Tu caso puede requerir otro ranking.
¿Puedo replicar la prueba?
Sí: reutiliza los prompts.
