Midjourney + Kling 3.0: expresiones faciales realistas en vídeo sin efecto «plástico»

Quise sacar a Midjourney y Kling 3.0 de su zona de confort con una prueba muy concreta: no se trataba...

marzo 18, 2026

Escrito por

Picture of Lordwind E. Aguilar Ramírez
Lordwind E. Aguilar Ramírez
Fundador de Arca Artificial | Diseñador Visual Profesional

Compartir

Tabla de contenido

⏱️ Tiempo de lectura: 4 minutos

Quise sacar a Midjourney y Kling 3.0 de su zona de confort con una prueba muy concreta: no se trataba de “hacer una cara bonita”, sino de lograr expresiones faciales en vídeo que se vieran casi reales.

Hacer que un personaje mire a cámara es lo fácil (de hecho, es lo natural de la IA). Lo difícil es que esa mirada y esa cara se acerquen a una realidad humana sin convertirse en un movimiento raro.

Mi objetivo fue conseguir que la mirada de mi “casting” transmitiera asco, miedo intenso o una carcajada genuina, sin que el rostro colapsara cuando entraba el gesto. Y antes de seguir: no, no es humano al 100% (claro, no son humanos). Aún así, la diferencia entre “una IA que se ve bien” y “un rostro que se siente creíble” está justo ahí.

Cuando la cara se ve “plástica”

En esta prueba, el punto no era únicamente pedir una emoción. El punto era evitar dos fallos típicos:

  • Que el personaje se vea como un maniquí (demasiado perfecto, demasiado iluminado, demasiado pulido),

  • Que al forzar una expresión, la cara se convierta en un gesto raro que rompe la conexión.

En cuanto empujas a la IA a emociones fuertes, el margen de error se vuelve evidente.

Mis reglas de oro para asemejar la emoción

Tras varias pruebas, me quedé con tres reglas claras. No son teoría. Son decisiones que nacen de ver qué se sostiene en vídeo y qué se cae.

1) Matar el “Cinematic”

Esta fue la primera lección: si pides luces de estudio, la IA tiende a devolverte un maniquí de cera, o algo tan iluminado que mata lo crudo. Y lo crudo, en este contexto, es clave.

Por eso cambié de enfoque: pasé al documentary-style. Buscando piel con poros, imperfecciones y luz natural.

Si no es “sucio”, no es real.

2) La jerarquía del impacto

La segunda regla apareció en cuanto empecé a revisar resultados en movimiento. En vídeo, hay algo que se repite:

Las emociones sutiles mueren.

Así de simple. Si quieres que el espectador sienta algo, tienes que ir a los extremos. No me refiero a exagerar sin control, sino a comprender que, para que se lea y se sienta, muchas veces el recorrido tiene que ser más claro y más contundente:

Del neutro al llanto descontrolado, o a la sorpresa absoluta.

En otras palabras: si buscas impacto emocional en vídeo, lo “ligero” se pierde antes de llegar al espectador.

3) Estructura de dirección

Y aquí está el punto que más cambia el resultado: no basta con pedir una emoción.

El prompt necesita marcar un ritmo. Una estructura que obligue a la interpretación a tener forma en el tiempo:

mirada directa → transición clara → expresión sostenida

Esa secuencia no es un adorno. Es la diferencia entre “una cara que cambia raro” y “una cara que construye un gesto” y lo mantiene lo suficiente como para que conecte.

El mito del “con un clic” y la realidad del trabajo

A todo esto se suma algo que está pasando cada vez más: como hoy todo es más fácil de crear, mucha gente tiene la impresión de que con un clic la magia se hace.

Sin embargo, para conseguir resultados reales, no hay atajo: hay que probar, errar y volver a probar, pero con criterio.

Parte de ese criterio también es elegir bien las herramientas del flujo completo. Si estás armando tu pipeline, aquí tienes una guía organizada por bloques: Mejores herramientas de IA para hacer videos en 2026 (stack pro por bloques).

Finalmente, después de esta prueba me queda una idea: cuando el objetivo es realismo facial en vídeo, el límite está en cómo planteas el look para evitar el efecto plástico, en cómo empujas la interpretación sin que se rompa y en cuánto criterio pones en iterar hasta que el gesto aguante en movimiento.

Si tu proyecto necesita videos hechos con IA, yo puedo producirlo.

Si lo que buscas es montar este enfoque dentro de tu equipo, también ofrezco consultoría para definir workflow, criterios de calidad y un sistema de pruebas que te permita repetir resultados.

Y si prefieres avanzar acompañado, en la comunidad de Arca Artificial compartimos procesos reales, stacks y aprendizajes aplicados a producción audiovisual con IA.

Preguntas frecuentes

¿Qué parte es “fácil” hoy y cuál sigue siendo difícil?

Lo fácil es conseguir mirada a cámara (es lo natural de la IA). Lo difícil es que no se vea plástica y que la expresión no se convierta en un movimiento raro cuando entra la emoción.

¿Qué emociones probaste en tu test?

Busqué que la mirada del “casting” transmitiera asco, miedo intenso o una carcajada genuina sin que la cara se rompiera en movimiento.

¿Qué significa “matar el cinematic” en este contexto?

Que si pides luces de estudio, la IA tiende a devolverte un maniquí de cera o algo tan iluminado que mata lo crudo. Por eso pasé al documentary-style: piel con poros, imperfecciones y luz natural. Si no es “sucio”, no es real.

¿Por qué dices que las emociones sutiles mueren en vídeo?

Porque en movimiento, lo sutil suele perderse. Para que el espectador sienta algo, comprobé que hay que ir a los extremos: del neutro al llanto descontrolado o a la sorpresa absoluta.

¿Qué estructura te funcionó para que la expresión se sostenga?

No basta con pedir una emoción: el prompt tiene que marcar un ritmo claro: mirada directa → transición clara → expresión sostenida.

¿Qué conclusión sacaste tras probar con 6 perfiles distintos?

Que la tecnología ya no es el límite; lo es nuestra capacidad para dirigir la interpretación digital. Si el músculo facial no se mueve de forma agresiva, la conexión se rompe.

¿Por qué no basta con “un clic” si hoy es tan fácil crear?

Porque para conseguir resultados reales hay que probar, errar y volver a probar (con criterio). La facilidad de creación puede dar la impresión de que la magia sale sola, pero no es así.

prueba

¿Quieres la guía de referencia de este tutorial?

Artículos relacionados

Arca Artificial