Adiós, Escuela de Cine? Un aficionado crea su cortometraje soñado utilizando cuatro modelos de IA
Un usuario de China, sin equipo, sin presupuesto y sin equipo de rodaje, logró reunir un cortometraje animado en solo un par de semanas, uno que se siente estilísticamente cercano a la antología Love, Death & Robots. El proyecto ya se está discutiendo en comunidades de nicho como uno de los ejemplos más impresionantes de video completamente generativo en la corta historia de los modelos de IA de cara al público. El creador no ha revelado su nombre, pero ha expuesto todo su proceso en detalle, explicando cómo convirtió cientos de indicaciones de texto en una pieza fluida, visualmente rica y narrativamente coherente.
Se utilizaron cuatro herramientas clave, y cada una manejó un trabajo específico, cubriendo las debilidades de las otras. Midjourney se utilizó para generar las composiciones principales y los fotogramas clave, estableciendo la estética que está tan cerca de los episodios animados y cargados de CGI de la serie. Según el creador, la mayoría de los visuales iniciales salieron directamente de Midjourney, después de lo cual el material fue refinado y ensamblado.
La combinación más interesante resultó ser el equipo de Nano Banana Pro y Flux 2 Max. El primero manejó los fotogramas intermedios y las transiciones suaves, convirtiendo un conjunto de imágenes estáticas en clips de video con movimiento realista, cambios de ángulo de cámara y transformación de objetos. Sin embargo, Nano Banana Pro tiene filtros de seguridad integrados que rompieron ciertas escenas. En esos casos, el creador cambió manualmente a Flux 2 Max; sus restricciones de contenido resultaron ser más flexibles, lo que ayudó a mantener las escenas previstas intactas sin distorsiones ni rechazos del modelo. El ensamblaje final y la conversión de los clips generados en una película completa se realizó con SeeDance 2, que no generó nuevo contenido, sino que sincronizó las piezas de video en una sola línea de tiempo, suavizó las costuras y ayudó a mantener el ritmo de edición.
El resultado es unos minutos de tiempo en pantalla que los espectadores locales ya han apodado “el mejor video generado por IA que hay en este momento” en términos de calidad de imagen y puesta en escena. La pieza final no se siente como una colección dispersa de generaciones aleatorias; se pueden ver claramente los intentos de mantener una paleta de colores consistente, un tempo visual e incluso elementos de la historia. Por supuesto, todavía está lejos del nivel de los directores en vivo que trabajan con equipos de producción completos, pero el simple hecho de que una persona con una computadora portátil y unas pocas suscripciones pudiera, en solo dos semanas, replicar una parte de esa misma antología dice mucho sobre cuánto ha cambiado la barrera de entrada en la producción de animación.
Todo el proceso tomó “un par de semanas y cientos de indicaciones de texto”, esencialmente, solo trabajo basado en texto. No se involucró ninguna compañía de cine, ningún estudio de VFX, ni actores. Para el espectador promedio, esto significa que adaptar guiones personales, ideas visuales poco convencionales e incluso películas amateur de larga duración ya no tiene que ser una fantasía lejana durante años. Claro, las preguntas sobre derechos de autor, estabilidad de generación y la ética de usar modelos abiertos aún permanecen, pero la barrera tecnológica ya ha sido cruzada.
¿Deberíamos esperar que cadenas de herramientas como esta conviertan al usuario promedio en un competidor para los estudios de animación dentro del próximo año, o aún estamos lejos del verdadero “cine sin humanos” debido a problemas con la narrativa y el control de calidad?
