El proximo modelo de video de ByteDance crea un clip 4K de 30 segundos de una sola toma, sin empalmes, con el sonido integrado, Zubnet AI Noticias

ByteDance ha presentado un adelanto de Seedance 2.5, su modelo de video con IA de proxima generacion, en su conferencia Force, con un lanzamiento publico previsto para principios de julio. La capacidad destacada es un unico clip nativo de 30 segundos generado en una sola pasada con resolucion 4K, sin empalmes ni trucos de extension. Para un campo donde la mayoria de los modelos todavia producen unos pocos segundos cada vez y unen las piezas, una toma continua de medio minuto es un salto real.

El enfoque de una sola pasada es la clave de por que importa. La mayor parte del video con IA actual se construye a partir de clips cortos de unos pocos segundos que se extienden o empalman, que es donde aparecen la deriva, las costuras y los errores de continuidad. Generar de forma nativa una toma completa de 30 segundos, en 4K, significa que el modelo mantiene una escena coherente a lo largo de un lapso mucho mayor, que es justo la parte que ha resultado dificil.

El sonido es el otro avance. Seedance 2.5 genera audio y video de forma conjunta en el mismo espacio latente, de modo que la accion en pantalla y sus efectos de sonido quedan sincronizados de forma nativa en lugar de doblados despues. El modelo tambien acepta hasta 50 materiales de referencia multimodales, una mezcla de imagenes, video y audio, para un control mucho mas preciso que Seedance 2.0, y ByteDance asegura una mejora de cerca del 20 % en la fidelidad a las instrucciones, lo que en la practica significa menos regeneraciones para obtener un resultado utilizable.

Tambien hay una funcion de flujo de trabajo que insinua a quien apunta ByteDance con esto. Una nueva vista previa de caja blanca 3D permite a un creador generar rapidamente una animacion 3D de baja fidelidad de una toma antes de comprometerse con un renderizado completo de alta calidad, una manera de bosquejar camara y movimiento de forma economica y gastar el computo pesado solo una vez que la toma esta bien. Esa es una idea de canalizacion de produccion, no un truco de demostracion.

La advertencia honesta es que esto es un adelanto, no un lanzamiento, y cada cifra aqui es la propia afirmacion de ByteDance, asi que las pruebas independientes una vez que se publique a principios de julio seran la verdadera medida. El 4K nativo y una toma unica limpia de 30 segundos son precisamente el tipo de especificaciones destacadas que suelen ablandarse ante instrucciones reales. Pero la direccion es la que cuenta. Los clips largos de una sola toma con sonido sincronizado integrado son lo que mueve el video con IA desde demostraciones llamativas hacia un metraje que alguien podria de verdad montar en una pieza terminada, y si Seedance 2.5 cumple, eleva el liston para todos los modelos de video que lo persiguen.

El proximo modelo de video de ByteDance crea un clip 4K de 30 segundos de una sola toma, sin empalmes, con el sonido integrado

Más noticias