O proximo modelo de video da ByteDance cria um clipe 4K de 30 segundos em uma unica tomada, sem emendas, com o som ja incorporado, Zubnet AI Notícias

A ByteDance apresentou uma previa do Seedance 2.5, seu modelo de video por IA de proxima geracao, na conferencia Force, com lancamento publico previsto para o inicio de julho. A capacidade que mais chama atencao e um unico clipe nativo de 30 segundos gerado em uma so passagem em resolucao 4K, sem emendas ou truques de extensao. Para uma area em que a maioria dos modelos ainda produz apenas alguns segundos por vez e emenda os pedacos, uma tomada continua de meio minuto e um salto real.

A abordagem de passagem unica e o cerne do que torna isso importante. A maior parte do video por IA hoje e construida a partir de clipes curtos de alguns segundos que sao estendidos ou emendados, e e ai que aparecem desvios, costuras e erros de continuidade. Gerar nativamente uma tomada completa de 30 segundos, em 4K, significa que o modelo mantem uma cena coesa por um intervalo muito maior, que e exatamente a parte que tem sido dificil.

O som e o outro avanco. O Seedance 2.5 gera audio e video em conjunto no mesmo espaco latente, de modo que a acao na tela e seus efeitos sonoros ficam sincronizados nativamente, em vez de dublados depois. O modelo tambem aceita ate 50 materiais de referencia multimodais, uma mistura de imagens, video e audio, para um controle muito mais preciso do que o Seedance 2.0, e a ByteDance afirma cerca de 20% mais aderencia ao prompt, o que na pratica significa menos regeneracoes para chegar a um resultado utilizavel.

Ha tambem um recurso de fluxo de trabalho que indica para quem a ByteDance esta mirando isso. Uma nova previa 3D em caixa branca permite que um criador gere rapidamente uma animacao 3D de baixa fidelidade de uma cena antes de partir para uma renderizacao completa de alta qualidade, uma forma de esbocar camera e movimento de maneira barata e so gastar o processamento pesado quando a cena estiver certa. Essa e uma ideia de pipeline de producao, nao um truque de demonstracao.

A ressalva honesta e que isto e uma previa, nao um lancamento, e cada numero aqui e uma afirmacao da propria ByteDance, entao testes independentes, quando o modelo chegar no inicio de julho, serao a medida real. 4K nativo e uma tomada unica limpa de 30 segundos sao justamente o tipo de especificacao de destaque que tende a perder forca diante de prompts reais. Mas a direcao e a que importa. Clipes longos em tomada unica com som sincronizado embutido sao o que move o video por IA de demonstracoes impressionantes para um material que alguem poderia de fato montar em uma obra finalizada, e, se o Seedance 2.5 entregar, ele eleva o nivel para todos os modelos de video que o perseguem.

O proximo modelo de video da ByteDance cria um clipe 4K de 30 segundos em uma unica tomada, sem emendas, com o som ja incorporado

Mais notícias