Google lançou Omni Flash esta semana, o primeiro modelo da empresa na família Omni de ferramentas de IA gerativas. Integrado à Flow, plataforma de criação e edição de vídeo com IA da Google, Omni Flash permite que os usuários façam upload de um vídeo de origem, adicionem um prompt de texto e recebam um clipe gerado que combina as duas entradas. A empresa afirma que o modelo se baseia em um conhecimento mais amplo do mundo real e pode manter a continuidade dos personagens melhor do que seu antecessor, Veo.
Para avaliar as afirmações, um testador usou um cervo de pelúcia chamado Buddy como sujeito de teste. Os resultados foram uma mistura de both. Alguns clipes exibiram uma alinhamento mais apertado com o prompt e uma movimentação de personagens mais suave do que aqueles produzidos por Veo cinco meses antes. Em outros casos, o cervo mudou abruptamente de orientação em pleno voo, chifres apareceram do nada e objetos, como um jarro de mel, se transformaram em uma garrafa de água e voltaram a ser um jarro de mel novamente. O modelo também lutou para manter detalhes visuais consistentes quando solicitado a enfatizar reações faciais.
Omni Flash também aceita prompts de texto apenas, permitindo que os usuários gerem vídeos inteiros do zero. Quando o testador pediu ao modelo que criasse uma montagem de férias para Buddy, a IA produziu uma sequência divertida que, embora entretenida, ainda apresentou "sustos" notáveis e artefatos visuais ocasionais. Editar footage existente com comandos de texto provou ser mais confiável do que com Veo, mas a saída ainda exigiu várias tentativas para atingir um nível aceitável.
O custo permanece como uma preocupação prática. Cada geração de vídeo consome entre 15 e 40 créditos, dependendo do comprimento e da complexidade da entrada. Editar um clipe custa um crédito fixo de 40. O plano AI Pro da Google, com preço de $20 por mês, fornece 1.000 créditos, que o testador esgotou após cerca de 20 clipes, deixando apenas 145 créditos para experimentação adicional. O modelo de preços pode tornar o uso extensivo de Omni Flash proibitivo para criadores casuais.
A capacidade do modelo de mesclar elementos gerados por IA em footage do mundo real também foi examinada. A partir de um vídeo de selfie, o testador solicitou que Omni o colocasse comendo espaguete, sentado em um avião e em pé diante da Torre Eiffel. Os clipes de deep-fake resultantes foram convincentes o suficiente para enganar um parente próximo, embora sinais sutis — como um som de garfo cintilante demais e uma figura de fundo que se repetia — traíssem a natureza sintética do footage.
No geral, Omni Flash mostra um progresso claro em relação a Veo em termos de aderência ao prompt e consistência visual, mas ainda permanece firmemente dentro do "vale da incerteza". A tecnologia torna fácil criar vídeos curtos e divertidos, mas o custo e os glitches ocasionais a impedem de produzir obras de qualidade cinematográfica. À medida que a Google continua a aprimorar a família Omni, os criadores podem esperar melhorias incrementais, mas por agora a ferramenta é mais adequada para projetos experimentais ou de baixo risco.
Este artigo foi escrito com a assistência de IA.
News Factory SEO ajuda você a automatizar conteúdo de notícias para o seu site.