O Google quer dar mais um passo na criação de vídeos com inteligência artificial. A nova aposta da empresa é o Gemini Omni, um modelo capaz de gerar vídeos a partir de diferentes tipos de entrada, como texto, imagem, áudio e até outros vídeos.
A proposta é simples de entender, mas poderosa na prática: permitir que o usuário combine vários elementos em um único comando para criar cenas mais completas, coerentes e realistas.
A seguir, entenda o que é o Gemini Omni, o que ele promete oferecer e como usar a ferramenta dentro do ecossistema do Google.
O que é o Gemini Omni
O Gemini Omni é o novo modelo de IA do Google voltado à criação de vídeos. Com ele, a empresa pretende avançar nesse segmento da mesma forma que chamou atenção na geração de imagens com o Nano Banana.
A primeira versão do modelo é o Gemini Omni Flash, mas a expectativa é que novas versões sejam lançadas no futuro.
O grande diferencial está na capacidade multimodal. Isso significa que o usuário pode combinar imagens, áudios, vídeos e texto em um mesmo prompt para pedir a criação de um vídeo. A partir desses elementos, o Gemini usa seu conhecimento de mundo para gerar cenas mais coerentes e próximas da realidade.
Não é só criar vídeo do zero
O Google não apresenta o Omni apenas como uma ferramenta para gerar vídeos a partir de uma ideia inicial. O modelo também foi pensado para trabalhar sobre cenas já existentes.
Na prática, isso significa que o usuário pode pedir alterações em partes específicas de um vídeo, manter determinados elementos, trocar outros ou transformar completamente a cena.
Dá para ajustar estética, ações, ambiente, ângulo, estilo e detalhes pontuais. O modelo também promete manter a consistência dos personagens, preservar a continuidade da cena e gerar movimentos com física mais coerente.
O que dá para fazer com o Gemini Omni?
O Omni substitui o Veo, antigo modelo de criação de vídeos do Google. Com ele, será possível criar clipes de até 10 segundos, com geração de áudio nativa.
A ferramenta também permite transformar fotos em vídeos, com limite de até 5 segundos, além de editar uma cena em múltiplas interações.
Entre os usos possíveis estão transformar o estilo visual de um vídeo, criar uma versão em desenho animado, gerar uma cena a partir de uma imagem, adicionar áudio, substituir uma pessoa por uma criatura ou alterar elementos específicos sem refazer tudo do zero.
Quem pode usar o Gemini Omni?
Por enquanto, o Gemini Omni está disponível apenas para usuários pagos com alguma assinatura do Gemini.
A ferramenta aparece integrada tanto no aplicativo quanto na versão web do Gemini e do Flow.
Também haverá uma forma gratuita de usar o Omni por meio do YouTube Shorts e do aplicativo YouTube Create. No entanto, para acessar o recurso de maneira nativa dentro do Gemini, será necessário ter uma assinatura paga.
Como usar o Gemini Omni?
Para usar o Gemini Omni, é preciso entrar no Gemini e abrir o menu de opções no campo de texto. Em seguida, basta selecionar a opção Criar vídeo.
Depois disso, a interface passa a indicar que o modo de vídeo está ativado. O usuário é levado a uma tela com estilos e ideias prontas, que podem ser escolhidos com um toque.
Também é possível escrever um prompt manualmente e adicionar elementos como vídeos, imagens ou áudios.
Como criar ou editar vídeos com a IA
O funcionamento segue a lógica dos modelos generativos mais recentes. Você pode, por exemplo, enviar um vídeo e explicar quais mudanças deseja fazer nele.
Dá para pedir que a IA altere elementos internos, substitua personagens ou objetos, use o vídeo como base para uma nova criação ou transforme toda a cena em outro estilo.
Também é possível subir uma imagem ou um áudio e gerar um vídeo a partir desses arquivos. Ou, se preferir, criar tudo do zero apenas com uma descrição em texto.
Depois do comando, o Gemini leva alguns minutos para gerar o resultado. Ao final, o usuário pode assistir ao vídeo, refazer a criação, compartilhar ou baixar o arquivo no dispositivo.
Texto traduzido e adaptado do Xataka Espanha.
Ver 0 Comentários