A IA de vídeo do Google ficou mais poderosa: o que o Gemini Omni promete fazer

Novo modelo permite gerar e editar vídeos a partir de texto, imagens, áudios e outros vídeos, com cenas mais consistentes e som criado pela própria IA

Imagem 1200x900 Xataka Basics
Sem comentários Facebook Twitter Flipboard E-mail
ana-serra

Carolina Rodrigues

Redatora
ana-serra

Carolina Rodrigues

Redatora

O Google quer dar mais um passo na criação de vídeos com inteligência artificial. A nova aposta da empresa é o Gemini Omni, um modelo capaz de gerar vídeos a partir de diferentes tipos de entrada, como texto, imagem, áudio e até outros vídeos.

A proposta é simples de entender, mas poderosa na prática: permitir que o usuário combine vários elementos em um único comando para criar cenas mais completas, coerentes e realistas.

A seguir, entenda o que é o Gemini Omni, o que ele promete oferecer e como usar a ferramenta dentro do ecossistema do Google.

O que é o Gemini Omni

O Gemini Omni é o novo modelo de IA do Google voltado à criação de vídeos. Com ele, a empresa pretende avançar nesse segmento da mesma forma que chamou atenção na geração de imagens com o Nano Banana.

A primeira versão do modelo é o Gemini Omni Flash, mas a expectativa é que novas versões sejam lançadas no futuro.

O grande diferencial está na capacidade multimodal. Isso significa que o usuário pode combinar imagens, áudios, vídeos e texto em um mesmo prompt para pedir a criação de um vídeo. A partir desses elementos, o Gemini usa seu conhecimento de mundo para gerar cenas mais coerentes e próximas da realidade.

Não é só criar vídeo do zero

O Google não apresenta o Omni apenas como uma ferramenta para gerar vídeos a partir de uma ideia inicial. O modelo também foi pensado para trabalhar sobre cenas já existentes.

Na prática, isso significa que o usuário pode pedir alterações em partes específicas de um vídeo, manter determinados elementos, trocar outros ou transformar completamente a cena.

Dá para ajustar estética, ações, ambiente, ângulo, estilo e detalhes pontuais. O modelo também promete manter a consistência dos personagens, preservar a continuidade da cena e gerar movimentos com física mais coerente.

O que dá para fazer com o Gemini Omni?

O Omni substitui o Veo, antigo modelo de criação de vídeos do Google. Com ele, será possível criar clipes de até 10 segundos, com geração de áudio nativa.

A ferramenta também permite transformar fotos em vídeos, com limite de até 5 segundos, além de editar uma cena em múltiplas interações.

Entre os usos possíveis estão transformar o estilo visual de um vídeo, criar uma versão em desenho animado, gerar uma cena a partir de uma imagem, adicionar áudio, substituir uma pessoa por uma criatura ou alterar elementos específicos sem refazer tudo do zero.

Quem pode usar o Gemini Omni?

Por enquanto, o Gemini Omni está disponível apenas para usuários pagos com alguma assinatura do Gemini.

A ferramenta aparece integrada tanto no aplicativo quanto na versão web do Gemini e do Flow.

Também haverá uma forma gratuita de usar o Omni por meio do YouTube Shorts e do aplicativo YouTube Create. No entanto, para acessar o recurso de maneira nativa dentro do Gemini, será necessário ter uma assinatura paga.

Como usar o Gemini Omni?

Gemini Omni 1

Para usar o Gemini Omni, é preciso entrar no Gemini e abrir o menu de opções no campo de texto. Em seguida, basta selecionar a opção Criar vídeo.

Depois disso, a interface passa a indicar que o modo de vídeo está ativado. O usuário é levado a uma tela com estilos e ideias prontas, que podem ser escolhidos com um toque.

Gemini Omni 2

Também é possível escrever um prompt manualmente e adicionar elementos como vídeos, imagens ou áudios.

Gemini Omni 3

Como criar ou editar vídeos com a IA

O funcionamento segue a lógica dos modelos generativos mais recentes. Você pode, por exemplo, enviar um vídeo e explicar quais mudanças deseja fazer nele.

Dá para pedir que a IA altere elementos internos, substitua personagens ou objetos, use o vídeo como base para uma nova criação ou transforme toda a cena em outro estilo.

Também é possível subir uma imagem ou um áudio e gerar um vídeo a partir desses arquivos. Ou, se preferir, criar tudo do zero apenas com uma descrição em texto.

Gemini Omni 4

Depois do comando, o Gemini leva alguns minutos para gerar o resultado. Ao final, o usuário pode assistir ao vídeo, refazer a criação, compartilhar ou baixar o arquivo no dispositivo.

Texto traduzido e adaptado do Xataka Espanha.

Inicio