O Ocidente se deslumbra com o Moltbot, mas a China dá de ombros: já tinha inventado isso há 1 ano

A nova guerra em IA não é pelos chatbots. É pelos agentes que rodam localmente

UI-TARS 1.5 / Imagem: Xataka
Sem comentários Facebook Twitter Flipboard E-mail
victor-bianchin

Victor Bianchin

Redator
victor-bianchin

Victor Bianchin

Redator

Victor Bianchin é jornalista.

1628 publicaciones de Victor Bianchin

O fenômeno do fim de janeiro foi o Moltbot, anteriormente conhecido como Clawdbot. Trata-se de um dos agentes de IA mais poderosos do momento, a ponto de alertar sobre seus próprios riscos ainda antes de ser instalado. Um agente que parecia não ter concorrentes e ser único em sua categoria. Estávamos errados.

Embora não tenha feito tanto barulho, em abril de 2025 foi lançado o UI-TARS-1.5, um agente multimodal de código aberto capaz de realizar todo tipo de tarefa dentro de ambientes de desktop. O UI-TARS-1.5 é um agente multimodal projetado para interagir com o mundo digital por meio de interfaces gráficas, usando a própria tela, o mouse e o teclado.

Ele veio pelas mãos da ByteDance, empresa por trás de gigantes como o TikTok e um dos principais players no desenvolvimento de inteligência artificial na China.

A diferença

O 1.5 é um agente de IA projetado para usar um computador como uma pessoa faria. Ele vê a tela, identifica elementos visuais e age por meio do mouse e do teclado.

Diferentemente do Moltbot, não executa código nem comandos diretamente no sistema, mas interage com o PC de fora, no nível da interface. É mais seguro por concepção, porque não pode quebrar o sistema executando código arbitrário. Além disso, ele raciocina antes de cada ação, o que reduz erros acumulados em tarefas longas.

  • O UI-TARS não controla seu computador. Ele o utiliza.
  • O Moltbot não usa seu computador. Ele o controla.

O UI-TARS interage “conversando” com o seu computador. Ele é capaz de executar tarefas na nossa interface analisando o que há nela.

  • Serve como assistente de programação.
  • Pode se comportar como um humano para testar aplicativos.
  • Funciona como tutor para realizar tarefas complexas.
  • Pode gerenciar tarefas de desktop e a administração do PC.

Isso é importante porque demonstra que a nova guerra pela IA não vai se concentrar exclusivamente em modelos como Gemini, ChatGPT ou Claude: o próximo passo é alcançar uma IA local capaz de agir como um humano, mas com certas garantias de segurança.

Moltbot, UI-TARS, Kimmi K2.5 (também chinês)... Embora a IA agêntica pareça algo distante, a disputa para fazer com que ela faça parte do nosso dia a dia vem sendo gestada há anos.

Imagem | Xataka

Este texto foi traduzido/adaptado do site Xataka Espanha.


Inicio