Há muito tempo falamos sobre assistentes de inteligência artificial, mas a OpenAI acaba de transformar essa ideia em algo muito mais concreto. A empresa apresentou o ChatGPT Agent, uma funcionalidade que transforma seu popular chatbot em algo mais autônomo: agora ele é capaz de executar tarefas complexas usando um computador virtual, com ferramentas que permitem navegar e tomar decisões.
No início do ano, a OpenAI havia apresentado o Operator, uma ferramenta que permitia ao ChatGPT interagir com páginas da web. Depois veio o Deep Research, focado em elaborar relatórios longos a partir de múltiplas fontes. A ideia principal era clara: ir além da conversa e se aproximar de tarefas reais. O que foi apresentado hoje é algo como uma ferramenta que unifica todos esses avanços anteriores.

Durante a demonstração, os responsáveis pelo projeto apresentaram uma situação cotidiana: organizar a participação em um casamento. O agente foi capaz de entender o contexto, buscar hotéis, sugerir presentes, levar em conta o clima, o código de vestimenta e até lembrar que era preciso comprar um terno. Ele fez tudo isso analisando a mensagem, acessando a web e agindo passo a passo, como uma pessoa faria. A diferença é que tudo aconteceu dentro do ChatGPT, sem a necessidade de alternar abas ou dar instruções uma a uma.
Algumas das tarefas que o agente já pode controlar:
- Criar apresentações e planilhas a partir de dados reais.
- Planejar jantares completos e gerar a lista de compras com entrega incluída.
- Buscar produtos online, adicioná-los ao carrinho e comprá-los.
- Reservar restaurantes ou serviços conforme orçamento, localização e tipo de evento.
- Organizar viagens com múltiplas condições: datas, número de pessoas, atividades e custo por pessoa.
A chave está no fato de que o agente não se limita a responder em texto: ele opera dentro de uma espécie de computador virtual ao qual a OpenAI deu acesso. Pode usar um navegador de texto para ler páginas rapidamente, um navegador visual para interagir com botões e formulários e até um terminal para executar comandos, gerar código e manipular arquivos. Também pode trabalhar com planilhas, apresentações e acessar serviços como Google Drive, Calendar ou GitHub, se o usuário autorizar.

O modelo que impulsiona o ChatGPT Agent (desenvolvido especificamente para essa função, embora sem nome oficial) foi treinado com tarefas complexas que exigiam a combinação de múltiplas ferramentas. A OpenAI utilizou aprendizado por reforço, a mesma abordagem que já usa em seus modelos de raciocínio, para ensiná-lo a escolher quando usar o navegador, o terminal ou uma API. A ideia foi desenvolver uma solução capaz de decidir com precisão como agir conforme cada objetivo.
Como ativar e quem pode usar o ChatGPT Agent
O modo agente já está disponível para os usuários dos planos Pro, Plus e Team do ChatGPT. Ele é ativado pelo menu de ferramentas ou digitando diretamente /agent na caixa de texto. Mais adiante, também chegará aos planos Enterprise e Education. O serviço já está disponível em todo o mundo (inclusive no Brasil), exceto na Europa devido a questões regulatórias.
A chegada do ChatGPT Agent faz parte de uma corrida muito maior. A Anthropic já apresentou o Computer Use, uma função que permite ao Claude usar um computador virtual para executar tarefas de forma autônoma. A Perplexity, por sua vez, lançou o Comet, um navegador experimental que aposta na continuidade do pensamento: um ambiente onde o sistema não apenas busca, mas lembra, conecta e age a cada novo passo.
Todas essas propostas dependem cada vez menos da lógica das abas, cliques e formulários. As interfaces conversacionais começam a dar lugar a agentes que entendem o que queremos fazer. A inteligência artificial já não é apenas um assistente: é uma nova forma de interagir com a tecnologia. E estamos vendo isso se desenrolar em tempo real. Com erros, sim, e ainda com muito espaço para evoluir.
Imagens | OpenAI
Este texto foi traduzido/adaptado do site Xataka Espanha.
Ver 0 Comentários