Achávamos que o ChatGPT era apenas um chatbot muito capaz; OpenAI acaba de transformá-lo em um assistente de verdade

A OpenAI acaba de lançar o ChatGPT Agent, que pode realizar tarefas complexas por nós

Função é capaz de comprar produtos online e organizar viagens / Imagem: OpenAI
Sem comentários Facebook Twitter Flipboard E-mail
victor-bianchin

Victor Bianchin

Redator
victor-bianchin

Victor Bianchin

Redator

Victor Bianchin é jornalista.

967 publicaciones de Victor Bianchin

Há muito tempo falamos sobre assistentes de inteligência artificial, mas a OpenAI acaba de transformar essa ideia em algo muito mais concreto. A empresa apresentou o ChatGPT Agent, uma funcionalidade que transforma seu popular chatbot em algo mais autônomo: agora ele é capaz de executar tarefas complexas usando um computador virtual, com ferramentas que permitem navegar e tomar decisões.

No início do ano, a OpenAI havia apresentado o Operator, uma ferramenta que permitia ao ChatGPT interagir com páginas da web. Depois veio o Deep Research, focado em elaborar relatórios longos a partir de múltiplas fontes. A ideia principal era clara: ir além da conversa e se aproximar de tarefas reais. O que foi apresentado hoje é algo como uma ferramenta que unifica todos esses avanços anteriores.

Agent

Durante a demonstração, os responsáveis pelo projeto apresentaram uma situação cotidiana: organizar a participação em um casamento. O agente foi capaz de entender o contexto, buscar hotéis, sugerir presentes, levar em conta o clima, o código de vestimenta e até lembrar que era preciso comprar um terno. Ele fez tudo isso analisando a mensagem, acessando a web e agindo passo a passo, como uma pessoa faria. A diferença é que tudo aconteceu dentro do ChatGPT, sem a necessidade de alternar abas ou dar instruções uma a uma.

Algumas das tarefas que o agente já pode controlar:

  • Criar apresentações e planilhas a partir de dados reais.
  • Planejar jantares completos e gerar a lista de compras com entrega incluída.
  • Buscar produtos online, adicioná-los ao carrinho e comprá-los.
  • Reservar restaurantes ou serviços conforme orçamento, localização e tipo de evento.
  • Organizar viagens com múltiplas condições: datas, número de pessoas, atividades e custo por pessoa.

A chave está no fato de que o agente não se limita a responder em texto: ele opera dentro de uma espécie de computador virtual ao qual a OpenAI deu acesso. Pode usar um navegador de texto para ler páginas rapidamente, um navegador visual para interagir com botões e formulários e até um terminal para executar comandos, gerar código e manipular arquivos. Também pode trabalhar com planilhas, apresentações e acessar serviços como Google Drive, Calendar ou GitHub, se o usuário autorizar.

Agent

O modelo que impulsiona o ChatGPT Agent (desenvolvido especificamente para essa função, embora sem nome oficial) foi treinado com tarefas complexas que exigiam a combinação de múltiplas ferramentas. A OpenAI utilizou aprendizado por reforço, a mesma abordagem que já usa em seus modelos de raciocínio, para ensiná-lo a escolher quando usar o navegador, o terminal ou uma API. A ideia foi desenvolver uma solução capaz de decidir com precisão como agir conforme cada objetivo.

Como ativar e quem pode usar o ChatGPT Agent

O modo agente já está disponível para os usuários dos planos Pro, Plus e Team do ChatGPT. Ele é ativado pelo menu de ferramentas ou digitando diretamente /agent na caixa de texto. Mais adiante, também chegará aos planos Enterprise e Education. O serviço já está disponível em todo o mundo (inclusive no Brasil), exceto na Europa devido a questões regulatórias.

A chegada do ChatGPT Agent faz parte de uma corrida muito maior. A Anthropic já apresentou o Computer Use, uma função que permite ao Claude usar um computador virtual para executar tarefas de forma autônoma. A Perplexity, por sua vez, lançou o Comet, um navegador experimental que aposta na continuidade do pensamento: um ambiente onde o sistema não apenas busca, mas lembra, conecta e age a cada novo passo.

Todas essas propostas dependem cada vez menos da lógica das abas, cliques e formulários. As interfaces conversacionais começam a dar lugar a agentes que entendem o que queremos fazer. A inteligência artificial já não é apenas um assistente: é uma nova forma de interagir com a tecnologia. E estamos vendo isso se desenrolar em tempo real. Com erros, sim, e ainda com muito espaço para evoluir.

Imagens | OpenAI

Este texto foi traduzido/adaptado do site Xataka Espanha.

Inicio