Surpresa com novo GPT 5.5 da OpenAI não é que ele seja bom: é que Claude se parece com o GPT e GPT se parece com Claude

Novo modelo da OpenAI é mais direto, mais conciso, mais eficiente e mais proativo

Também é duas vezes mais caro que seu antecessor, mas desempenho ainda pode compensar

Imagem | Xataka
Sem comentários Facebook Twitter Flipboard E-mail
pedro-mota

PH Mota

Redator
pedro-mota

PH Mota

Redator

Jornalista há 15 anos, teve uma infância analógica cada vez mais conquistada pelos charmes das novas tecnologias. Do videocassete ao streaming, do Windows 3.1 aos celulares cada vez menores.

1620 publicaciones de PH Mota

A OpenAI lançou na última semana seu novo modelo fundamental, o GPT-5.5. Aconteceu apenas uma semana depois do lançamento do Opus 4.7 pela Anthropic, confirmando o ritmo frenético com que diversas empresas de IA estão trabalhando: dificilmente passa uma semana sem pelo menos um grande lançamento. Cada modelo supera o anterior em benchmarks, mas a verdadeira surpresa é a sensação transmitida pelos modelos mais recentes da OpenAI e da Anthropic. É como se tivessem trocado de papéis.

Absolutamente fantástico...

O GPT-5.5 é "o nosso modelo mais inteligente e intuitivo até hoje". A OpenAI afirma que esta versão entende suas necessidades mais rapidamente e você não precisa fornecer tantos detalhes para que ele "intua" o que você deseja. Já está disponível para assinantes dos planos Plus, Pro, Business e Enterprise.

...e caro

O acesso à API chegará "muito em breve", segundo os engenheiros de IA, mas esteja avisado: não será barato. Na verdade, custará US$ 5 por milhão de tokens de entrada e US$ 30 por milhão de tokens de saída. Custa o dobro do GPT-5.4, mas a OpenAI parece confiante de que vale o preço. E talvez eles estejam certos.

Existe uma versão ainda mais cara: o GPT-5.5 Pro custa US$ 30 por milhão de tokens para entrada e US$ 180 por milhão para saída. É o preço mais alto que já vimos para modelos de IA, embora a OpenAI afirme que o modelo é mais eficiente em termos de tokens, o que, se for verdade, reduz o custo real por tarefa.

Agente por design

O novo GPT-5.5 é posicionado como um modelo projetado para concluir tarefas, em vez de responder a perguntas. Essa distinção é intencional: as versões anteriores exigiam instruções detalhadas e supervisão constante, enquanto o GPT-5.5 foi projetado para tarefas longas e autônomas, nas quais o modelo precisa tomar decisões independentes em várias etapas. O modelo usa algoritmos desenvolvidos pela própria OpenAI, que, segundo a empresa, permitem uma geração de tokens 20% mais rápida do que o GPT-5.4, e alguns usuários parecem ter notado essa diferença.

Grafico

Benchmarks com nuances

A tabela comparativa de testes publicada pela OpenAI mostra como o GPT-5.5 vence em 14 desses benchmarks, em comparação com 4 para o Opus 4.7 e 2 para o Gemini 3.1 Pro. Como sempre, esses são testes internos e precisarão ser validados independentemente, mas há algumas descobertas interessantes. O GPT-5.5 domina no TerminalBench, FrontierMath e ARC-AGI-2, enquanto o Opus 4.7 domina no SWE-Bench Pro (programação), embora, segundo a OpenAI, isso se deva a uma técnica de "memorização" que pode influenciar os resultados. Os responsáveis ​​pelo Índice de Inteligência Artificial Analítica (AAI) são claros quanto ao fato de que o GPT-5.5 é atualmente o modelo mais poderoso do mercado, e o salto em relação ao seu antecessor é notável.

GPT agora parece o Claude (e vice-versa)

As reações da comunidade de usuários não se concentraram no poder desses modelos, mas sim em seu comportamento. No boletim informativo The Neuron, eles explicam que o Opus 4.7 agora se parece mais com um GPT porque consome mais tokens, escreve mais e não responde com o tom característico dos modelos antrópicos.

O oposto é verdadeiro para o GPT-5.5, que dá a impressão de estar usando o Claude. Ele escreve de forma concisa, não parece tão desajeitado ao raciocinar rapidamente e é mais direto. Dan Shiper, CEO da Every, indicou que o Opus 4.7 parece lento em comparação com o GPT-5.5. Para analistas como Dylan Patel, da Semianalysis, o motivo é que o Opus 4.7 tem sua capacidade computacional limitada deliberadamente.

OpenAI tem uma vantagem

Aqui reside uma vantagem interessante para a OpenAI, que sempre buscou garantir capacidade computacional futura. Pode ser que não tenha tido sucesso devido à crescente demanda, mas aqui parece haver alguma margem de manobra, permitindo que seus modelos mais avançados evitem os problemas de infraestrutura que afligem o Anthropic. É como se o Anthropic fosse uma Ferrari com combustível racionado, e como se a OpenAI tivesse acabado de comprar o posto de gasolina e tivesse (mais ou menos) o suficiente para seus modelos.

Ponto negativo para a OpenAI?

Ainda é cedo para afirmar, mas a recepção do Claude 4.7 não foi tão boa quanto esperávamos, e se o GPT-5.5 realmente corresponder às expectativas, poderemos presenciar uma mudança surpreendente na liderança. Parecia que o Anthropic tinha tudo sob controle com o Claude Code e o Claude Opus 4.6, mas as críticas recentes ao Opus 4.7 e as aparentes virtudes do GPT-5.5 podem levar a uma disputa.

Isso representa um impulso para a OpenAI, que certamente precisa deles para seu IPO. Enquanto isso, é claro, outros concorrentes estão à espreita.

Inicio