A OpenAI lançou na última semana seu novo modelo fundamental, o GPT-5.5. Aconteceu apenas uma semana depois do lançamento do Opus 4.7 pela Anthropic, confirmando o ritmo frenético com que diversas empresas de IA estão trabalhando: dificilmente passa uma semana sem pelo menos um grande lançamento. Cada modelo supera o anterior em benchmarks, mas a verdadeira surpresa é a sensação transmitida pelos modelos mais recentes da OpenAI e da Anthropic. É como se tivessem trocado de papéis.
Absolutamente fantástico...
O GPT-5.5 é "o nosso modelo mais inteligente e intuitivo até hoje". A OpenAI afirma que esta versão entende suas necessidades mais rapidamente e você não precisa fornecer tantos detalhes para que ele "intua" o que você deseja. Já está disponível para assinantes dos planos Plus, Pro, Business e Enterprise.
...e caro
O acesso à API chegará "muito em breve", segundo os engenheiros de IA, mas esteja avisado: não será barato. Na verdade, custará US$ 5 por milhão de tokens de entrada e US$ 30 por milhão de tokens de saída. Custa o dobro do GPT-5.4, mas a OpenAI parece confiante de que vale o preço. E talvez eles estejam certos.
Existe uma versão ainda mais cara: o GPT-5.5 Pro custa US$ 30 por milhão de tokens para entrada e US$ 180 por milhão para saída. É o preço mais alto que já vimos para modelos de IA, embora a OpenAI afirme que o modelo é mais eficiente em termos de tokens, o que, se for verdade, reduz o custo real por tarefa.
Agente por design
O novo GPT-5.5 é posicionado como um modelo projetado para concluir tarefas, em vez de responder a perguntas. Essa distinção é intencional: as versões anteriores exigiam instruções detalhadas e supervisão constante, enquanto o GPT-5.5 foi projetado para tarefas longas e autônomas, nas quais o modelo precisa tomar decisões independentes em várias etapas. O modelo usa algoritmos desenvolvidos pela própria OpenAI, que, segundo a empresa, permitem uma geração de tokens 20% mais rápida do que o GPT-5.4, e alguns usuários parecem ter notado essa diferença.
Benchmarks com nuances
A tabela comparativa de testes publicada pela OpenAI mostra como o GPT-5.5 vence em 14 desses benchmarks, em comparação com 4 para o Opus 4.7 e 2 para o Gemini 3.1 Pro. Como sempre, esses são testes internos e precisarão ser validados independentemente, mas há algumas descobertas interessantes. O GPT-5.5 domina no TerminalBench, FrontierMath e ARC-AGI-2, enquanto o Opus 4.7 domina no SWE-Bench Pro (programação), embora, segundo a OpenAI, isso se deva a uma técnica de "memorização" que pode influenciar os resultados. Os responsáveis pelo Índice de Inteligência Artificial Analítica (AAI) são claros quanto ao fato de que o GPT-5.5 é atualmente o modelo mais poderoso do mercado, e o salto em relação ao seu antecessor é notável.
GPT agora parece o Claude (e vice-versa)
As reações da comunidade de usuários não se concentraram no poder desses modelos, mas sim em seu comportamento. No boletim informativo The Neuron, eles explicam que o Opus 4.7 agora se parece mais com um GPT porque consome mais tokens, escreve mais e não responde com o tom característico dos modelos antrópicos.
O oposto é verdadeiro para o GPT-5.5, que dá a impressão de estar usando o Claude. Ele escreve de forma concisa, não parece tão desajeitado ao raciocinar rapidamente e é mais direto. Dan Shiper, CEO da Every, indicou que o Opus 4.7 parece lento em comparação com o GPT-5.5. Para analistas como Dylan Patel, da Semianalysis, o motivo é que o Opus 4.7 tem sua capacidade computacional limitada deliberadamente.
OpenAI tem uma vantagem
Aqui reside uma vantagem interessante para a OpenAI, que sempre buscou garantir capacidade computacional futura. Pode ser que não tenha tido sucesso devido à crescente demanda, mas aqui parece haver alguma margem de manobra, permitindo que seus modelos mais avançados evitem os problemas de infraestrutura que afligem o Anthropic. É como se o Anthropic fosse uma Ferrari com combustível racionado, e como se a OpenAI tivesse acabado de comprar o posto de gasolina e tivesse (mais ou menos) o suficiente para seus modelos.
Ponto negativo para a OpenAI?
Ainda é cedo para afirmar, mas a recepção do Claude 4.7 não foi tão boa quanto esperávamos, e se o GPT-5.5 realmente corresponder às expectativas, poderemos presenciar uma mudança surpreendente na liderança. Parecia que o Anthropic tinha tudo sob controle com o Claude Code e o Claude Opus 4.6, mas as críticas recentes ao Opus 4.7 e as aparentes virtudes do GPT-5.5 podem levar a uma disputa.
Isso representa um impulso para a OpenAI, que certamente precisa deles para seu IPO. Enquanto isso, é claro, outros concorrentes estão à espreita.
Ver 0 Comentários