Tendências do dia

GPT-4.5 não é melhor do que seus rivais em quase nada; é a prova de que os modelos de IA tradicionais já quase não avançam

O novo modelo de IA da empresa gera várias dúvidas: é muito caro, sua disponibilidade é bastante limitada e, para completar, não representa um salto radical em capacidade

GPT-4.5 decepciona no desempenho e coloca em xeque capacidade da OpenAI de protagonizar futuro da IA / Imagem: Xataka
Sem comentários Facebook Twitter Flipboard E-mail
victor-bianchin

Victor Bianchin

Redator

Victor Bianchin é jornalista.

Sam Altman já havia avisado que tinha a intenção de lançar o GPT-4.5 muito em breve. Estávamos esperando há meses pelo sucessor do GPT-4, mas, com o tempo, as expectativas foram diminuindo: falava-se sobre a desaceleração da IA e sobre como o escalonamento (mais dados e mais GPUs para treinar modelos) já não produzia os mesmos resultados. Precisamente, o GPT-4.5 seria a prova de que talvez isso não fosse verdade. Mas o GPT-4.5 se provou um modelo com muitos problemas desde o início.

GPT-4.5 já está entre nós

No dia 27 de fevereiro, a OpenAI finalmente apresentou o GPT-4.5, em teoria o sucessor do GPT-4. Sam Altman afirmou que este era "o primeiro modelo que me faz sentir que estou conversando com uma pessoa atenta".

Mas Altman também reconheceu outra coisa. "Más notícias: é um modelo gigante e caro". O CEO da OpenAI afirmou que ficou sem GPUs suficientes para fazer um lançamento em larga escala e que a disponibilidade do GPT-4.5 começará muito limitada: por enquanto, só os usuários do ChatGPT Pro poderão usá-lo.

Caro não, caríssimo

Usar o modelo GPT-4.5 por meio da API da OpenAI é extraordinariamente caro: custa 75 dólares por milhão de tokens de entrada e 150 dólares por milhão de tokens de saída. O GPT-4 custa 2,5 e 10 dólares, respectivamente (30 e 15 vezes menos), e o 1, até agora o mais caro, custa 15 e 60 dólares, respectivamente.

Além disso, o GPT-4.5 não é considerado um modelo “de fronteira” (ou “frontier”), como foi o GPT-4. Segundo a OpenAI, modelos de fronteira são os mais avançados da empresa — eles operam em larga escala, têm grande capacidade e também representam riscos maiores, como a possibilidade de espalhar desinformação ou desrespeitar regras. Apesar de o GPT-4.5 ser o maior modelo de linguagem da empresa até agora (os chamados LLMs, que são sistemas de inteligência artificial treinados para entender e gerar texto), ele não entra nessa categoria. Isso indica que, embora o GPT-4.5 seja grande, ele não representa um avanço tão significativo. Em compensação, parece ter sido projetado para cometer menos erros, o que pode ser uma vantagem em algumas situações.

Não parece melhor em quase nada

Os testes e benchmarks aos quais o GPT-4.5 foi submetido parecem deixar claro que o salto de desempenho é especialmente decepcionante, principalmente se comparado aos novos modelos de seus rivais. Ele é pior em precisão de fatos que o Deep Research da Perplexity, é pior que o Claude 3.7 Sonnet em programação, segundo o TechCrunch e vários especialistas, e também é pior em raciocínio (embora claramente não seja voltado para isso) que o DeepSeek R1, o 3-mini e o Claude 3.7 Sonnet (que é um modelo "híbrido").

Especialistas como Simon Willison e Andrej Karpathy compartilharam suas primeiras impressões e, em ambos os casos, a sensação é que o GPT-4.5 é lento, está atualizado apenas até outubro de 2023 e não representa um avanço realmente significativo. Willison chegou a analisar o debate que dezenas de usuários mantinham sobre o GPT-4.5 e, em um resumo gerado por IA, as conclusões também eram claras: a própria numeração era inadequada, o modelo é muito caro, a relação preço/desempenho era muito discutível e o desempenho não era o esperado após tanto tempo. A conclusão de Karpathy é que "é um pouco melhor e isso é ótimo, mas não exatamente em aspectos triviais para destacar".

A fala de Altman sobre a capacidade de interação do GPT-4.5 talvez aponte para a direção onde esse modelo se destaca. Karpathy também mencionou esse aspecto ao dizer que a melhoria poderia se mostrar em "criatividade, realização de analogias, compreensão geral e humor", o que pode fazer com que, de fato, as conversas com o GPT-4.5 pareçam ainda mais próximas das que teríamos com um ser humano.

O escalonamento não funciona, a desaceleração chegou

O GPT-4.5 é um exemplo claro de como parece que chegamos aos limites do escalonamento. Ter um LLM gigantesco já não parece trazer vantagens sobre seus predecessores e dedicar mais dados e mais GPUs para treinar esses modelos não parece fazer muito sentido. O próprio Altman deixou claro que o GPT-4.5 seria o último modelo sem raciocínio da empresa. Essa é outra sinalização de que a desaceleração da IA generativa, ao menos no que se refere aos modelos tradicionais, é uma realidade.

No blog da OpenAI, é dito que "estamos compartilhando o GPT-4.5 como um avanço de pesquisa para entender melhor seus pontos fortes e suas limitações. Ainda estamos explorando do que ele é capaz e estamos ansiosos para ver como as pessoas o utilizam de maneiras que não havíamos esperado". Isso parece mostrar as dúvidas que seus próprios criadores têm com o modelo, e a pergunta sobre por que o lançaram.

É fato que Altman e seu time precisam continuar gerando "hype". Especialmente levando em consideração que os rivais estão muito fortes ultimamente. Claude 3.7, Grok 3 e, sem dúvida, DeepSeek R1 conseguiram virar o jogo e apresentar um grande desafio para a OpenAI, que até pouco tempo atrás parecia estar um passo à frente de seus concorrentes. Agora, isso não está nada claro e, em muitos aspectos, os competidores já superam o desempenho de seus modelos. A OpenAI precisa se restabelecer, mas, talvez, o GPT-4.5 não represente esse passo — porque, ao menos por enquanto, o desempenho é decepcionante.

E os investidores pressionam. Alguns apontam para outra teoria provável para esse lançamento. A OpenAI pode ter se visto obrigada a lançar o GPT-4.5 para acalmar os investidores, que colocaram bilhões de dólares na empresa e precisam estar tranquilos com seu investimento. Novamente, aqui a OpenAI tem um problema, porque não parece que o GPT-4.5 irá tranquilizá-los. Será difícil convencer novos investidores com esse lançamento.

Este texto foi traduzido/adaptado do site Xataka Espanha.

Inicio