Anthropic apresenta Claude Opus 4.5: certamente o melhor modelo para programação, mas ainda com grande problema

Anthropic lançou seu modelo mais avançado, que supera qualquer concorrente em termos de código

No entanto, sua limitação de uso oferece pouca vantagem ao usuário e gera frustração constante

Imagem | Anthropic
Sem comentários Facebook Twitter Flipboard E-mail
pedro-mota

PH Mota

Redator
pedro-mota

PH Mota

Redator

Jornalista há 15 anos, teve uma infância analógica cada vez mais conquistada pelos charmes das novas tecnologias. Do videocassete ao streaming, do Windows 3.1 aos celulares cada vez menores.

1141 publicaciones de PH Mota

A Anthropic anunciou o Claude Opus 4.5, seu modelo de IA mais avançado até o momento. A empresa afirma ser a melhor do mundo para programação, agentes inteligentes e uso computacional, superando o GPT-5.1 Codex-Max da OpenAI e o Gemini 3 Pro do Google.

O lançamento também ocorreu poucos dias depois do Grok 4.1.

Visão geral

O novo modelo alcançou 80,9% de precisão no SWE-Bench Verified, o benchmark para avaliação de capacidades de engenharia de software.

A Anthropic também o submeteu ao seu próprio teste de recrutamento de engenheiros – notavelmente difícil, com limite de duas horas – e o modelo superou todos os candidatos humanos que o realizaram.

Este lançamento consolida a Anthropic como líder em ferramentas de IA para programação. Até mesmo a Meta usa o Claude para seu assistente de código interno Devmate, apesar de competir diretamente com a empresa em outras áreas.

As melhorias não se limitam ao código. O Opus 4.5 se destaca em:

  • Criação de documentos profissionais, planilhas e apresentações;
  • Tarefas de pesquisa aprofundada com múltiplas fontes;
  • Raciocínio visual e matemático avançado;
  • Gerenciamento de equipes de subagentes para sistemas multiagentes complexos.

Em números

Além disso, a Anthropic reduziu drasticamente o preço de sua API: de US$ 15/75 (R$ 83/415) por milhão de tokens de entrada/saída para US$ 5/25 (R$ 27/138). 

O modelo tambémé mais eficiente que seus antecessores:

  • No modo de esforço médio, ele iguala o desempenho do Sonnet 4.5, mas consome 76% menos tokens.
  • No modo de alto esforço, ele supera o Sonnet 4.5 em 4,3 pontos percentuais, usando 48% menos tokens.

A empresa introduziu o parâmetro "esforço" (baixo, médio, alto) que permite aos desenvolvedores controlar quanto tempo e tokens o modelo investe na resolução de um problema. É uma tendência que a OpenAI também adotou em seus modelos mais recentes, buscando eficiência sem sacrificar a qualidade.

Em detalhes

Juntamente com o modelo, a Anthropic atualizou sua plataforma de desenvolvimento e aplicativos para o consumidor:

  • O Claude Code aprimorou seu modo de planejamento: ele faz perguntas de esclarecimento antes de criar um arquivo editável com o plano de execução. 
  • O Claude para Chrome agora está disponível para todos os usuários do plano Max (entre US$ 100 e US$ 200 por mês, dependendo dos limites), permitindo que a IA gerencie tarefas em várias abas do navegador.
  • O Claude para Excel está disponível para usuários dos planos Max, Team e Enterprise, com suporte para gráficos, tabelas dinâmicas e upload de arquivos.
  • Conversas infinitas: Chats longos não são mais limitados pela janela de contexto graças aos resumos automáticos.

O grande problema com o Opus 4.5 e o Claude em geral é o seu limite de uso. Mesmo para assinantes Pro e Max do primeiro nível, os tokens se esgotam rapidamente. Eles levam cinco horas para serem recarregados após o envio da primeira mensagem. O modelo Opus, por ser o mais poderoso, também é o que consome os tokens mais rapidamente.

Essa é a principal fonte de frustração para usuários que pagam US$ 20 ou até mesmo US$ 100 por mês. A Anthropic aumentou ligeiramente os limites para os planos Max e Team Premium, mas a experiência ainda está longe do esperado para um serviço dessa categoria.

Em outras palavras, o lançamento do Opus 4.5 restaura o equilíbrio da família de modelos da Anthropic. Nos últimos dois meses, o Sonnet 4.5 superou o Opus 4.1, tornando o uso do modelo mais caro praticamente inútil. Agora, com três modelos claramente diferenciados (Haiku, Sonnet e Opus), cada um tem um propósito específico em termos de custo, velocidade e capacidade.

E agora?

A Anthropic segue uma estratégia clara: posicionar-se como a provedora premium para profissionais do conhecimento e desenvolvedores, competindo diretamente com a OpenAI e o Google na área onde precisão e confiabilidade são cruciais.

Mas se o problema dos limites de uso não for resolvido, corre-se o risco de frustrar justamente os usuários que mais se beneficiariam com o modelo.

Imagem | Anthropic

Inicio