A Anthropic anunciou o Claude Opus 4.5, seu modelo de IA mais avançado até o momento. A empresa afirma ser a melhor do mundo para programação, agentes inteligentes e uso computacional, superando o GPT-5.1 Codex-Max da OpenAI e o Gemini 3 Pro do Google.
O lançamento também ocorreu poucos dias depois do Grok 4.1.
Visão geral
O novo modelo alcançou 80,9% de precisão no SWE-Bench Verified, o benchmark para avaliação de capacidades de engenharia de software.
A Anthropic também o submeteu ao seu próprio teste de recrutamento de engenheiros – notavelmente difícil, com limite de duas horas – e o modelo superou todos os candidatos humanos que o realizaram.
Este lançamento consolida a Anthropic como líder em ferramentas de IA para programação. Até mesmo a Meta usa o Claude para seu assistente de código interno Devmate, apesar de competir diretamente com a empresa em outras áreas.
As melhorias não se limitam ao código. O Opus 4.5 se destaca em:
- Criação de documentos profissionais, planilhas e apresentações;
- Tarefas de pesquisa aprofundada com múltiplas fontes;
- Raciocínio visual e matemático avançado;
- Gerenciamento de equipes de subagentes para sistemas multiagentes complexos.
Em números
Além disso, a Anthropic reduziu drasticamente o preço de sua API: de US$ 15/75 (R$ 83/415) por milhão de tokens de entrada/saída para US$ 5/25 (R$ 27/138).
O modelo tambémé mais eficiente que seus antecessores:
- No modo de esforço médio, ele iguala o desempenho do Sonnet 4.5, mas consome 76% menos tokens.
- No modo de alto esforço, ele supera o Sonnet 4.5 em 4,3 pontos percentuais, usando 48% menos tokens.
A empresa introduziu o parâmetro "esforço" (baixo, médio, alto) que permite aos desenvolvedores controlar quanto tempo e tokens o modelo investe na resolução de um problema. É uma tendência que a OpenAI também adotou em seus modelos mais recentes, buscando eficiência sem sacrificar a qualidade.
Em detalhes
Juntamente com o modelo, a Anthropic atualizou sua plataforma de desenvolvimento e aplicativos para o consumidor:
- O Claude Code aprimorou seu modo de planejamento: ele faz perguntas de esclarecimento antes de criar um arquivo editável com o plano de execução.
- O Claude para Chrome agora está disponível para todos os usuários do plano Max (entre US$ 100 e US$ 200 por mês, dependendo dos limites), permitindo que a IA gerencie tarefas em várias abas do navegador.
- O Claude para Excel está disponível para usuários dos planos Max, Team e Enterprise, com suporte para gráficos, tabelas dinâmicas e upload de arquivos.
- Conversas infinitas: Chats longos não são mais limitados pela janela de contexto graças aos resumos automáticos.
O grande problema com o Opus 4.5 e o Claude em geral é o seu limite de uso. Mesmo para assinantes Pro e Max do primeiro nível, os tokens se esgotam rapidamente. Eles levam cinco horas para serem recarregados após o envio da primeira mensagem. O modelo Opus, por ser o mais poderoso, também é o que consome os tokens mais rapidamente.
Essa é a principal fonte de frustração para usuários que pagam US$ 20 ou até mesmo US$ 100 por mês. A Anthropic aumentou ligeiramente os limites para os planos Max e Team Premium, mas a experiência ainda está longe do esperado para um serviço dessa categoria.
Em outras palavras, o lançamento do Opus 4.5 restaura o equilíbrio da família de modelos da Anthropic. Nos últimos dois meses, o Sonnet 4.5 superou o Opus 4.1, tornando o uso do modelo mais caro praticamente inútil. Agora, com três modelos claramente diferenciados (Haiku, Sonnet e Opus), cada um tem um propósito específico em termos de custo, velocidade e capacidade.
E agora?
A Anthropic segue uma estratégia clara: posicionar-se como a provedora premium para profissionais do conhecimento e desenvolvedores, competindo diretamente com a OpenAI e o Google na área onde precisão e confiabilidade são cruciais.
Mas se o problema dos limites de uso não for resolvido, corre-se o risco de frustrar justamente os usuários que mais se beneficiariam com o modelo.
Imagem | Anthropic
Ver 0 Comentários