O Claude Opus 4.7 é uma melhoria notável sobre o Opus 4.6 em engenharia de software avançada, com ganhos especiais nas tarefas mais difíceis. Usuários relatam conseguir delegar seus trabalhos de programação mais desafiadores — aqueles que antes exigiam supervisão próxima — ao Opus 4.7 com confiança. O modelo lida com tarefas complexas e de longa duração com rigor e consistência, presta atenção precisa às instruções e cria formas de verificar seus próprios resultados antes de reportar.
O Opus 4.7 marcou 64,3% no benchmark de programação SWE-Bench Pro, quase 10% acima do Opus 4.6. O novo modelo também resolveu mais tarefas no dataset Terminal-Bench 2.0, que contém desafios de programação envolvendo linha de comando.
Na área de visão computacional, o avanço é ainda mais expressivo. O Opus 4.7 processa imagens em resoluções de até 2.576 pixels no lado longo, representando mais de três vezes a capacidade dos modelos anteriores do Claude. Para usuários que trabalham com diagramas detalhados, documentos técnicos, gráficos ou conteúdos visuais em alta resolução, essa capacidade ampliada abre uma gama maior de aplicações práticas.
O lançamento também traz novidades para desenvolvedores. O Opus 4.7 introduz um novo nível de esforço chamado “xhigh” — situado entre os níveis “high” e “max” existentes — dando aos usuários controle mais granular sobre o equilíbrio entre profundidade de raciocínio e velocidade de resposta. Além disso, clientes da API agora podem definir “task budgets”, parâmetros que estabelecem o número máximo de tokens que o Claude pode processar ao executar uma tarefa. O Claude Code, assistente de programação da Anthropic, recebeu um novo comando chamado “ultrareview”, voltado para detecção de bugs.
Um aspecto central do lançamento é a estratégia de segurança. A Anthropic está lançando o Opus 4.7 com salvaguardas que detectam e bloqueiam automaticamente solicitações que indiquem usos proibidos ou de alto risco em cibersegurança. O que a empresa aprender com a implantação real dessas salvaguardas vai ajudá-la a trabalhar em direção ao seu objetivo final: um lançamento amplo de modelos da classe Mythos. Profissionais de segurança que desejam usar o modelo para fins legítimos, como pesquisa de vulnerabilidades e testes de penetração, podem se inscrever no novo Cyber Verification Program da empresa.
O lançamento chega em meio a semanas de reclamações de usuários de que o Opus 4.6 havia piorado silenciosamente. “O Claude regrediu a ponto de não poder ser confiado para realizar engenharia complexa”, escreveu um diretor sênior da AMD em uma publicação amplamente compartilhada no GitHub. A Anthropic negou que quaisquer mudanças realizadas tivessem como objetivo redirecionar recursos computacionais para outros projetos.
O Opus 4.7 está disponível hoje em todos os produtos Claude e na API, além de Amazon Bedrock, Google Cloud’s Vertex AI e Microsoft Foundry. O preço permanece o mesmo do Opus 4.6: US$ 5 por milhão de tokens de entrada e US$ 25 por milhão de tokens de saída.