Matéria
Publicado há cerca de 1 mês · Tecnologia
A Anthropic, empresa americana de inteligência artificial, está no centro de uma onda de reclamações de usuários devido a relatos de declínio no desempenho de seu chatbot Claude AI. Queixas se multiplicaram nas últimas semanas em plataformas como X (antigo Twitter), GitHub e Reddit, com desenvolvedores acusando a companhia de degradar intencionalmente os modelos, um fenômeno conhecido como 'nerfing'.
Usuários destacam problemas especialmente nos modelos Claude Opus 4.6 e Claude Code, com falhas em seguir instruções complexas e aumento de erros em tarefas avançadas. Para o público brasileiro, que usa ferramentas de IA para programação e análise de dados, isso representa um impacto direto na produtividade, especialmente em um mercado de tecnologia em expansão.
Stella Laurenzo, engenheira da AMD, publicou uma análise detalhada no GitHub mostrando regressão no Claude Code para tarefas de engenharia complexa. Ela apontou mais paradas prematuras e loops excessivos de raciocínio, o que compromete a eficiência do modelo.
Benchmarks independentes, como o BridgeMind, registraram queda drástica na precisão do Claude Opus 4.6, passando de 83,3% para 68,3% em retestes recentes. Esses dados foram cruzados com relatos de usuários power users, que formam a base de clientes pagantes da Anthropic.
A empresa justificou as mudanças afirmando que, em março de 2026, alterou o esforço padrão do Opus 4.6 para 'medium effort'. A medida visa equilibrar inteligência, latência e custo, ocultando traços de raciocínio na interface para otimizar o consumo de tokens.
Boris Cherny, líder do Claude Code, negou qualquer nerfing secreto. Em declaração, ele enfatizou que as atualizações foram divulgadas publicamente e respondem a feedbacks sobre o alto consumo de recursos computacionais.
Durante horários de pico, a Anthropic implementou ajustes em limites de sessão, afetando cerca de 7% dos usuários do plano Pro. Isso gerenciou a demanda crescente, mas frustrou profissionais que dependem da ferramenta para workflows diários.
Especulações apontam para um 'compute crunch', ou escassez de capacidade computacional na Anthropic, que possui menos data centers que rivais como OpenAI e Google. No entanto, a companhia nega degradação de modelos para atender à demanda.
Dimitris Papailiopoulos, pesquisador da Microsoft, compartilhou experiências frustrantes com o Claude Code nas últimas duas semanas, descrevendo-o como 'sloppy' (descuidado) e propenso a ignorar instruções claras.
Outra mudança notada foi no Claude Code, que passou de uma abordagem 'research-first' para 'edit-first'. Isso significa que o modelo lê menos contexto e exige maior intervenção humana, alterando sua usabilidade para desenvolvedores.
A Anthropic planeja adotar 'high effort' como padrão para usuários dos planos Teams e Enterprise, mesmo com maior custo em tokens e latência. A medida pode aliviar queixas de clientes corporativos, mas não resolve problemas dos usuários individuais.
Um porta-voz da empresa reforçou que não há degradação intencional e que as otimizações são necessárias para sustentabilidade. A Fortune e o VentureBeat cobriram o caso, destacando a falta de transparência como ponto central das críticas.
Embora alguns benchmarks sejam questionados por variações estatísticas, as queixas subjetivas de usuários experientes indicam um problema real. Incidentes semelhantes em 2025 foram bugs resolvidos, mas os atuais ligam-se a políticas de esforço.
Para o Brasil, onde startups e freelancers adotam IAs como Claude para competir globalmente, o episódio reforça a importância de diversificação em ferramentas como ChatGPT ou Gemini. A Anthropic ainda não anunciou correções imediatas.
Um post-mortem oficial da Anthropic, disponível em seu site de engenharia, discute issues recentes, mas foca em infraestrutura passada, sem abordar diretamente as queixas de 2026.
A controvérsia destaca tensões no setor de IA: equilíbrio entre performance, custo e escalabilidade. Enquanto rivais investem bilhões em infraestrutura, a Anthropic enfrenta desafios para manter liderança em modelos 'seguros e interpretáveis'.
