
Cerca de 67% das contas banidas da Anthropic usaram IA para preparar cyberataques
Empresa de IA Anthropic mapeou um ano de ameaças de ciberataques habilitadas por IA, descobrindo que atores maliciosos estão rapidamente se tornando mais perigosos com IA.

Mais de dois terços das contas banidas pela Anthropic por violações de política no último ano usaram IA para ajudá-las a preparar cyberataques, como escrever malware, de acordo com a empresa de IA.
Anthropic disse na quarta-feira que entre março de 2025 e março de 2026, de 832 contas que examinou por violações de suas políticas, 560 contas foram usadas desta forma.
Os dados refletem uma tendência global alarmante — que IA está sendo cada vez mais usada para executar cyberataques em massa. Em abril, o valor de cripto roubada em hacks disparou para US$ 629,7 milhões, o maior desde fevereiro de 2025, que alguns analistas vincularam ao uso generalizado de IA.

Fonte: Anthropic
Manuel Aráoz, fundador da plataforma de segurança cripto OpenZeppelin, disse em 27 de maio que considerava "todo o DeFi inseguro" devido à capacidade dos modelos de IA identificar vulnerabilidades de contrato inteligente.
Enquanto os dados mostram que a maioria do uso de IA está na fase de preparação de um ataque, Anthropic disse que também começou a ser implantado "mais profundamente no ciclo de vida do ataque," com 6,5% das contas banidas usando IA para assistir com "movimento lateral" — referindo-se a técnicas que um ciberatacante usa após ganhar acesso inicial.
"Estes tipos de técnicas 'pós-comprometimento' costumavam ser restritos a atores com o conhecimento técnico para executá-las," disse Anthropic. "Nossa investigação mostra que IA agora pode ser feita para executar estas atividades em nome de atores menos sofisticados."
IA também aumentou o nível de ameaça de atacantes. Anthropic classificou um terço das contas, ou 33%, como "risco médio ou superior" nos primeiros seis meses de sua análise, mas aquela figura quase dobrou para 56% no segundo período de seis meses de seu estudo.
O tipo de ameaça colocada por hackers alimentados por IA foi detalhado por pesquisadores do Google mês passado. Os pesquisadores encontraram o que acreditavam ser o primeiro caso de IA sendo usada para desenvolver um zero-day exploit, que permitiu hackers contornar a autenticação de dois fatores de uma ferramenta anônima de administração de sistemas baseada em web de código aberto "popular."
- Remoções de guardrail de IA levantam questões sobre limites da regulação de modelos de código aberto
Acrescentou que IA agora pode realizar tarefas altamente técnicas para atacantes, e há "pouca correlação entre a habilidade de um ator de ameaça e quantas técnicas usam," uma métrica que tradicionalmente mediu o nível de risco de um atacante.
Anthropic disse em alguns casos, como um em novembro, um grupo patrocinado pelo Estado chinês executou um ataque onde um modelo de IA trabalhou autonomamente, onde conduziu um exploit, roubou credenciais e tomou decisões com um humano fazendo um input em "momentos-chave."
"Estes são precisamente os comportamentos que esperamos ver muito mais conforme agentes de IA se tornam mais capazes," disse.
Anthropic está pronta para lançar seu modelo de IA Mythos nas próximas semanas, o grande modelo de linguagem da empresa que preocupou analistas devido a suas poderosas capacidades de segurança cibernética que encontrou mais de 10 mil vulnerabilidades importantes em software amplamente usado.
Mais sobre o assunto

