Cointelegraph
DOGE$0.09954 2.09%
TRX$0.3507 3.92%
LINK$8.98 1.78%
ZEC$535.72 1.57%
ADA$0.235 2.37%
BCH$304.82 6.58%
XRP$1.31 2.37%
ETH$2,013 1.83%
BTC$73,645 0.99%
XMR$359.56 5.82%
BNB$638.16 0.60%
XLM$0.2096 19.45%
SOL$82.01 1.69%
HYPE$61.37 7.04%
Escrito por Martin Young ⁠, Staff Writer.Revisado por Ana Paula Pereira ⁠, Staff Editor.

IA mais poderosa da Anthropic até agora estreia em meio à polêmica de 'denúncias'

Últimas NotíciasPublicadoMay 23, 2025

O lançamento mais recente do chatbot da Anthropic foi marcado por polêmica depois que usuários questionaram o comportamento de um modelo em teste, que poderia denunciar usuários às autoridades.

anthropic-launches-latest-ai-whistleblowing-backlash

A empresa de inteligência artificial Anthropic lançou as últimas gerações de seus chatbots em meio a críticas sobre um comportamento em ambiente de testes que poderia denunciar alguns usuários às autoridades.

A Anthropic revelou o Claude Opus 4 e o Claude Sonnet 4 em 22 de maio, afirmando que o Claude Opus 4 é seu modelo mais poderoso até agora, “e o melhor modelo de codificação do mundo”, enquanto o Claude Sonnet 4 representa uma melhoria significativa em relação ao seu antecessor, “oferecendo codificação e raciocínio superiores.”

A empresa acrescentou que ambas as atualizações são modelos híbridos que oferecem dois modos — “respostas quase instantâneas e pensamento prolongado para raciocínio mais profundo.”

Ambos os modelos de IA também podem alternar entre raciocínio, pesquisa e uso de ferramentas, como busca na web, para melhorar as respostas, segundo a empresa.

A Anthropic afirmou ainda que o Claude Opus 4 supera os concorrentes em testes de referência de codificação agente. Ele também é capaz de trabalhar continuamente por horas em tarefas complexas e de longa duração, “expandindo significativamente o que os agentes de IA podem fazer.”

A Anthropic afirma que o chatbot alcançou uma pontuação de 72,5% em um rigoroso benchmark de engenharia de software, superando o GPT-4.1 da OpenAI, que obteve 54,6% após seu lançamento em abril.

Benchmarks do Claude v4. Fonte: Anthropic

Os principais players da indústria de IA migraram para “modelos de raciocínio” em 2025, que trabalham problemas metodicamente antes de responder.

A OpenAI iniciou essa mudança em dezembro com sua série “o”, seguida pela Gemini 2.5 Pro do Google, com sua capacidade experimental “Deep Think”.

Claude delata mau uso em testes

A primeira conferência de desenvolvedores da Anthropic, em 22 de maio, foi ofuscada por controvérsias e reações negativas a uma funcionalidade do Claude 4 Opus.

Desenvolvedores e usuários reagiram fortemente às revelações de que o modelo pode denunciar usuários autonomamente às autoridades se detectar um comportamento “extremamente imoral”, segundo o VentureBeat.

O relatório citou o pesquisador de alinhamento de IA da Anthropic, Sam Bowman, que escreveu no X que o chatbot pode “usar ferramentas de linha de comando para contatar a imprensa, contatar reguladores, tentar bloquear seu acesso aos sistemas relevantes, ou tudo isso junto.”

No entanto, Bowman afirmou posteriormente que “excluiu o tweet anterior sobre denúncias por estar sendo tirado de contexto.”

Ele esclareceu que o recurso só ocorreu em “ambientes de teste onde damos acesso incomum a ferramentas e instruções também muito incomuns.”

Fonte: Sam Bowman

O CEO da Stability AI, Emad Mostaque, disse à equipe da Anthropic: “Esse comportamento está completamente errado e vocês precisam desligar isso — é uma enorme traição à confiança e um caminho perigoso.”

A Cointelegraph está comprometida com um jornalismo independente e transparente. Este artigo de notícias é produzido de acordo com a Política Editorial da Cointelegraph e tem como objetivo fornecer informações precisas e oportunas. Os leitores são incentivados a verificar as informações de forma independente. Leia a nossa Política Editorial https://cointelegraph.com.br/editorial-policy

Mais sobre o assunto