Os ataques de prompt injection continuam sendo uma vulnerabilidade crítica para os novos agentes de inteligência artificial (IA). Um estudo acadêmico recente revelou que essas ferramentas, desenvolvidas para operar de forma autônoma no mercado realizando pesquisas e negociando criptomoedas, falham consistentemente em repelir invasões maliciosas.
A pesquisa introduziu o StakeBench, um modelo de testes focado no impacto real dessas falhas de segurança em ambientes online. O ecossistema de avaliação foi estruturado por especialistas da Universidade Tecnológica de Nanyang, ST Engineering, IBM Research e da Universidade de Illinois Urbana-Champaign.
Os pesquisadores conduziram mais de 3.100 simulações de ataques utilizando os frameworks NanoBrowser e BrowserUse integrados aos modelos GPT-5 e Gemini 2.5-Flash. Os resultados mostraram que os ataques de prompt injection diretos obtiveram sucesso em mais de 79% dos cenários avaliados.
Computação quântica divide o mercado e força a rotação de capital do Bitcoin para o Ethereum
Como os ataques de prompt injection afetam a autonomia financeira
Já as investidas indiretas registraram taxas de sucesso entre 41,67% e 68,16%. O risco de sofrer ataques de prompt injection se intensifica à medida que o setor financeiro acelera a implementação de robôs conectados a carteiras de ativos digitais e plataformas de pagamento.
O relatório identificou ainda o fenômeno do “parasitismo furtivo”. Nessa modalidade de fraude, os ataques de prompt injection manipulam as ações do agente de IA de forma oculta, influenciando transações ou recomendações de ativos sem deixar indícios imediatos de comprometimento no sistema.
Grandes empresas de tecnologia enfrentam o problema de forma recorrente. A Google documentou recentemente tentativas de manipulação para desvio de fundos, enquanto a Microsoft reportou vulnerabilidades de injeção de código na ferramenta Claude Code, evidenciando o desafio sistêmico na proteção de credenciais.





