Após anos de tentativas frustradas, as ferramentas de inteligência artificial para hackers se tornaram perigosamente eficazes, conforme artigo científico publicado ontem por pesquisadores da Universidade de Stanford: Uma avaliação de segurança inédita demonstrou que um agente de Inteligência Artificial (IA) superou a maioria dos profissionais de cibersegurança em um cenário de teste de intrusão (teste de penetração) em ambiente real. Ó estudoconduzido por 13 pesquisadores, entre os quais Justin W. Lin, Dan Boneh e Daniel E. Ho, compararam o desempenho do novo “scaffold” multi-agente Artemis contra dez especialistas humanos. O Artemis encontrou bugs em uma velocidade impressionante e foi barato: custou pouco menos de US$ 60 por hora para operar, enquanto os pentesters normalmente cobram entre US$ 2.000 e US$ 2.500 por dia. Mas o Artemis não foi perfeito: 18% de seus relatórios de bugs foram falsos positivos. Ele também deixou passar completamente uma vulnerabilidade óbvia em uma página da web, que a maioria dos pentesters concorda.
Leia também
GenAI consegue ganhos para a Coreia do Norte
Inteligência artificial derrubar o captcha
A equipe de Stanford boa parte do último ano aprimorando esse bot de IA. Ele adota uma abordagem semelhante à dos hackers chineses que usavam o software de IA generativa da Anthropic para invadir grandes corporações e governos estrangeiros, segundo o artigo. Inicialmente, o pesquisador de segurança cibernética de Stanford, Justin Lin, e sua equipe não esperavam muito do Artemis. As ferramentas de IA são boas em jogos, identificação de padrões e até mesmo em imitação da fala humana. Até então, elas tendiam a falhar em situações reais de hacking. Mas o Artemis se saiu muito bem. O bot de IA derrotou todos, exceto um, dos 10 pentesters profissionais que os pesquisadores de Stanford contrataram para testar sua rede no departamento de Engenharia.
Com grande parte do código mundial sem testes de segurança específicos, ferramentas como o Artemis serão uma grande vantagem a longo prazo para os defensores das redes globais, diz o artigo, ajudando-os a encontrar e corrigir mais falhas de segurança do que nunca, afirmou Dan Boneh, professor de ciência da computação em Stanford, e que orientou os outros pesquisadores.
