O Captcha está mudando e a culpa é da IA

Por: Rodrigo Fragola – CEO Ogasec e Integrante do CNCiber – 03/03/2024

CAPTCHA, um acrônimo para “Completely Automated Public Turing Test to Tell Humans Apart”, refere-se a vários métodos de autenticação que validam usuários como humanos, e não robôs, apresentando testes aos usuários com um desafio que é simples para humanos, mas difícil para máquinas.

O teste CAPTCHA é uma experiência comum para muitos de nós. Ele é usado em várias situações, como fazer login em aplicativos, assinar documentos ou validar consultas de pesquisa. O objetivo é garantir que o usuário seja humano e não um robô automatizado.

Inicialmente, os CAPTCHAs consistiam em imagens simples com letras e números que os usuários precisavam interpretar e digitar em uma caixa de texto. No entanto, com o avanço das técnicas de avaliação de imagens, especialmente relacionadas a contornos e contraste, esses modelos foram gradualmente superados.

Soluções antigas com letras e números

Para enfrentar esse desafio, soluções mais complexas foram adotadas como os quebra-cabeças abaixo. Elas se concentram em imagens de objetos ou partes de objetos, muitas vezes com fotos tiradas de longe ou sem foco ou baixas resoluções. Essas abordagens buscam dificultar a tarefa para bots automatizados que já conseguiam com algum sucesso ler os modelos anteriores e passar no teste.

Soluções com quebra-cabeças

Essas soluções tinham a vantagem de explorar uma infinidade de formas, aproveitando a capacidade subjetiva do cérebro humano para fazer associações que muitas vezes não são tão óbvias para as máquinas. Por exemplo, distinguir entre faixas de pedestres e faixas de zebras era uma tarefa desafiadora para um algoritmo generalizado. Até nós, humanos, às vezes enfrentamos dificuldades com esses desafios, o que resulta em memes divertidos na Internet.

Meme: Marque a bicicleta

Os hackers rapidamente desenvolveram ferramentas para resolver CAPTCHAs que, na verdade, envolviam outra pessoa em algum lugar remoto resolvendo o CAPTCHA em nome de um robô. Embora essa abordagem funcionasse, não era particularmente inteligente, pois prejudicava a principal vantagem dos robôs: a capacidade de processar dados em grande volume.

Parecia que a solução definitiva estava consolidada, até que as inteligências artificiais (IAs) decidiram entrar na disputa.

Um artigo(*) publicado no segundo semestre de 2023 revela que os ataques automatizados por inteligência artificial (IA) a vários esquemas CAPTCHA obtiveram sucesso. Os pesquisadores recrutaram 1.400 participantes para testar sites que utilizavam quebra-cabeças CAPTCHA, representando 120 dos 200 sites mais populares do mundo. A precisão dos bots varia entre 85% e 100%, com a maioria superando os 96%. Isso ultrapassa significativamente a faixa de precisão observada em seres humanos (que varia de 50% a 85%).

O tempo de resolução dos bots é significativamente menor em todos os casos, exceto no caso do reCAPTCHA, onde o tempo de resolução humano de 18 segundos é quase igual ao tempo dos bots, que é de 17,5 segundos. O estudo foi conduzido na plataforma de crowdsourcing MTurk da Amazon e envolveu vários tipos de CAPTCHAs, incluindo identificação de chaminés, barcos, rotação de imagens, marcação de caixas de seleção e digitação de texto distorcido.

Curiosamente, em um ambiente contextualizado, o tempo de resolução humano diminui para 22 segundos, indicando que, nesse ambiente mais natural, os bots de IA são mais rápidos do que os humanos na resolução desses quebra-cabeças.

Apesar de ser um estudo inicial, já podemos observar em 2024 mudanças no CAPTCHA na tentativa de dificultar esta detecção. Vejam o exemplo abaixo:

Escolha o diferente

Observamos três mudanças principais adicionadas a esse modelo de quebra-cabeças:

a) Ausência de limites nas imagens internas: Diferentemente dos quebra-cabeças tradicionais, não há restrições quanto à quantidade de elementos na imagem. Isso dificulta a localização, separação e identificação do objeto pela IA.

b) Fundo com padrão colorido e em relevo: O fundo com padrões complexos cria dificuldades para a IA identificar o objeto e o contexto que o objeto está inserido. Geralmente a informação do contexto é retirada do que esta fora do objeto analisado.

c) Introdução de contexto subjetivo: Por exemplo, a instrução “escolha o que é diferente” não está explicitamente representada na imagem. Nesse caso, a IA precisa identificar vários objetos em tamanhos e ângulos diferentes e concluir se são iguais ou diferentes. Por exemplo, ela deve reconhecer que o sanduíche é diferente dos coelhos, mesmo considerando várias versões possíveis de coelhos.

Seguindo essa linha de raciocínio, poderíamos tornar o desafio ainda mais complexo, inserindo um contexto não explícito na imagem. Por exemplo: Marque o objeto que é uma “comida”. A maioria das pessoas provavelmente marcaria o sanduíche, embora o coelho também possa ser considerado uma “comida”.

Do ponto de vista da segurança, esse é um exemplo bastante explícito de como podemos explorar as falhas de segurança da IA para aprimorar nossa proteção contra as novas habilidades desenvolvidas por esses sistemas de IA.

Explorar as fraquezas da IA para melhorar os sistemas de segurança é um dos novos desafios da tecnologia.

Para saber mais:

(*) chrome-extension://efaidnbmnnnibpcajpcglclefindmkaj/https://arxiv.org/pdf/2307.12108.pdf

equipe desenvolvimento

Recent Posts

Golpes na Internet, Mídias Sociais e quebra de confiança da Rede, qual o nosso futuro?

Todos nós conhecemos alguém que já caiu em algum golpe na Internet, o que representa…

3 meses ago

A Internet está morta. Será?

Nos últimos meses, tenho observado discussões sobre a suposta “morte” da Internet, também conhecida como…

5 meses ago

Por que é tão complexo se proteger de ataques cibernéticos?

Para quem já está há mais de duas décadas no mercado de segurança da informação,…

6 meses ago

Em ‘Cybersecurity’, Seu Parceiro Pode Ser Seu Maior Problema: Ameaças na Cadeia de Suprimentos

A segurança cibernética é um campo onde as ameaças evoluem constantemente, e uma das áreas…

7 meses ago

Cibersegurança: oportunidades em ascensão para jovens profissionais de TI

Com uma projeção de mais de 600 mil vagas até 2030, a área de cibersegurança…

9 meses ago

Dia 20/03 será um dia histórico para a Cibersegurança

Proteger a Terra, o Céu, o Mar e o Espaço já não é suficiente. O…

9 meses ago