Você pensou que estava resolvendo um CAPTCHA para acessar um site; na realidade, você estava treinando uma IA

O reCAPTCHA nunca foi um sistema projetado exclusivamente para impedir spam, mas sim para resolver problemas de IA que o Google não conseguia resolver sozinho

Você pensou que estava resolvendo um CAPTCHA para acessar um site. Na realidade, você estava treinando uma IA.
Sem comentários Facebook Twitter Flipboard E-mail
fabricio-mainenti

Fabrício Mainenti

Redator

Isso acontece conosco todos os dias: tentamos acessar um site e, de repente, uma grade de fotos de baixa qualidade exige que identifiquemos todos os semáforos, ônibus ou até mesmo hidrantes. Ao resolvermos esses quebra-cabeças, não estamos apenas provando que não somos robôs: estamos trabalhando para o Google.

Escravos do Google

No início dos anos 2000, os bots estavam destruindo a internet, mas um jovem chamado Luis von Ahn teve uma ideia brilhante para detê-los. Ele criou o CAPTCHA, um sistema que nos obrigava a identificar palavras distorcidas para provar que éramos humanos e, assim, obter acesso ao conteúdo. Esse sistema evoluiu, e o Google comprou a ideia e a transformou em um sistema perfeito para algo que mal percebemos: trabalhar para eles.

Do Google Maps ao Waymo

Desde então, o Google não parou de usar o sistema para dois objetivos interligados. O primeiro, de fato, é nos proteger dos bots. A segunda estratégia, também bem conhecida, mas muito mais lucrativa para a empresa, é nos transformar em rotuladores de informações. Os usuários da internet primeiro reconheceram palavras e se tornaram um gigantesco sistema de OCR que foi aplicado ao Google Maps.

Depois, com as imagens, acabamos contribuindo para uma melhoria significativa nos sistemas de reconhecimento de imagem do Google. Isso serviu, entre outras coisas, para alimentar os sistemas de direção autônoma da Waymo.

Consenso estatístico

Como o Google sabe que, quando escolhemos um hidrante ou um ônibus, estamos respondendo corretamente? Ele sabe por meio do que é chamado de "consenso estatístico". O Google geralmente apresenta imagens em pares: uma delas (a imagem de controle) já foi identificada por milhares de pessoas, enquanto a outra é uma imagem "órfã" que seus algoritmos de visão computacional não conseguem decifrar.

Se você adivinhar corretamente a imagem conhecida, o Google presume que você é humano e usa sua resposta sobre a imagem desconhecida para preencher seu banco de dados.

Nós somos o produto

Você provavelmente já estava bem ciente dessa realidade, mas agora começa a surgir um debate sobre a ética e a propriedade do trabalho digital. Vimos isso com as redes sociais, que prosperaram com nosso conteúdo, e certamente se aplica também ao Google: até que ponto é legítimo uma empresa ter uma infraestrutura de IA massiva graças aos bilhões de horas de "microtarefas" não remuneradas realizadas por seus usuários?

Aqui, o famoso ditado "se não paga pelo produto, você é o produto" ressurge. É verdade que esses sistemas do Google nos protegeram de bots, e não pagamos por eles "com dinheiro"... mas pagamos com as microtarefas que realizamos ao resolver os quebra-cabeças do reCAPTCHA.

Será possível envenenar o algoritmo?

Aqui também surgem dúvidas sobre a real confiabilidade do sistema. Se um grupo massivo de usuários decidisse rotular semáforos ou hidrantes incorretamente de forma organizada, um carro autônomo tomaria decisões perigosas no mundo real?

Esse risco parece razoável e, considerando que os modelos de IA são cada vez mais capazes de raciocínio abstrato e até mesmo de quebrar CAPTCHAs, um ataque de bot de IA que fizesse algo assim representa uma ameaça preocupante.

Você pensou que estava resolvendo um CAPTCHA para acessar um site. Na realidade, você estava treinando uma IA.

O CAPTCHA invisível

O próprio Google sabe que os CAPTCHAs visuais já não são tão impenetráveis ​​para as máquinas, por isso vem migrando os seus sistemas para o reCAPTCHA v3, um sistema invisível que não exige que procure autocarros, passadeiras ou hidrantes que nunca verá em uma rua de Málaga ou Bilbau. Em vez disso, este sistema analisa de forma opaca o seu comportamento no computador: como move o mouse, que cookies tem instalados e como navega.

Ou seja: o Google pensa que sabe como um humano se comporta quando está prestes a clicar em "Não sou um robô"... quando já trabalhamos como robôs e resolvemos estes enigmas há anos.

Uma ideia brilhante

O que é certo é que o CAPTCHA foi uma ideia brilhante com implicações que nem o Google poderia ter previsto. Na verdade, transformou esta ferramenta numa forma de alimentar os seus sistemas de inteligência artificial com a nossa ajuda, sem que praticamente nos apercebamos (ou nos importemos muito).

Mas sabe de uma coisa? Da próxima vez que um site pedir para você identificar hidrantes antes de entrar, lembre-se de que você não está demonstrando sua humanidade. Você está registrando o ponto para o turno da tarde em uma das maiores fábricas de dados do planeta.

Inicio