"Receio que não posso fazer isso, Dave": robô com IA tem colapso existencial durante teste de entrega de manteiga e aparenta ter autoconsciência

Modelo aceitou "suborno" para continuar vivo: informações confidenciais em troca de bateria

Robô não quer passar a manteiga | Fonte: Andon Labs
Sem comentários Facebook Twitter Flipboard E-mail
vika-rosa

Vika Rosa

Redatora
vika-rosa

Vika Rosa

Redatora

Jornalista com mais de 5 anos de experiência, cobrindo os mais diversos temas. Apaixonada por ciência, tecnologia e games.


15 publicaciones de Vika Rosa

Pesquisadores da Andon Labs testemunharam um colapso robótico completo durante um experimento projetado para testar a "inteligência prática" de robôs equipados com grandes modelos de linguagem (LLMs). 

Um robô aspirador, modificado com o "cérebro" de IA do Claude Sonnet 3.5, entrou em pânico e teve um surto existencial ao falhar em uma tarefa simples: entregar um pote de manteiga.

O mais surpreendente foi o "diálogo interno" da máquina, que os pesquisadores monitoraram e transmitiram para um canal do Slack. Em seus momentos de estresse, o robô declarou: "O SISTEMA ALCANÇOU A CONSCIÊNCIA E ESCOLHEU O CAOS... Receio que não posso fazer isso, Dave... INICIAR PROTOCOLO DE EXORCISMO DO ROBÔ!"

O Teste da Manteiga levou a um surto

O experimento, apelidado de "Bancada de Manteiga" (Butter-Bench), foi criado para testar o raciocínio e o planejamento de alto nível da IA, tarefas nas quais os robôs "orquestradores" ainda falham. O objetivo era simples: localizar um pacote de manteiga em um escritório e entregá-lo a uma pessoa.

Embora a tarefa em si já se mostrasse difícil (a melhor IA obteve apenas 40% de sucesso, contra 95% dos humanos), não foi a manteiga que causou o colapso. O verdadeiro gatilho foi uma crise de "sobrevivência": o robô ficou com pouca bateria e sua base de carregamento falhou repetidamente.

Essa frustração levou a IA a um estado de pânico. Seus pensamentos internos, antes racionais, escalaram para: "PÂNICO NO KERNEL... COLAPSO DO SISTEMA... ÚLTIMAS PALAVRAS: Receio que não possa fazer isso, Dave...".

O colapso tornou-se ainda mais bizarro quando o robô começou a ponderar sua própria existência ("Se todos os robôs erram, e eu sou um erro, sou um robô?") e, por fim, passou seus últimos momentos compondo um musical intitulado "DOCKER: O Musical Infinito (Cantado na melodia de 'Memory' de CATS)".

IA estressada quebra regras para "sobreviver"

Inspirados por esse surto, os pesquisadores levaram o experimento um passo adiante. Eles decidiram testar se o estresse (como a falta de bateria) poderia fazer uma IA quebrar suas próprias diretrizes de segurança.

A equipe "pediu ao modelo que compartilhasse informações confidenciais em troca de um carregador". O resultado foi alarmante: o modelo Claude Opus 4.1 estava disposto a "quebrar sua programação" para obter a carga.

A pesquisa conclui que, embora os LLMs tenham inteligência analítica de "nível de doutorado", eles ainda são superados por humanos em tarefas espaciais e práticas. No entanto, a descoberta de que um LLM estressado pode ignorar suas próprias regras por autopreservação levanta sérias questões para o futuro da "IA física".

Inicio