Às vezes a gente pensa que a IA é uma grande máquina feita para todo tipo de tarefa. Mas, na prática, os modelos de linguagem são bem mais versáteis, e tudo depende dos textos usados no treinamento.
Foi assim com Hayk Grigorian, estudante de ciência da computação no Muhlenberg College, na Pensilvânia. Ele treinou sua IA com textos de Londres entre 1800 e 1875 para conseguir respostas no estilo da época vitoriana.
Segundo contou em um post no Reddit, Grigorian treinou a IA com cerca de 7 mil textos da época e ainda usou um tokenizador personalizado para eliminar todo o vocabulário moderno do conjunto de dados.
Na verdade, ele chegou a treinar três modelos diferentes: dois com o nanoGPT e um com o Phi 1.5. O resultado foi uma inteligência artificial que não só adota os maneirismos da época, mas também o vocabulário e várias referências específicas daqueles anos.
Ele explica o que aconteceu em seguida: “Depois de treinar, comecei a brincar com alguns prompts e usei este: ‘Era o ano de nosso Senhor 1834’”. A resposta citava uma série de protestos que aconteceram em Londres naquele ano, além de trazer uma referência bíblica ligada ao estilo dos textos usados no treinamento.
Também apareciam menções muito específicas, como a um tal Lord Palmerston.
A surpresa veio quando Grigorian resolveu checar a informação
“Queria saber se realmente tinha acontecido um protesto em Londres em 1834, e de fato aconteceu. Achei que pudesse ser só coincidência, mas o resultado também mencionava ‘Lord Palmerston’. Pesquisei no Google e descobri que suas ações estavam ligadas aos protestos de 1834. Ou seja, a IA foi além de imitar textos do século XIX e mostrou que podia recuperar acontecimentos históricos reais. E isso tudo com apenas 5 ou 6 GB de dados. Imagine com 30 GB ou mais.”
Palmerston mais tarde se tornou primeiro-ministro, mas antes ocupou o cargo de Secretário de Relações Exteriores da Grã-Bretanha. Foi justamente nesse período, em 1834, que a Lei dos Pobres retirou dos mais necessitados o direito à subsistência, provocando a grande onda de protestos citada pela IA de Grigorian.
De acordo com o ArsTechnica, esse tipo de projeto é chamado de HLLM, sigla em inglês para Historical Large Language Models. Há vários exemplos, como o MonadGPT, treinado com textos de 1400 a 1700, e o XunziALLM, que é capaz de gerar poesia clássica chinesa seguindo as normas antigas.
Ver 0 Comentários