Já temos uma IA que não sabe absolutamente nada do que aconteceu depois de 1930. E ela é bastante útil

Um dos problemas dos modelos de linguagem é que existe uma data de corte nos dados de treinamento, ou seja, o modelo não conhece fatos atuais que vão além dessa data. Esse ponto, que pode ser um problema em certos setores, é justamente o objetivo do Talkie-1930, um modelo de linguagem treinado apenas com textos anteriores a 1930. Se você já se perguntou como seria conversar com alguém do passado, existe uma IA para isso.

Modelos “vintage” — é assim que estão sendo chamados esses LLMs treinados com conteúdo histórico. O Talkie-1930 é um modelo com 13 bilhões de parâmetros que não tem acesso a informações modernas nem pode consultar a internet, sendo treinado exclusivamente com livros, jornais e outros textos anteriores a 1930.

Para explorar o modelo, os pesquisadores colocaram o Claude para conversar com ele, avaliando suas respostas. O modelo demonstrou grande conhecimento de mundo, com muitos detalhes históricos da época, além de uma forte capacidade de imitar o estilo de autores vitorianos como Dickens, embora com algumas limitações em formatos mais satíricos.

Mais do que um experimento cultural

O Talkie é o mais próximo de conversar com alguém que viveu no início do século 20. Isso transforma o modelo em uma janela que nos permite explorar a mentalidade e a cultura de uma época passada e entender como eram descritas a sociedade, a política e a vida cotidiana daquele período. Mas, além da curiosidade, o Talkie-1930 também funciona como um “grupo de controle” para estudar melhor o funcionamento da IA e alcançar avanços importantes.

Em Xataka Brasil

Não são tão inteligentes: computadores quânticos "esquecem" maior parte de seu trabalho, afirmam cientistas

Por estar “congelado” em 1930, o Talkie permite medir melhor até que ponto um modelo consegue extrapolar e prever o futuro apenas a partir de padrões históricos, sem recorrer a dados posteriores. Para testar essa capacidade de antecipação, os pesquisadores mostraram ao modelo até 5.000 descrições de eventos históricos posteriores, retiradas da seção “On this day” do New York Times, e mediram o grau de surpresa do modelo.

O resultado foi que o modelo demonstrou maior surpresa nas décadas imediatamente posteriores ao corte de dados, especialmente nos anos 1950 e 1960, mas, depois, esse nível de surpresa se estabilizou. Segundo os pesquisadores, isso sugere que a capacidade preditiva melhora conforme o horizonte temporal se amplia, embora destaquem que será necessário treinar modelos ainda mais antigos para medir isso com precisão.

Em Xataka Brasil

Achávamos que a Inteligência Artificial roubaria todas as profissões, mas estávamos errados: a lista de empregos que os próprios criadores da tecnologia admitem não conseguir substituir

Demis Hassabis, CEO do Google DeepMind, levantou uma questão muito interessante em uma conferência recente: se uma IA com limite de conhecimento até 1911 seria capaz de chegar à teoria da relatividade que Einstein descobriu em 1915. Nesse sentido, modelos como o Talkie-1930 são uma ferramenta muito interessante para observar se sua capacidade de gerar novas ideias pode levar a descobertas.

Os modelos treinados com grandes volumes de dados atuais têm um problema de “contaminação”, nos quais frequentemente acabam incluídos também os próprios dados de avaliação, o que leva a uma superestimativa de suas capacidades. Com os modelos “vintage”, não há esse tipo de contaminação, o que permite realizar experimentos muito específicos, como verificar se o modelo é capaz de aprender a programar sem ter qualquer conhecimento prévio de informática. O Talkie-1930 é de código aberto e está disponível no GitHub.

Imagem | Xataka

Este texto foi traduzido/adaptado do site Xataka Espanha.

Mais do que um experimento cultural

RECEBA "", NOSSA NEWSLETTER SEMANAL