Um dos problemas dos modelos de linguagem é que existe uma data de corte nos dados de treinamento, ou seja, o modelo não conhece fatos atuais que vão além dessa data. Esse ponto, que pode ser um problema em certos setores, é justamente o objetivo do Talkie-1930, um modelo de linguagem treinado apenas com textos anteriores a 1930. Se você já se perguntou como seria conversar com alguém do passado, existe uma IA para isso.
Modelos “vintage” — é assim que estão sendo chamados esses LLMs treinados com conteúdo histórico. O Talkie-1930 é um modelo com 13 bilhões de parâmetros que não tem acesso a informações modernas nem pode consultar a internet, sendo treinado exclusivamente com livros, jornais e outros textos anteriores a 1930.
Para explorar o modelo, os pesquisadores colocaram o Claude para conversar com ele, avaliando suas respostas. O modelo demonstrou grande conhecimento de mundo, com muitos detalhes históricos da época, além de uma forte capacidade de imitar o estilo de autores vitorianos como Dickens, embora com algumas limitações em formatos mais satíricos.
Mais do que um experimento cultural
O Talkie é o mais próximo de conversar com alguém que viveu no início do século 20. Isso transforma o modelo em uma janela que nos permite explorar a mentalidade e a cultura de uma época passada e entender como eram descritas a sociedade, a política e a vida cotidiana daquele período. Mas, além da curiosidade, o Talkie-1930 também funciona como um “grupo de controle” para estudar melhor o funcionamento da IA e alcançar avanços importantes.
Por estar “congelado” em 1930, o Talkie permite medir melhor até que ponto um modelo consegue extrapolar e prever o futuro apenas a partir de padrões históricos, sem recorrer a dados posteriores. Para testar essa capacidade de antecipação, os pesquisadores mostraram ao modelo até 5.000 descrições de eventos históricos posteriores, retiradas da seção “On this day” do New York Times, e mediram o grau de surpresa do modelo.
O resultado foi que o modelo demonstrou maior surpresa nas décadas imediatamente posteriores ao corte de dados, especialmente nos anos 1950 e 1960, mas, depois, esse nível de surpresa se estabilizou. Segundo os pesquisadores, isso sugere que a capacidade preditiva melhora conforme o horizonte temporal se amplia, embora destaquem que será necessário treinar modelos ainda mais antigos para medir isso com precisão.
Demis Hassabis, CEO do Google DeepMind, levantou uma questão muito interessante em uma conferência recente: se uma IA com limite de conhecimento até 1911 seria capaz de chegar à teoria da relatividade que Einstein descobriu em 1915. Nesse sentido, modelos como o Talkie-1930 são uma ferramenta muito interessante para observar se sua capacidade de gerar novas ideias pode levar a descobertas.
Os modelos treinados com grandes volumes de dados atuais têm um problema de “contaminação”, nos quais frequentemente acabam incluídos também os próprios dados de avaliação, o que leva a uma superestimativa de suas capacidades. Com os modelos “vintage”, não há esse tipo de contaminação, o que permite realizar experimentos muito específicos, como verificar se o modelo é capaz de aprender a programar sem ter qualquer conhecimento prévio de informática. O Talkie-1930 é de código aberto e está disponível no GitHub.
Imagem | Xataka
Este texto foi traduzido/adaptado do site Xataka Espanha.
Ver 0 Comentários