Alguma vez se questionou se o chatbot que utiliza conhece integralmente o texto de um livro protegido por direitos de autor? A resposta está agora mais acessível graças a uma nova investigação com participação portuguesa. Uma equipa de especialistas desenvolveu uma forma mais eficaz de extrair conteúdo memorizado de Grandes Modelos de Linguagem (LLMs), uma inovação que promete impactar as discussões sobre regulação e direitos de autor no mundo da IA.
Não perca nenhuma notícia importante da atualidade de tecnologia e acompanhe tudo em tek.sapo.pt
A equipa de investigadores, que conta com André Duarte e Arlindo Oliveira do Instituto Superior Técnico (IST) e do INESC-ID, em colaboração com a Universidade Carnegie Mellon e a Hydrox AI, descreveram a sua abordagem num artigo sobre o sistema batizado de RECAP. O argumento central é que, face à opacidade dos fornecedores de IA que não revelam os seus dados de treino, são necessárias ferramentas capazes de auditar o que estes modelos realmente "sabem".
Até agora, técnicas anteriores falhavam frequentemente porque os modelos atuais são treinados para alinhar-se com normas de segurança, recusando pedidos diretos para citar obras protegidas. O RECAP funciona como um "agente" de software que utiliza um ciclo de feedback iterativo para extrair informações. Ao contrário de um utilizador comum que desiste após uma recusa, o sistema emprega uma componente de "jailbreak" que reformula os pedidos para contornar a resistência do modelo.
O processo envolve um segundo agente que revê os resultados e fornece orientações para refinar a resposta, conseguindo que a IA revele o que memorizou sem que o próprio sistema de teste contamine o resultado com o texto original.
Os resultados são expressivos: nos testes realizados, o RECAP superou o melhor método anterior em cerca de 78%. A título de exemplo, a equipa conseguiu extrair aproximadamente três mil passagens do primeiro livro de Harry Potter utilizando o modelo Claude-3.7, um feito notável quando comparado com as apenas 75 passagens identificadas pelas técnicas convencionais.
André Duarte sublinha que, embora o foco recaia frequentemente sobre o material protegido por direitos de autor devido às implicações legais, o objetivo científico é compreender o fenómeno da memorização em si. Esta ferramenta surge assim como um passo fundamental para garantir maior transparência, permitindo a reguladores e criadores verificar se obras proprietárias foram indevidamente utilizadas no treino destes complexos cérebros digitais.
Assine a newsletter do TEK Notícias e receba todos os dias as principais notícias de tecnologia na sua caixa de correio.
Em destaque
-
Multimédia
Windows: Da “janela” para o computador ao “ecrã para a IA” em quatro décadas de transformação -
App do dia
Com o Lego Builder, as instruções em papel transformam-se numa experiência 3D e colaborativa -
Site do dia
Concurso de fotografia da Nikon revela a beleza oculta do mundo microscópico. Veja as melhores imagens -
How to TEK
Os vídeos automáticos são irritantes? Saiba como desligar o player nos browsers
Comentários