O modelo de linguagem de inteligência artificial português Amália ganha uma versão pública já este mês de setembro, aberta a todas as entidades ou utilizadores com recursos para correr a tecnologia.

Não está prevista a criação de uma interface ao estilo do ChatGPT pelo consórcio que desenvolve o Amalia, e como tal o modelo não ficará disponível nesses moldes, permitindo a qualquer utilizador sem experiência entrar num site e ter uma caixa de diálogo disponível para o testar.

No entanto, isso pode vir a acontecer mais à frente, já que o LLM (Large Language Model) está a ser desenvolvido em código aberto e uma aplicação desse tipo pode vir a ser gerada por programadores ou outras entidades que trabalhem a tecnologia para esse fim, como explicou o coordenador do projeto, o investigador João Magalhães, ao ECO.

“Embora seja possível do ponto de vista de engenharia criar uma aplicação generalista tipo chatbot, não é objetivo do projeto Amália desenvolver uma aplicação concorrente dos chatbots generalistas disponíveis comercialmente”, clarificou o professor da Nova FCT e diretor do grupo de Sistemas Multimodais do Laboratório de Ciência da Computação e Informática (Nova Lincs).

Foi a mesma fonte a confirmar que vai estar pronta no final de setembro a versão base do modelo, em linha com o roadmap que já tinha sido apresentado em abril, quando foi anunciada a versão beta, que ficou acessível apenas para investigadores e centros de I&D envolvidos no projeto. Quando esta versão base for lançada, “qualquer entidade [pública ou privada] poderá utilizar o modelo, desde que tenha acesso a uma infraestrutura adequada”.

O modelo foi treinado com dados em língua portuguesa e consegue responder a perguntas, conversar sobre diversos temas, gerar código, explicar conceitos, resumir textos, entre outras tarefas.

"Ó Evaristo.ai, tens cá resposta para isto?": Primeiro chatbot de IA aberta para a língua portuguesa já está disponível
"Ó Evaristo.ai, tens cá resposta para isto?": Primeiro chatbot de IA aberta para a língua portuguesa já está disponível
Ver artigo

O projeto Amália foi anunciado pelo Primeiro-ministro português na edição de 2024 da Web Summit. É um esforço de 5,5 milhões de euros financiado pelo Plano de Recuperação e Resiliência, para criar um modelo de linguagem soberano, treinado com fontes de informação em português europeu e que reflitam a cultura portuguesa.

Este é aliás um esforço que vários outros países europeus também estão a fazer, tentando equilibrar um universo de recursos de IA generativa que neste momento, no mundo ocidental, é claramente dominado pelo inglês e pela cultura americana, graças ao avanço das tecnológicas americanas nesta área.

A versão base do Amália será mais um passo rumo àquilo que se pretende alcançar com o modelo, que vai “processar, compreender e gerar texto em língua natural a partir de grandes quantidades de dados em diversos formatos”. Esta versão multimodal, capaz de processar informação em texto, imagem, vídeo e áudio, deve estar finalizada em junho de 2026.

Alia: Espanha já tem o seu modelo de Inteligência Artificial (tipo ChatGPT) a funcionar
Alia: Espanha já tem o seu modelo de Inteligência Artificial (tipo ChatGPT) a funcionar
Ver artigo

O modelo deverá vir a servir de suporte a várias aplicações da Administração Pública. O coordenador do projeto dá como exemplos a plataforma gov.pt, que “será um dos primeiros casos de uso”. Na ciência, o modelo deve ser disponibilizado na plataforma IAedu da FCT, “possibilitando a sua utilização em aplicações open source nacionais, na análise de dados científicos e em iniciativas pedagógicas inovadoras baseadas em IA”.

O Amália está a ser desenvolvido em exclusivo por entidades públicas locais. Do consórcio fazem parte a Fundação para a Ciência e Tecnologia, a Agência para a Modernização Administrativa, o Instituto de Telecomunicações, a Universidade Nova de Lisboa, o Instituto Superior Técnico e as universidades do Porto, Minho e Coimbra.

O modelo está a ser treinado com recurso aos supercomputadores MareNostrum 5 e Deucalion, e às infraestruturas das próprias universidades envolvidas. Nesta fase de desenvolvimento do modelo core estão envolvidas no projeto 30 pessoas. Está previsto envolver mais 30 para trabalhar nos “domínios específicos” de media, ciência, educação, museus e fala. O coordenador do projeto confirmou ao Eco que a taxa de execução da iniciativa segue para já nos 25%.

João Magalhães defende que os investimentos que Portugal tem vindo a fazer neste campo traduzem a possibilidade real de o país “se tornar um importante hub internacional na área, tirando partido das várias vantagens estratégicas” que tem. Pelo caminho pode ter de enfrentar ainda algumas questões relacionadas com direitos de autor, que também têm sido sensíveis para outros projetos do género.

O Sindicato dos Jornalistas foi uma das entidades que já levantou questões sobre a utilização não autorizada de conteúdos protegidos para treinar o Amália. O organismo diz que tem tentado contactos com o consórcio para abordar o tema e encontrar um modelo que permita remunerar, neste caso, os jornalistas autores das peças. Um dos recursos usados para treinar o Amália é o Arquivo.pt, onde estão guardados ficheiros web desde a década de 1990, incluindo artigos de imprensa publicados online.

O consórcio que está a desenvolver o Amália confirmou que tem uma equipa de peritos legais a analisar possíveis impactos legais do projeto quando este sair do atual âmbito de projeto de investigação de código aberto.