Um novo estudo, desenvolvido por uma equipa de investigadores da Universidade de Coimbra, em colaboração com a Indra Group, revela vulnerabilidades em modelos avançados de IA.
Não perca nenhuma notícia importante da atualidade de tecnologia e acompanhe tudo em tek.sapo.pt
De acordo com os investigadores, mais de 80% dos modelos testados geram código inseguro quando são expostos a ataques de manipulação dissimulados. Além disso, técnicas multi-turno e de role-play continuam a ser capazes de contornar mecanismos de segurança considerados robustos.
O estudo indica também que os modelos mais recentes, como o Llama 3.1:70b, mostram avanços na distinção entre risco real e aparente, mas mantêm fragilidades contextuais que exigem vigilância constante.
Após analisarem os riscos e vulnerabilidades, assim como dos dilemas éticos da IA, os investigadores desenvolveram uma proposta de enquadramento para testar a segurança dos modelos de linguagem de grande escala (LLM, na sigla em inglês).
Citada em comunicado, a equipa realça que o verdadeiro desafio da próxima geração de IA será encontrar um equilíbrio entre utilidade e risco, construindo sistemas “seguros por design”.
Nas palavras de João Donato e João Campos, investigadores da Universidade de Coimbra e autores do estudo, “a segurança da IA precisa de ser mensurável, comparável e contínua. Só assim será possível criar confiança digital real e sustentável”.
O enquadramento proposto permite avaliar e comparar a robustez dos modelos face a diferentes tipos de ataques. Para tal, são combinadas métricas objetivas, com cenários realistas e um “júri automatizado” de modelos independentes, indicam os investigadores.
Segundo a equipa, o papel da tecnologia é decisivo na deteção precoce das vulnerabilidades e, aqui, ferramentas de monitorização, algoritmos de análise comportamental e sistemas automatizados de auditoria são essenciais para identificar riscos antes que possam comprometer a integridade dos modelos de IA.
Assine a newsletter do TEK Notícias e receba todos os dias as principais notícias de tecnologia na sua caixa de correio.
Em destaque
-
Multimédia
IRON é (mesmo) um robot humanoide ou um humano disfarçado? Xpeng tira a limpo as dúvidas -
Site do dia
Faça a edição de ficheiros PDF gratuitamente online no website Sedja -
App do dia
North War: Island Defense 3D desafia à construção de um exército e recuperar o reino perdido -
How to TEK
Organize as suas reuniões e videochamadas através do agendamento no WhatsApp
Comentários