Os modelos de inteligência artificial mais recentes são apontados como menos confiáveis, por serem menos transparentes e menos inclinados a admitir quando não sabem a resposta a uma pergunta que lhes coloquem, segundo um novo estudo conduzido por investigadores da Universitat Politècnica de València.
A equipa testou a precisão dos Large Language Models (LLM) com milhares de perguntas de matemática, ciências e geografia. As respostas dos modelos foram classificadas em três categorias: corretas, incorretas ou esquivas e embora os novos modelos tenham apresentado melhor desempenho em problemas complexos, houve uma queda na transparência.
Se nas versões anteriores admitiam quando não conseguiam responder, pedindo mais informação ou reconhecendo as suas limitações, os novos modelos de inteligência artificial como o GPT-4 tendem mais a “inventar”, até mesmo com perguntas fáceis.
“Embora os novos modelos sejam mais precisos em questões desafiadoras, falham em perguntas básicas. Não há uma melhoria aparente na confiabilidade total, nem mesmo em níveis de dificuldade baixos”, destaca o estudo.
O GPT-4, por exemplo, reduziu drasticamente a quantidade de respostas esquivas em comparação ao GPT-3.5, mas isso não resultou numa maior precisão.
O estudo sugere que, à medida que os LLM evoluem, o tamanho, volume de dados e capacidade de processamento aumentam, mas a expansão pode estar a comprometer a confiabilidade. De acordo com os autores, "a expectativa de que modelos mais recentes evitassem respostas fora do seu desígnio não se confirmou".
Os investigadores concluem que, apesar dos avanços na tecnologia, os novos LLM ainda não garantem segurança em suas respostas e ressaltam a importância de mudanças no design e desenvolvimento dessas inteligências artificiais, especialmente em áreas de alto risco, onde a previsibilidade dos erros é crucial.
Pergunta do Dia
Em destaque
-
Multimédia
The Spectrum: nova versão moderna replica design do microcomputador original -
App do dia
Um RPG de aventura com design retro no conhecido universo da Disney para smartphones -
Site do dia
Deixe o Choosy Chat escolher a melhor resposta entre o ChatGPT, Gemini e Claude -
How to TEK
Torne o smartphone Android mais inteligente trocando o Google Assistant pelo Gemini
Comentários