Em março, a OpenAI lançou o GPT-4, a mais recente geração do seu modelo de Inteligência Artificial, presente, por exemplo, na versão paga do ChatGPT. O modelo, descrito como mais “poderoso”, chegou com melhorias, incluindo a capacidade de interpretar imagens. No entanto, meses após o lançamento, os utilizadores sentem uma queda no desempenho.

Nas redes sociais e em fóruns especializados multiplicam-se os relatos de utilizadores descontentes com o atual funcionamento do modelo, com alguns a indicaram que o modelo parece estar mais “preguiçoso” e que as suas capacidades já não são o que eram, avança o website Insider.

Como explica Sharon Zhou, CEO da Lamini, em declarações ao website, quando o GPT-4 começou a ser implementado, alguns utilizadores ficaram surpreendidos com a “lentidão” do modelo, embora os seus resultados tivessem um maior nível de precisão.

O modelo acabou por tornar-se mais rápido, mas o desempenho desacelerou, levando especialistas como Sharon Zhou a acreditar que a OpenAI está a fazer mudanças à forma como o modelo funciona.

Clique nas imagens para recordar as novas capacidades do GPT-4 

Ao que tudo indica, a empresa liderada por Sam Altman poderá estar a apostar numa abordagem chamada “Mixture of Experts” (MOE), afirma a CEO da Lamini. A abordagem envolve a criação de vários modelos GPT de menores dimensões e que, embora funcionem de modo semelhante ao principal, são treinados em áreas de conhecimento específicas.

Recentemente, vários especialistas em IA publicaram no Twitter dados acerca do que se acredita ser a arquitetura do GPT-4, apontando para a utilização desta abordagem, que não é propriamente uma novidade para a empresa. Aliás, em 2022, a OpenAI publicou uma investigação onde este tema é abordado e onde as suas vantagens são detalhadas.

Note-se que, para já, a OpenAI ainda não veio a público esclarecer se fez, de facto, mudanças ao modo de funcionamento do GPT-4, mas os especialistas defendem que esta poderá ser a razão por trás da aparente queda no desempenho do modelo.