O que se passa na “mente” de um modelo de IA? Os investigadores da Anthropic decidiram averiguar e, através de dois novos estudos, mostram como o Claude, o modelo de linguagem de grande escala (LLM, na sigla em inglês) desenvolvido pela empresa, raciocina.
A Microsoft avança agora com o Researcher e o Analyst, dois novos agentes para o Copilot. Já a Google revela o Gemini 2.5, um modelo que reforça as capacidades de raciocínio avançado e que promete um desempenho melhorado, assim como um maior nível de precisão nas respostas.
Durante a apresentação de resultados, o presidente executivo da Nvidia, Jensen Huang, destacou a procura pelo chip Blackwell e fez elogios à decisão da startup chinesa DeepSeek de ter lançado o seu modelo de raciocínio em código aberto.
Chama-se projeto Strawberry e tem como objetivo encontrar um caminho para acabar com a maior fragilidade dos LLM, as alucinações. A OpenAI não fala dele, mas já há algumas informações sobre esta nova tecnologia da dona do ChatGPT.
A aplicação desafia o utilizador a completar 60 puzzles diferentes recorrendo ao menor número de ajudas possível. No final, atribui-lhe uma pontuação correspondente ao desempenho em todo o jogo.