Os investigadores da Microsoft desenvolveram um novo sistema baseado em inteligência artificial que promete ser mais eficaz a descrever imagens do que os humanos. O sistema foi usado para atualizar a Seeing AI, a aplicação criada pela gigante tecnológica para ajudar pessoas com dificuldades ou deficiências visuais a "ler" o mundo a seu redor.

A Microsoft explica que o sistema de IA permite melhorar significativamente o desempenho da aplicação. Além de ser capaz de identificar objetos, a tecnologia consegue descrever a relação entre eles de uma forma mais precisa.

De acordo com Lijuan Wang, um dos principais investigadores do laboratório de pesquisa da empresa, a legendagem de imagens é um dos desafios centrais do mundo da visão computacional, pois a IA precisa de perceber e descrever os conteúdos ou ações principais que estão a ser apresentados.

Assim, a IA passou por um processo de “pré-treino” com um dataset repleto de imagens que continham etiquetas apenas com palavras associadas aos objetos apresentados em vez de frases completas.

Depois de ter ganho um vocabulário visual, a IA foi treinada novamente para aprender a construir frases com a informação que lhe tinha sido disponibilizada. Ao ser avaliada no nocaps, uma ferramenta de benchmark para sistemas de legendagem de imagens, a criação da Microsoft conseguiu alcançar uma pontuação alta, saltando para o topo da tabela.

A empresa vai disponibilizar também o novo sistema de IA como parte dos serviços cognitivos do Azure, para que qualquer developer os possa incluir nos seus projetos. Em breve, a tecnologia vai ser incorporada em produtos da Microsoft, como a suite de produtividade do Office, para ajudar os utilizadores a criar texto alternativo para as imagens.