Desde 2016 que o Facebook tem usado Inteligência Artificial para descrever imagens na rede social, uma funcionalidade direcionada às pessoas com dificuldades ou deficiências visuais. Agora, a empresa liderada por Mark Zuckerberg fez melhorias ao sistema que gera texto automático alternativo (ATT na sigla em inglês), de forma a disponibilizar mais informação sobre o que se passa nas fotografias publicadas.

A empresa explica que expandiu o número de conceitos que o sistema consegue detetar com precisão. As descrições apresentadas são agora mais detalhadas, uma vez que é capaz de identificar, por exemplo, atividades, monumentos ou lugares com importância histórica e cultural, assim como diferentes tipos de animais.

Entre as melhorias introduzidas destaca-se também a disponibilização de informação sobre a posição e tamanho relativo dos elementos. O Facebook detalha que em vez de descrever uma fotografia com a legenda “Pode ser uma imagem de 5 pessoas”, o sistema especifica que duas pessoas estão no centro da foto e que as outras três estão nas margens.

Facebook | descrição automática de imagens Facebook | descrição automática de imagens
créditos: Facebook

Em vez de descrever uma paisagem com a legenda “Pode ser uma casa e uma montanha”, o sistema pode realçar que a montanha é o foco principal da fotografia, baseando-se na sua dimensão relativa em comparação com a casa.

Nova funcionalidade do Facebook ajuda cegos a “verem” imagens
Nova funcionalidade do Facebook ajuda cegos a “verem” imagens
Ver artigo

De acordo com o Facebook, a primeira versão do ATT foi desenvolvida com recurso a dados legendados por humanos, que foram depois usados para treinar uma rede neuronal com milhões de exemplos.

Na versão mais recente, o sistema recorre a um novo método, que apesar de ter um menor nível de supervisão humana dos dados, baseia-se em milhares de milhões de fotografias públicas do Instagram e respetivos hashtags. O ATT passa a ter conhecimento de mais de 1.200 conceitos, sendo também mais culturalmente e demograficamente inclusivo.

Com base no feedback dos utilizadores que usam software para ler o texto alternativo, a rede social ajustou o sistema para dar informações mais sucintas por definição, havendo a possibilidade de obter uma descrição mais detalhada para fotos que considerem de maior importância, como da família e amigos, ou que se relacionem com os seus interesses.