O Facebook revelou um novo programa de ensino de inteligência artificial através do vídeo, chamado Learning from Videos. O objetivo é que a IA seja melhorada e apurada através da aprendizagem automática de representações visuais, de áudio e texto. Para isso conta com o uso de vídeos públicos que sejam submetidos para o seu website. A rede social diz que vai melhorar os seus sistemas nucleares de IA para utilização em aplicações como recomendações de conteúdo ou ajudar no reforço de regras de utilização. Já no início do mês de março o Facebook tinha revelado um sistema de reconhecimento e aprendizagem através de imagens com um modelo inteligente chamado SEER (SELf-supERvised).

“A aprendizagem contínua sobre o mundo que nos rodeia é uma das marcas da inteligência humana”, salienta o Facebook no seu blog. A empresa compara que tal como somos capazes de aprender rapidamente a reconhecer pessoas, lugares, coisas ou ações através da observação, também os sistemas de IA serão mais inteligentes e mais úteis se conseguirem imitar a forma como os humanos aprendem.

E dá como exemplos os avanços tecnológicos que foram feitos nos últimos anos na aprendizagem feita através da fala, visão e linguagem, fazendo com que a IA dependesse menos de conjuntos de dados marcados, que a empresa diz atrasar o ritmo da inovação.

Ao aprender com os vídeos disponíveis publicamente em todos os países, com centenas de línguas, o sistema de IA do Facebook pretende não só melhorar a sua eficácia, mas como adaptar-se ao mundo sempre em movimento, reconhecendo as nuances e pistas visuais das diferentes culturas e regiões. E a empresa pretende aperfeiçoar os modelos de IA para honrar a privacidade das pessoas, construindo as infraestruturas necessárias para aplicar os requisitos nos seus sistemas sempre que for preciso, incluindo as proteções técnicas ao longo do ciclo de vida dos dados.

Nos testes preliminares, durante os seis primeiros meses de desenvolvimento da infraestrutura da compreensão de vídeo, foi introduzido um modelo de IA no sistema de recomendações do Reels do Instagram. As primeiras experiências mostraram uma redução de 20% nos erros de reconhecimento de voz.

Em exemplo prático, o Facebook diz que os sistemas de IA podem aprender automaticamente a encontrar e disponibilizar memórias-chave, para além dos habituais rótulos de datas e localizações. Para encontrar vídeos que se encaixem em frases como “mostra-me todas as vezes que cantámos os Parabéns à avó”. Nesse sentido, esse tipo de memórias requer que o sistema aprenda a cruzar a frase com bolos, velas e pessoas a cantar em torno de uma aniversariante.

No futuro, o Facebook espera que os wearables como os óculos de realidade aumentada tornem mais fácil a captura, sem o uso das mãos. E nesse sentido, as pessoas podem rapidamente aceder às suas memórias digitais com a mesma facilidade com que as captam.