Uma equipa composta por investigadores da Universidade de Washington, a Microsoft e a Assembly AI publicou um estudo sobre o que a inteligência artificial pode fazer para isolar fontes de ruído e criar áreas de silêncio. Na prática trata-se de um sistema ligado a auscultadores com cancelamento de ruído que tem a capacidade, não apenas de isolar o ruído para o utilizador, como os intervenientes da conversa dentro desta “bolha”. Esta abrange as pessoas num raio de 2 metros que podem conversar com interferência reduzida do ruído externo.

Imagine que está numa festa ou uma reunião, com muito barulho, mas ao utilizar os auscultadores pode ter uma conversa tranquila com outras pessoas que estejam nesse perímetro abrangido pela IA. Todos os ruídos que estejam fora dessa área são suprimidos, permitindo aos intervenientes ouvirem melhor.

Segundo é explicado no estudo publicado na Nature, o headset inteligente tem um sistema baseado em redes neurais em tempo real, que utilizam dados acústicos de até seis microfones integrados nuns auscultadores com cancelamento de ruído a correr no equipamento. Este processa bocados de áudio de 8 ms em 6,36 ms numa unidade de processamento central embutida. A rede neural consegue gerar bolhas de som com um raio programável entre 1 a 2 metros, com capacidade de gerar sinais de output que reduzem a intensidade dos sons fora dessa bolha em 49 dB.

Veja no vídeo o exemplo do cancelamento de ruído dos auscultadores:

Na experiência feita e demonstrada no vídeo, sem qualquer contacto com um ambiente ou utilizadores, o sistema consegue focar-se até dois intervenientes dentro da bolha e uma ou duas pessoas a fazer barulho fora do local silencioso.

O estudo aponta ainda que os auscultadores com cancelamento de ruído podem suprimir sons em torno do utilizador, mas não conseguem perceber a distância ou seletivamente programar cenários acústicos com base nas distâncias dos intervenientes. E a percepção de distância do sistema auditório humano é igualmente limitado. Apesar de determinar a direção angular da fonte de áudio, estimar a distância é algo m ais desafiante para o ouvido humano. “Essa percepção de distância torna-se ainda mais desafiante com sons não familiares em ambientes desconhecidos”, aponta o documento.

Quando a interferência e o ruído ficam mais altos, a nossa capacidade de foco nas pessoas por perto torna-se mais difícil. Foi esse o desafio da equipa de investigadores, criar uma “bolha” de som onde no interior os interlocutores de uma conversa se conseguem ouvir e o ruído externo são suprimidos. Nos exemplos dados, pode ser utilizado num restaurante onde o sistema pode ser ativado para uma conversa sossegada na sua mesa. Uma numa sala de conferências onde está muita gente a falar em sobreposto.

auscultador cancelamenro ruído
auscultador cancelamenro ruído Creditos: Universidade de Washington

Os investigadores dizem que o sistema poderá ser utilizado em outros ambientes ruidosos tais como aviões, onde os sons fora são suprimidos, mas consegue-se ouvir a hospedeira quando se aproxima do utilizador. Estes cenários requerem os auscultadores com cancelamento de ruído que consigam suprimir todos os sons e ainda reproduzir de volta os sons dentro da bolha.

De um modo resumido, o estudo diz que os auscultadores precisam de corrigir os desafios relacionados com os sistemas de audição e os algoritmos de deep-learning em tempo real. O sistema precisa primeiro de identificar todas pessoas a falar dentro da bolha baseado na distância de quem utiliza o headset e separá-los da bolha com os de fora.

Outro desafio apontado é que o output de som deve ser sincronizado com os sentidos visuais do utilizador. Isso requer redes neurais a correr no equipamento em tempo real, utilizando apenas capacidades computacionais limitadas, para que tenha os requisitos de latência necessários, menos de 20-30 ms. As redes neurais devem ter a capacidade de criar diferentes tamanhos da bolha e suportar a configuração de distâncias.

Por fim, a rede neural deve conseguir adaptar-se a novos utilizadores e mais ambientes sonoros que podem mudar entre salas.