A Comissão Federal de Comunicações (FCC, na sigla em inglês) multou a Lingo Telecom, operadora de telecomunicações usada para transmitir chamadas automáticas com a imitação da voz do Presidente Joe Biden, geradas com inteligência artificial, e que desencorajavam os eleitores a votar nas primárias de New Hampshire, em janeiro.

A Lingo Telecom vai pagar à FCC um milhão de dólares e deverá demonstrar e aplicar um plano de conformidade que exigirá o cumprimento rigoroso das regras de autenticação de identificação de chamadas, para evitar novos deepfakes no futuro.

“A potencial combinação da utilização indevida da tecnologia de clonagem de voz por IA generativa e da falsificação do identificador de chamadas na rede de comunicações dos EUA representa uma ameaça significativa”, diz Loyaan A. Egal, chefe do Gabinete de Aplicação da Lei, em comunicado. A mensagem enviada é forte, acrescenta, “os prestadores de serviços de comunicações são a primeira linha de defesa contra essas ameaças e serão responsabilizados para garantir que fazem a sua parte para proteger o público americano”.

mensagem gravada foi enviada para entre 5.000 e 25.000 eleitores dois dias antes das primárias de 23 de janeiro e uma gravação da chamada analisada pela Associated Press gerava uma voz semelhante à do democrata Joe Biden, incluindo a sua frase frequentemente utilizada: “What a bunch of malarkey” (Que monte de disparates, na tradução em português).

Como o áudio Deepfake pode interferir nas eleições: Governos e cidadãos devem estar atentos à desinformação
Como o áudio Deepfake pode interferir nas eleições: Governos e cidadãos devem estar atentos à desinformação
Ver artigo

Poucas semanas depois do incidente com a voz de Biden, os Estados Unidos proibiram imitações de voz com inteligência artificial em chamadas automáticas. A proibição decretada pelo regulador federal das comunicações, a Federal Trade Commission, foi uma reação à utilização das voicefakes nas primárias.

A tecnologia que permite a clonagem de vozes continua em desenvolvimento. A OpenAi, detentora do ChatGPT, partilhou, em abril, os resultados preliminares de um modelo de clonagem de voz em desenvolvimento, chamado Voice Engine, que usa uma entrada de texto e uma única amostra de áudio de 15 segundos. Segundo a OpenAI, o modelo consegue gerar uma fala com som natural que se assemelha muito ao locutor original, criando “vozes emotivas e realistas”, algo que classifica como “notável”.