A Mozilla tem vindo a trabalhar numa tecnologia de reconhecimento de voz, a iniciativa Common Voice, baseado em open source, destinado a pequenos produtores ou investigadores que não tenham recursos e orçamentos para investir nas soluções disponibilizadas pela Apple ou Google.
A tecnologia suportava apenas inglês, mas expandiu agora para 18 novas línguas, incluindo o alemão, francês, espanhol, mandarim e holandês, para referir algumas. O português (do Brasil) era uma das línguas que estava no pipeline das operações.
Quando foi revelada no final de 2017, a base de dados contava com 400 mil gravações e mais de 500 horas de comandos de voz, fruto da contribuição de 20.000 pessoas. Agora, segundo o Engadget, a Mozilla angariou 1.400 horas de voz e aumentou a sua base de contribuição para 42.000 pessoas, incluindo voluntários e profissionais de linguísticas.
A organização pretende utilizar também os clips para melhorar as tecnologias de fala-para-texto, texto-para-fala e até motores de DeepSpeech.
Pergunta do Dia
Em destaque
-
Multimédia
25 anos do Observatório da Terra da NASA em 25 imagens e um vídeo -
Site do dia
Lummi é uma base de dados de imagens geradas e curadas por artistas de inteligência artificial -
App do dia
Uma dança de fogo e gelo que afinal é um jogo para guiar planetas ao ritmo da música -
How to TEK
Como desativar a opção de reescrita com o Copilot no Edge?
Comentários