A Microsoft apresentou os primeiros modelos de inteligência artificial desenvolvidos internamente. O MAI-Voice-1 está lançado e é um modelo de voz que, como explica a empresa, pode gerar um minuto de áudio em menos de um segundo com apenas um GPU.

Já está a ser usado para dar suporte a alguns recursos da empresa, como o Copilot Daily e o Podcast. Pode também ser experimentado através do Copilot Labs. Neste site, digite aquilo que pretende que o modelo diga na caixa de diálogo e escolha a entoação de voz em que quer ouvir a interpretação em áudio do pedido: emotiva ou em tom de história.

Se escolher a opção emotiva pode ainda definir o estado de espírito por trás da voz (contente, triste, irritado…) e o estilo/sotaque da comunicação. O resultado não é ipsis verbis o que escreveu, mas uma pequena mensagem de áudio à volta da ideia apresentada, tendo em conta o “estado de espírito” que quis imprimir ao assistente.

O objetivo é mostrar a rapidez e fiabilidade da tecnologia para interpretar um pedido e transformá-lo num discurso de viva voz que transmita as emoções, o tom e o conteúdo adequado, em função das instruções recebidas.

O MAI-1-preview é uma espécie de aperitivo para futuras ofertas a integrar no Copilot. Os testes públicos do modelo começam agora no LMArena, uma plataforma de teste e avaliação. Os interessados podem pedir acesso através de um formulário.

Chatbot Claude da Anthropic troca palavras escritas por conversas de viva voz
Chatbot Claude da Anthropic troca palavras escritas por conversas de viva voz
Ver artigo

O modelo foi treinado com 15.000 GPUs Nvidia H100 e foi pensado para utilizadores que precisam de um modelo de IA capaz de seguir instruções e fornecer respostas úteis a perguntas do dia-a-dia, explica a Microsoft.

Na nota de apresentação dos novos modelos, a tecnológica aproveita para detalhar a sua visão para a IA, sublinhando que a tecnologia “deve ser usada para capacitar todas as pessoas do planeta”. O seu contributo passará por “criar IA para todos”, numa perspetiva “solidária e útil, sempre ao serviço da humanidade”.

Para os próximos meses estão prometidas mais novidades. A Microsoft assegura que vai continuar a trabalhar para “novos avanços aqui”, neste propósito mais universal, ao mesmo tempo que continua a acreditar no valor da “orquestração de uma gama de modelos especializados que atendam a diferentes intenções e casos de uso”.

Recorde-se que a Microsoft tem uma parceria com a OpenAI, que criou o ChatGPT, e tem sido essencialmente a tecnologia da companhia liderada por Sam Altman a dar suporte aos recursos de IA generativa que têm transformado as soluções da Microsoft. Maias recentemente a empresa tem apostado em promover a ligação dos seus produtos a modelos de linguagem de outros fabricantes e em produzir os seus próprios modelos.