Numa nova transmissão ao vivo, a empresa liderada por Sam Altman descreve o Sora 2 como o "modelo de imaginação mais poderoso" até à data, permitindo criar vídeos a partir de ideias mais complexas com um maior nível de realismo, contando agora com a possibilidade de integrar som.

Entre as novas funcionalidades há espaço para uma opção chamada Cameo, que permte colocar os utilizadores como protagonistas nos vídeos, assim como para a estreia de uma nova aplicação para vídeos gerados por IA, confirmando os rumores que já circulavam e que apontavam para o lançamento de uma app de vídeos curtos ao estilo do TikTok, tal como noticiado pelo The Wall Street Journal e pela revista Wired.

Como detalha Bill Peebles, investigador da OpenAI, o Sora 2 está preparado para lidar com cenários mais complexos, dando um dinamismo mais natural aos vídeos. O modelo permite também gerar narrativas mais coerentes, que contenham múltiplas cenas, de uma só vez.

O Sora 2 é também o primeiro modelo da tecnológica a gerar simultaneamente vídeo e áudio, dando aos utilizadores a possibilidade de terem diálogos numa variedade de idiomas e entre vários intervenientes, bem como paisagens e efeitos sonoros.

Através da Cameo, o modelo é capaz de observar um pequeno clipe onde aparece o utilizador, colocando-o depois num ambiente gerado por IA. De acordo com a OpenAI, a nova opção funciona também com animais de estimação ou até objetos.

Veja o vídeo

Para a OpenAI, lançar o modelo por si só não era suficiente. "No início, quando estavamos a desenvolver estas funcionalidades, os investigadores do Sora sentiram que esta era uma nova forma de comunicação", conta Bill Peebles.

Segundo o investigador, a equipa começou a pensar que o que começou como mensagens de texto, seguindo depois para emojis e notas de voz, poderia evoluir para um meio com base no vídeo. "Tornou-se claro para nós que precisávamos de desenvolver um novo produto que conseguisse capturar todas as capacidades do modelo e que o fizesse chegar ao maior número de pessoas possível", realça.

Thomas Dimson, membro da equipa técnica da OpenAI, explica que a nova app conta com uma interface familiar, com os utilizadores a terem perfis próprios e a poderem seguir outras pessoas. "Mas todo o conteúdo será gerado por IA: não será publicado por bots, mas sim por humanos".

No caso dos Cameos, os utilizadores decidem quem pode usar a sua imagem, podendo revogar o acesso ou remover qualquer vídeo que o inclua a qualquer momento. A OpenAI afirma que, com a app, será possível criar e fazer "remixes" com criações de outras pessoas, mas também descobrir novos vídeos através de um feed.

Clique nas imagens para ver a app com mais detalhe

Segundo a empresa, os utilizadores terão acesso a ferramentas e opções para controlarem o que veem no seu feed. Para tal, a tecnológica usou os seus modelos para desenvolver um novo tipo de algoritmos de recomendação que compreendem instruções dadas em linguagem natural. A eles juntam-se mecanismos que questionam periodicamente os utilizadores acerca da sua experiência e que agem de maneira proativa para apresentar opções de ajuste do feed.

"Por predefinição, vamos mostrar conteúdo com maior ênfase nas contas que segue ou interage e dar prioridade a vídeos que o modelo pensa que são mais prováveis de servirem como inspiração a novas criações", afirma a OpenAI, acrescentando que a app não foi concebida para maximizar o tempo passado no feed, mas sim para promover a criação.

Para proteger o bem-estar dos adolescentes que vão usar a app, a OpenAI introduziu medidas de segurança adicionais que incluem limites no número de conteúdos vistos por dia no feed, além de permissões mais "apertadas" quanto ao uso da funcionalidade Cameo. A app dispõe também de controlos parentais via ChatGPT para que os pais possam fazer mudanças os limites de "scroll", desligar a personalização dos algoritmos e gerir as denifinções das mensagens privadas.

OpenAI adapta ChatGPT para adolescentes e adiciona controlos parentais
OpenAI adapta ChatGPT para adolescentes e adiciona controlos parentais
Ver artigo

A OpenAI avança que, atualmente, o seu plano passa por dar aos utilizadores "a opção de pagar um valor para gerar um vídeo extra caso a procura exceda a capacidade disponível de processamento". À medida que a app evolui, a empresa pretende manter a transparência caso mude de abordagem.

Para já, a app Sora vai começar por estar disponível apenas para iOS, com um lançamento limitado aos Estados Unidos e Canadá, embora a empresa tenha intenções de expandir o acesso a mais regiões em breve. Nestes países, todos os interessados em experimentar terão de inscrever-se e esperar por um convite para poderem entrar.

Ao receberem um convite, os utilizadores poderão também aceder ao Sora 2 através do respetivo website. Inicialmente, o novo modelo estará disponível gratuitamente e com "limites generosos". Quem é assinante do ChatGPT Pro poderá também usar o Sora 2 Pro, que se afirma como uma versão ainda mais avançada do modelo de geração de vídeo.

Nota de redação: A notícia foi atualizada com mais informação. (Última atualização: 19h57)