A OpenAI lançou seu modelo de geração de vídeos, o Sora, para o público. O anúncio ocorre no quinto dia do evento “shipmas” da empresa, uma maratona de 12 dias de lançamentos e demonstrações de tecnologia. Aqui está o que você precisa saber – e como você pode usar o modelo de vídeo agora mesmo.
O que é o Sora?
Sora é um poderoso modelo de geração de vídeos com IA que pode criar vídeos a partir de prompts textuais, animar imagens ou remixar vídeos em novos estilos. A OpenAI fez uma prévia do modelo em fevereiro, mas esta é a primeira vez que a empresa o libera para uso mais amplo.
O que há de novo neste lançamento?
A função principal do Sora – criar vídeos impressionantes com prompts simples – permanece semelhante ao que foi apresentado em fevereiro, mas a OpenAI trabalhou para tornar o modelo mais rápido e mais barato antes deste lançamento mais amplo. Há alguns novos recursos, e dois se destacam.
O primeiro é chamado Storyboard. Com ele, você pode criar múltiplos vídeos gerados por IA e depois montá-los em uma linha do tempo, da mesma forma que faria com editores de vídeo convencionais, como o Adobe Premiere Pro.
O segundo é um feed que funciona como uma espécie de galeria criativa. Os usuários podem postar seus vídeos gerados pelo Sora nesse feed, ver os prompts por trás de certos vídeos, ajustá-los e, de maneira geral, buscar inspiração, segundo a OpenAI.
O que você pode fazer com isso?
Você pode gerar vídeos a partir de prompts textuais, mudar o estilo dos vídeos e alterar elementos com uma ferramenta chamada Remix, além de montar múltiplos clipes com o Storyboard. O Sora também oferece estilos predefinidos que você pode aplicar aos seus vídeos, como o clima do filme noir ou o estilo de papelão e papercraft, que dá uma sensação de stop-motion. Também é possível cortar e repetir os vídeos criados.
Quem pode usar?
Para gerar vídeos com o Sora, você precisará assinar um dos planos premium da OpenAI – o ChatGPT Plus ($20 por mês) ou o ChatGPT Pro ($200 por mês). Ambos os planos oferecem acesso a outros produtos da OpenAI também. Os usuários do ChatGPT Plus podem gerar vídeos de até cinco segundos com resolução de até 720p. Esse plano permite criar 50 vídeos por mês.
Usuários com a assinatura ChatGPT Pro podem gerar vídeos mais longos e com maior resolução, limitados a 1080p e duração de 20 segundos. Eles também podem gerar até cinco variações de um vídeo a partir de um único prompt, facilitando a revisão de opções. Usuários Pro têm um limite de 500 vídeos por mês, mas também podem criar vídeos “relaxados” ilimitados, que não são gerados no momento, mas ficam na fila para quando o tráfego do site estiver baixo.
Ambos os planos permitem criar vídeos em três proporções de aspecto: vertical, horizontal e quadrado.
Se você não tiver uma assinatura, ficará limitado a visualizar o feed de vídeos gerados pelo Sora.
A OpenAI está iniciando o lançamento global do Sora hoje, mas levará mais tempo para ser lançado na “maior parte da Europa”, informou a empresa.
Onde posso acessá-lo?
A OpenAI separou o Sora do ChatGPT. Para acessá-lo, basta ir até Sora.com e fazer login com sua conta do ChatGPT Plus ou Pro. (A MIT Technology Review não conseguiu acessar o site no momento da publicação – uma mensagem no site indicava que os cadastros estavam pausados devido ao “alto tráfego” no momento).
Como chegamos aqui?
Muitas coisas aconteceram desde que a OpenAI apresentou o Sora em fevereiro. Outras empresas de tecnologia também lançaram ferramentas de geração de vídeos, como o Meta Movie Gen e o Google Veo. Também houve bastante reação negativa. Por exemplo, artistas que tiveram acesso antecipado para experimentar o Sora vazaram a ferramenta para protestar contra o fato de a OpenAI ter treinado o modelo usando o trabalho de artistas sem compensação.
O que vem a seguir?
Como acontece com qualquer novo lançamento de um modelo, ainda não se sabe quais medidas a OpenAI tomou para evitar que o Sora seja usado para fins nefastos, ilegais ou antiéticos, como a criação de deepfakes. Sobre moderação e segurança, um funcionário da OpenAI disse que “talvez não consigam acertar de imediato no primeiro dia.”
Outra questão em aberto é quanto de capacidade computacional e energia o Sora consumirá a cada vez que criar um vídeo. Gerar um vídeo consome muito mais tempo de computação e, portanto, mais energia, do que gerar uma resposta de texto em uma ferramenta como o ChatGPT. O boom da IA já tem sido um grande consumidor de energia, apresentando um desafio para as empresas de tecnologia que buscam controlar suas emissões, e a ampla disponibilidade do Sora e de outros modelos de vídeo semelhantes pode potencialmente agravar esse problema.
–