Versão de Minecraft gerada por IA pode representar o futuro da geração de vídeo em tempo real
Inteligência artificial

Versão de Minecraft gerada por IA pode representar o futuro da geração de vídeo em tempo real

O jogo foi criado apenas a partir de clipes e entradas de teclado, como uma demonstração de geração interativa de vídeo em tempo real.

Ao caminhar em uma versão do jogo Minecraft criada pelas empresas de IA Decart e Etched, a experiência parece um pouco diferente. É possível andar para frente, cortar uma árvore e colocar um bloco de terra, como no Minecraft original. No entanto, se você se virar, o bloco de terra recém-colocado pode ter se transformado em um ambiente completamente novo — algo que não ocorre no Minecraft tradicional. Mas essa nova versão é inteiramente gerada por IA, e por isso está sujeita a “alucinações”. Nenhuma linha de código foi escrita para criá-la.

Para a Decart e a Etched, esta demonstração é um conceito de prova. Elas vislumbram que essa tecnologia possa ser utilizada para a geração em tempo real de vídeos ou jogos em geral. “A tela pode se transformar em um portal para algum mundo imaginário que não precisa ser codificado e pode ser alterado instantaneamente. E é isso que estamos buscando aqui”, diz Dean Leitersdorf, cofundador e CEO da Decart, que se tornou pública esta semana.

A versão do Minecraft criada por eles é gerada em tempo real, usando uma técnica chamada previsão de próximo quadro. Eles treinaram seu modelo, Oasis, com milhões de horas de jogabilidade do Minecraft e gravações das ações correspondentes que os usuários realizavam no jogo. A IA consegue entender a física, os ambientes e os controles do Minecraft apenas com esses dados.

As empresas reconhecem que sua versão do Minecraft ainda tem alguns problemas. A resolução é bastante baixa, o jogo só pode ser jogado por alguns minutos de cada vez e está sujeito a alucinações como a mencionada. No entanto, acreditam que, com inovações no design de chips e melhorias futuras, não há razão para que não consigam desenvolver uma versão de alta fidelidade do Minecraft, ou de qualquer outro jogo.

“E se você pudesse dizer ‘Ei, adicione um unicórnio voador aqui’? Literalmente, falar com o modelo. Ou ‘Transforme tudo aqui na Idade Média’, e então, boom, tudo se transforma. Ou ‘Transforme isso em Star Wars’, e tudo vira Star Wars”, afirma Leitersdorf.

Uma grande limitação no momento é o hardware. Eles usaram placas da Nvidia para a demonstração atual, mas, no futuro, planejam utilizar o Sohu, um novo chip em desenvolvimento pela Etched, que promete melhorar o desempenho em até 10 vezes. Esse ganho reduziria significativamente o custo e a energia necessários para produzir vídeos interativos em tempo real. Isso permitiria à Decart e à Etched criar uma versão aprimorada da demonstração, permitindo que o jogo funcione por mais tempo, com menos alucinações e em resolução mais alta. Eles dizem que o novo chip também permitirá que mais jogadores usem o modelo simultaneamente.

“Chips personalizados para IA têm o potencial de desbloquear ganhos significativos de desempenho e eficiência energética”, diz Siddharth Garg, professor de engenharia elétrica e de computação na NYU Tandon, que não possui vínculo com a Etched ou a Decart.

A Etched afirma que seus avanços vêm de projetar seus chips especificamente para o desenvolvimento de IA. Por exemplo, o chip utiliza um único núcleo, o que, segundo a empresa, torna possível lidar com operações matemáticas complexas de maneira mais eficiente. O chip também prioriza inferência (quando a IA faz previsões) em vez de treinamento (quando a IA aprende com dados).

“Estamos construindo algo muito mais especializado do que todos os chips no mercado hoje”, diz Robert Wachen, cofundador e COO da Etched. Eles planejam executar projetos com o novo chip no próximo ano. Até que o chip seja lançado ou suas capacidades comprovadas, as alegações da Etched ainda precisam ser verificadas. E, dado o grau de especialização de IA já presente nas GPUs de ponta do mercado, Garg se mostra “muito cético sobre uma melhoria de 10 vezes apenas com um design mais inteligente ou especializado.”

Mas as duas empresas têm grandes ambições. Se os ganhos de eficiência forem próximos aos prometidos pela Etched, elas acreditam que poderão gerar médicos ou tutores virtuais em tempo real. “Tudo isso está a caminho e é possível com uma arquitetura e hardware melhores para impulsionar esse desenvolvimento. É isso que queremos que as pessoas percebam com esta prova de conceito”, afirma Wachen.

Último vídeo

Nossos tópicos