DALL-E reacende discussão sobre a automação da criatividade
Inteligência artificial

DALL-E reacende discussão sobre a automação da criatividade

A OpenAI divulgou a DALL-E, uma rede neural capaz de gerar imagens inéditas usando textos como entrada. Com essa invenção será que estamos rompendo mais uma barreira e entrando na era da automação da criatividade?

No final de 2020 a OpenAI chocou mais uma vez o mundo com seu novo algoritmo: DALL-E (veja aqui). A organização já havia gerado um grande buzz ao lançar a GPT-3, uma rede neural de Processamento de Linguagem Natural, com a qual é possível gerar textos complexos a partir de poucas palavras como entrada. Um exemplo que rodou o mundo foi o texto que dizia que unicórnios foram encontrados por um pesquisador boliviano (ver aqui). Naquele momento a organização decidiu não divulgar o código-fonte da sua invenção com receio que fosse usada para criar e divulgar fake news em uma velocidade nunca antes vista.

Agora a OpenAI divulga uma tecnologia capaz de gerar imagens, muito complexas, diga-se de passagem, a partir de apenas texto. Com poucas palavras escritas, como comandos para a solução, é possível receber resultados inusitados como uma poltrona em formato de abacate e um caracol feito de uma harpa. Resumindo e simplificando o processo, essa nova tecnologia baseada em redes neurais foi treinada com bilhões de exemplos de pares de textos e imagens até que fosse possível criar uma conexão semântica entre elas.  Assim, a rede neural é capaz de gerar imagens inéditas tendo como ponto de partida descrições inusitadas.

O nome da nova solução da OpenAI, DALL-E, é a soma dos nomes do pintor Salvador Dalí e do simpático robô da Pixar, Wall-E. Nenhum outro nome expressaria tão bem o surrealismo cibernético dos resultados dessa inteligência artificial. Ao que parece, os caminhos da IA e criatividade estão ficando cada vez mais próximos.
Não que a discussão de criatividade e inteligência artificial seja nova. Em 2015, o site DeepArt.io (veja aqui) foi lançado criando a possibilidade de transformar sua selfie em uma pintura do Picasso. Nessa ocasião começamos a discutir sobre propriedade intelectual e se esses algoritmos estariam de fato expressando alguma criatividade. Agora, ao que tudo indica, estamos dando um passo além.

Codificação da criatividade

Por muito tempo utilizamos o argumento que a Inteligência Artificial ameaçava principalmente trabalhos repetitivos e previsíveis. Será que nesse momento estamos vendo a criação e conexão de tecnologias que podem tirar o sono também de profissionais da criatividade?

Murilo Gun, empreendedor e palestrante, advoga que a palavra criatividade talvez tenha um significado muito pesado e que nós deveríamos rebatizá-la de “combinatividadade”. Neologismos à parte, é inegável que uma parte considerável da criatividade seja chocar ideias e inputs diferentes a fim de gerar algo completamente novo. Esse parece ser um ponto de partida interessante para pesar como a criatividade pode ser codificada, automatizada e amplificada por algoritmos de inteligência artificial.

Plataformas de anúncios em redes sociais estão desenvolvendo cada vez mais ferramentas para que o processo criativo de geração de anúncios possa ser cada vez mais automatizado. Um exemplo são os anúncios dinâmicos. Você, como anunciante, cria uma biblioteca de vídeos, imagens, chamadas para ação e títulos e a plataforma é responsável por compor todas essas camadas para criar anúncios que sejam otimizados para a conversão com cada tipo de público.
Neste exemplo dos anúncios dinâmicos ainda temos uma parcela grande de inputs humanos para o algoritmo, mas o processo de decisão do que é melhor para converter vendas e criar o anúncio que vai ser visto pelo público passa a ser artificial.

No caso da DALL-E, criar algo novo passa a ser uma tarefa completamente realizada pela inteligência artificial. Nas ilustrações acima podemos ver como esse algoritmo interpreta um comando e é capaz de gerar uma imagem que traz consigo vários aspectos do que consideramos um resultado criativo. É possível imaginar o Salvador Dalí desenhando algumas dessas poltronas em formas de abacate.

Se somarmos o DALL-E ao GPT-3, e sua capaz de gerar textos, e as tecnologias de big data, como coleta e interpretação de grandes volumes de dados, podemos ter uma combinação incrível de suas capacidades. Podemos captar informações e gerar insights de usuários em redes sociais e utilizá-los para gerar textos e imagens que poderão ser usados para criar anúncios com personalização perfeita para suas necessidades.

Isso pode parecer um tanto distante nesse momento, mas podemos estar caminhando para a codificação e automatização de várias atividades criativas ao longo do tempo. Não seria exagero dizer que o que nos separa desse cenário seja um pouco de tempo e aprimoramento das tecnologias existentes.

Nesse momento nos resta aguardar e imaginar o que poderemos fazer quando estas tecnologias forem liberadas para a utilização do grande público. O exemplo de anúncios dinâmicos é apenas uma forma de utilização, mas existem muitas outras possíveis que ainda serão desenvolvidas com o tempo.

Ao que parece, estamos cada vez mais próximos de encontrar o algoritmo da criatividade.

Nossos tópicos