Às vezes, Lizzie Wilson se apresenta em uma rave com seu companheiro de IA.
Numa noite de semana, em fevereiro passado, ela conectou seu laptop a um projetor que lançou a imagem da tela na parede de um loft de teto baixo no leste de Londres. Uma pequena plateia se acomodou sob a luz tênue e rosada. Wilson se sentou e começou a programar.
Cliques e zumbidos de techno ecoavam pelos alto-falantes do local. A audiência assistia, balançando a cabeça, enquanto Wilson digitava códigos linha por linha na tela projetada, ajustando sons, repetindo batidas, fazendo caretas a cada erro.
Wilson é uma “live coder”. Em vez de usar softwares específicos como a maioria dos produtores de música eletrônica, cria música escrevendo um código para gerá-la ao vivo. É uma arte performática improvisada conhecida como algorave.
“É meio chato quando você vai assistir a um show e alguém está só sentado no laptop”, ela diz. “Você pode aproveitar a música, mas há um aspecto performático faltando. Com a codificação ao vivo, todo mundo pode ver o que estou digitando. E quando meu laptop trava, as pessoas realmente gostam disso. Elas começam a aplaudir.”
Assumir riscos faz parte da vibe. Por isso, Wilson gosta de intensificar suas performances um nível a mais, improvisando com o que ela chama de “agente de codificação ao vivo”, um modelo de IA generativa que cria seus próprios beats e loops para adicionar à mistura. Muitas vezes, o modelo sugere combinações sonoras que Wilson não havia pensado. “Você tem esses elementos de surpresa”, ela diz. “Você só precisa ir com tudo.”
É uma visão que vai além da promessa de ferramentas gerativas existentes, criadas por empresas como OpenAI e Google DeepMind. Elas podem automatizar uma impressionante variedade de tarefas criativas e oferecer gratificação quase instantânea, mas a que custo? Alguns artistas e pesquisadores temem que essa tecnologia possa nos transformar em consumidores passivos de mais uma “sopa” de IA.
Por isso, eles estão buscando maneiras de inserir a criatividade humana de volta ao processo. O objetivo é desenvolver ferramentas de IA que aumentem nossa criatividade em vez de retirá-la de nós, nos incentivando a melhorar na composição musical, no desenvolvimento de jogos, no design de brinquedos, entre outros, e preparar o terreno para um futuro no qual humanos e máquinas criem coisas juntos.
No fim das contas, os modelos gerativos poderiam oferecer aos artistas e designers um meio totalmente novo, impulsionando-os a criar coisas que antes não poderiam ser feitas, e concedendo superpoderes criativos a todos.
Explosão de criatividade
Não existe uma única maneira de ser criativo, mas todos nós fazemos isso. Criamos de tudo, desde memes até obras-primas, rabiscos e designs industriais. Há uma crença equivocada, geralmente entre adultos, de que a criatividade é algo que você perde com o tempo. Mas ser criativo, seja cozinhando, cantando no chuveiro ou criando TikToks superestranhos, é algo que a maioria de nós faz apenas pela diversão. Não precisa ser uma arte de alto nível ou uma ideia que mude o mundo (e, ainda assim, pode ser). Criatividade é comportamento humano básico; deve ser celebrada e incentivada.
Quando modelos de texto-para-imagem gerativos como Midjourney, DALL-E da OpenAI e o popular Stable Diffusion de código aberto chegaram, causaram uma explosão do que parecia muito criativo. Milhões de pessoas agora eram capazes de criar imagens impressionantes de praticamente qualquer coisa, em qualquer estilo, com um clique. Modelos de texto-para-vídeo surgiram em seguida. Agora, startups como a Udio estão desenvolvendo ferramentas semelhantes para música. Nunca antes os frutos da criação estiveram ao alcance de tantas pessoas.
Wilson, pesquisadora no Creative Computing Institute da University of the Arts London, é apenas uma das muitas pessoas que trabalham no que é conhecido como cocriatividade ou criatividade além do humano. A ideia é que a IA possa ser usada para inspirar ou criticar projetos criativos, ajudando as pessoas a fazer coisas que elas não teriam feito sozinhas. Ela e seus colegas criaram o agente de codificação ao vivo para explorar como a inteligência artificial pode ser usada para apoiar os esforços artísticos humanos — no caso de Wilson, a improvisação musical.
Mas para vários pesquisadores e artistas, o hype em torno dessas ferramentas distorceu a ideia do que realmente é criatividade. “Se eu pedir para a IA criar algo para mim, isso não é ser criativo”, diz Jeba Rezwana, que trabalha com cocriatividade na Towson University, em Maryland. “É uma interação única: você clica, ela gera algo e pronto. Você não pode dizer ‘eu gosto dessa parte, mas talvez mude algo aqui’. Não há um diálogo contínuo.”
Rezwana se refere à forma como a maioria dos modelos generativos é configurada. Você pode dar feedback às ferramentas e pedir para que elas tentem novamente. Mas cada novo resultado é gerado do zero, o que pode dificultar a obtenção exatamente do que você quer. Como o cineasta Walter Woodman disse no ano passado, depois que seu coletivo de arte Shy Kids fez um curta-metragem com o modelo de texto-para-vídeo da OpenAI pela primeira vez: “o Sora é como uma máquina caça-níquel: você nunca sabe o que vai receber de volta.”
Além disso, as versões mais recentes de algumas dessas ferramentas generativas nem sequer usam o seu prompt enviado como está para produzir uma imagem ou vídeo (pelo menos não nas configurações padrão). Antes de um prompt ser enviado para o modelo, o software o edita, frequentemente adicionando dezenas de palavras ocultas, para tornar mais provável que a imagem gerada apareça mais bem-acabada.
“Coisas extras são adicionadas para melhorar o resultado”, diz Mike Cook, pesquisador de criatividade computacional no King’s College London. “Tente pedir ao Midjourney para lhe dar um desenho ruim de algo. Ele não consegue fazer isso”. Essas ferramentas não lhe dão o que você quer; elas lhe dão o que seus designers acham que você quer.
Tudo isso está bem se você só precisar de uma imagem rápida e não se importar muito com os detalhes, diz Nick Bryan-Kinns, também do Creative Computing Institute: “Talvez você queira fazer um cartão de Natal para sua família ou um panfleto para venda de bolos na sua comunidade. Essas ferramentas são ótimas para isso.”
Em resumo, os modelos generativos existentes facilitaram a criação, mas não tornaram fácil ser criativo. E há uma grande diferença entre as duas coisas. Para Cook, confiar em tais ferramentas pode, de fato, prejudicar o desenvolvimento criativo das pessoas a longo prazo. “Embora muitos desses sistemas de IA criativa sejam promovidos como formas de tornar a criatividade mais acessível”, ele escreveu em um artigo publicado no ano passado, “eles podem, na verdade, ter ‘efeitos adversos em seus usuários, no que diz respeito a restringir sua capacidade de inovar, idealizar e criar’”. Dado o quanto os modelos generativos foram defendidos por colocar habilidades criativas ao alcance de todos, a sugestão de que eles podem, de fato, fazer o oposto é devastadora.
Ele está longe de ser o único pesquisador preocupado com o impacto cognitivo dessas tecnologias. Em fevereiro, uma equipe da Microsoft Research Cambridge publicou um relatório concluindo que as ferramentas de IA generativa “podem inibir o engajamento crítico com o trabalho e potencialmente levar a uma dependência excessiva da ferramenta a longo prazo, diminuindo a habilidade para resolução independente de problemas”. Os pesquisadores descobriram que, com o uso de ferramentas generativas, o esforço das pessoas “muda da execução de tarefas para a gestão de tarefas.”
Cook está preocupado porque as ferramentas generativas não permitem que você falhe, uma parte crucial do aprendizado de novas habilidades. Temos o hábito de dizer que artistas são talentosos, diz Cook. Mas a verdade é que os artistas trabalham na sua arte, desenvolvendo habilidades ao longo de meses e anos.
“Se você realmente conversar com artistas, eles dirão: ‘bem, eu melhorei fazendo isso repetidas vezes’”, diz ele. “Mas falhar é ruim. E estamos sempre procurando maneiras de evitar isso.”
Modelos generativos nos deixam pular a frustração de fazer um trabalho ruim.
“Infelizmente, estamos removendo a única coisa que você precisa fazer para desenvolver habilidades criativas por si mesmo, que é falhar,” diz Cook. “Mas absolutamente ninguém quer ouvir isso.”
Surpreenda-me
E ainda assim, nem tudo é uma má notícia. Artistas e pesquisadores estão animados com as maneiras pelas quais as ferramentas generativas podem capacitar os criadores, apontando-os em novas direções surpreendentes e afastando-os de becos sem saída. Cook acredita que a verdadeira promessa da IA será nos ajudar a melhorar no que queremos fazer, em vez de fazer isso por nós. Para isso, ele diz, precisaremos criar novas ferramentas, diferentes das que temos agora. “Usar o Midjourney não faz nada por mim, não muda nada sobre mim”, diz ele. “E eu acho que isso é uma oportunidade desperdiçada.”
Peça a uma variedade de pesquisadores que estudam a criatividade para nomear uma parte chave do processo criativo e muitos dirão: reflexão. É difícil definir com precisão, mas a reflexão é um tipo de pensamento focado e deliberado. É o que acontece quando uma nova ideia surge. Ou quando uma suposição que você tinha se revela errada e você precisa repensar sua abordagem. É o oposto de uma interação única.
Procurar maneiras de como a IA pode apoiar ou incentivar a reflexão, pedindo-lhe para lançar novas ideias ou desafiar ideias que você já tem, é um fio condutor na pesquisa sobre cocriação. Se ferramentas generativas como o DALL-E tornam o ato de criar algo sem esforço, a proposta aqui é justamente reinserir o desafio no processo. “Como podemos fazer arte sem resistência?”, pergunta Elisa Giaccardi, pesquisadora de design na Universidade Politécnica de Milão, na Itália. “Como nos envolver de fato em um processo criativo sem que o material nos imponha alguma reação?”.
Veja o caso do agente de live coding de Wilson. Ela afirma que a ferramenta impulsiona sua improvisação musical em direções que talvez não seguiria sozinha. Treinado com trechos de código públicos, compartilhados pela comunidade de live coding, o modelo sugere comandos mais próximos do estilo de outras pessoas do que do dela. Isso aumenta a chance de surgirem resultados inesperados. “Não porque você não conseguiria criar aquilo por conta própria”, ela explica. “Mas, pelo modo como o cérebro humano funciona, temos a tendência de recorrer sempre às mesmas ideias.”
No ano passado, Wilson participou de um estudo conduzido por Bryan-Kinns e seus colegas, no qual eles pesquisaram seis músicos experientes enquanto usavam uma variedade de modelos generativos para ajudá-los a compor um musical. Os pesquisadores queriam ter uma ideia de quais tipos de interações com a tecnologia eram úteis e quais não eram.
Os participantes disseram que gostaram quando os modelos faziam sugestões surpreendentes, mesmo quando estas eram resultado de falhas ou erros. Às vezes, os resultados eram melhores. Às vezes, o processo parecia novo e empolgante. Mas algumas pessoas tiveram dificuldade em abrir mão do controle. Era difícil direcionar os modelos para produzir resultados específicos ou repetir os que os músicos haviam gostado. “De certa forma, é o mesmo que estar em uma banda”, diz Bryan-Kinns. “Você precisa ter esse senso de risco e de surpresa, mas não quer que seja totalmente aleatório.”
Designs alternativos
Cook aborda o inesperado por outra perspectiva: ele extrai ideias surpreendentes de ferramentas de IA que desenvolveu para cocriar videogames. Uma delas, chamada Puck, lançada pela primeira vez em 2022, gera propostas de design para jogos simples de combinar formas, como Candy Crush ou Bejeweled. Muitas das criações do Puck são experimentais e desajeitadas. Não espere que ele produza algo que você realmente vá querer jogar. Mas essa não é a intenção: Cook usa o Puck e uma ferramenta mais recente chamada Pixie para explorar que tipo de interação as pessoas podem desejar ter com uma ferramenta de cocriação.
O Pixie é capaz de ler o código de um jogo e modificar linhas específicas para gerar designs alternativo. Não faz muito tempo, Cook estava trabalhando em uma cópia de um jogo popular chamado Disc Room, em que os jogadores precisam atravessar uma sala cheia de lâminas giratórias.
Ele pediu ao Pixie para ajudá-lo a criar um design de nível que fosse igualmente difícil tanto para jogadores habilidosos quanto para iniciantes. O Pixie projetou uma sala onde nenhum dos discos realmente se movia. Cook ri: Não era o que ele esperava. “Basicamente, transformou a sala em um campo minado”, diz ele. “Mas eu achei realmente interessante. Eu não tinha pensado nisso antes.”
Questionar suposições ou ser desafiado faz parte do processo criativo, afirma Anne Arzberger, pesquisadora da Universidade de Tecnologia de Delft, na Holanda. “Quando penso nas pessoas com quem tive as melhores colaborações, não foram aquelas que apenas diziam ‘sim, ótimo’ para cada ideia que eu propunha”, diz ela. “Eram pessoas realmente críticas, com ideias opostas às minhas.”
Ela quer construir uma tecnologia que forneça uma base de apoio semelhante. Como parte de um projeto chamado Creating Monsters, Arzberger desenvolveu duas ferramentas experimentais de IA que ajudam designers a encontrar preconceitos ocultos em seus projetos. “Eu estava interessada em maneiras de usar essa tecnologia para acessar informações que, de outra forma, seriam difíceis de obter”, diz ela.
Para o projeto, ela e seus colegas analisaram o problema de projetar figuras de brinquedos que fossem neutras em relação ao gênero. Ela e seus colegas (incluindo Giaccardi) usaram o Teachable Machine, um aplicativo da web criado pelos pesquisadores do Google em 2017, que facilita o treinamento do seu próprio modelo de aprendizado de máquina para classificar diferentes entradas, como imagens. Eles treinaram esse modelo com algumas dezenas de imagens que Arzberger havia rotulado como masculinas, femininas ou neutras em termos de gênero.
Arzberger então pediu ao modelo que identificasse os gêneros de novos designs de brinquedos. Ela descobriu que vários deles eram classificados como femininos, mesmo quando havia tentado torná-los neutros em relação ao gênero. Sentiu que suas visões de mundo, e seus próprios vieses inconscientes, estavam sendo expostos. Mas a ferramenta muitas vezes estava certa: ela desafiava suas suposições e ajudava a equipe a aprimorar os projetos. Segundo Arzberger, essa mesma abordagem pode ser usada para avaliar todo tipo de característica de design.
Arzberger então usou um segundo modelo, uma versão de uma ferramenta criada pela startup de imagens e vídeos gerativos Runway, para criar seus próprios designs de brinquedos neutros em relação ao gênero. Primeiro, os pesquisadores treinaram o modelo para gerar e classificar designs de brinquedos com aparência masculina e feminina. Eles puderam então pedir à ferramenta para encontrar um design que estivesse exatamente no meio dos designs masculino e feminino que o modelo havia aprendido.
Os modelos gerativos podem fornecer feedback sobre designs que os designers humanos poderiam não perceber sozinhos, ela diz: “Nós realmente podemos aprender algo.”
Tomando controle
A história da tecnologia está cheia de avanços que mudaram a forma como a arte é feita, desde receitas para novas cores vibrantes de tinta até a fotografia e sintetizadores. Na década de 1960, o pesquisador da Stanford John Chowning passou anos trabalhando em um algoritmo esotérico que poderia manipular as frequências dos sons gerados por computador. Stanford licenciou a tecnologia para a Yamaha, que a incorporou em seus sintetizadores—incluindo o DX7, o som novo e estiloso por trás dos sucessos dos anos 1980 como “The Best”, de Tina Turner, “Take On Me”, do A-ha, e “When Doves Cry”, de Prince.
Bryan-Kinns se interessa profundamente por como artistas e designers encontram maneiras de usar novas tecnologias. “Se você conversar com artistas, a maioria deles nem fala desses modelos generativos de IA como uma ferramenta, eles falam como se fosse um material artístico, como tinta ou algo do tipo”, afirma. “É uma forma diferente de pensar sobre o que a IA está fazendo”. Ele destaca como algumas pessoas estão forçando a tecnologia a realizar coisas estranhas, para as quais ela não foi originalmente projetada. Segundo ele, artistas costumam apropriar-se ou até mesmo fazer usos não convencionais dessas ferramentas.
Bryan-Kinn aponta o trabalho de Terence Broad, outro colega seu no Creative Computing Institute, como um exemplo favorito. Broad usa técnicas como a “bending de rede”, que envolve a inserção de novas camadas em uma rede neural para produzir efeitos visuais glitch em imagens geradas, e a geração de imagens com um modelo treinado com nenhum dado, o que resulta em manchas abstratas de cor, quase como pinturas de Rothko.
Mas Broad é um caso extremo. Bryan-Kinns resume a questão da seguinte forma:
“O problema é que existe um abismo entre, de um lado, as ferramentas generativas muito comerciais, que produzem resultados de altíssima qualidade, mas sobre as quais você tem pouquíssimo controle e, do outro, ferramentas que oferecem controle total sobre o que estão fazendo, mas cujo uso é bem mais complexo, porque é preciso ser alguém que se sinta confortável em lidar com a parte técnica do computador.”
“Isso é um número pequeno de pessoas”, diz ele. “É um número muito pequeno de artistas.”
Arzberger admite que trabalhar com seus modelos não foi simples. Executá-los levou várias horas, e ela não tem certeza se a ferramenta Runway que usou ainda está disponível. Bryan-Kinns, Arzberger, Cook e outros querem pegar os tipos de interações criativas que estão descobrindo e incorporá-las em ferramentas que possam ser usadas por pessoas que não são programadores avançados.
Encontrar o equilíbrio certo entre surpresa e controle será difícil. O Midjourney pode surpreender, mas oferece poucas alavancas para controlar o que ele produz além do seu prompt. Alguns afirmam que escrever prompts é, em si, um ato criativo. “Mas ninguém luta com um pincel do jeito que luta com um prompt”, diz Cook.
Diante dessa luta, Cook às vezes observa seus alunos aceitarem os primeiros resultados que uma ferramenta generativa lhes dá. “Estou realmente interessado nessa ideia de que estamos nos preparando para aceitar que o que sai de um modelo é exatamente o que você pediu”, ele diz. Ele está projetando um experimento que vai variar palavras e frases em prompts semelhantes para testar quanto de desconexão as pessoas percebem entre o que esperam e o que recebem.
Mas ainda estamos no início. Enquanto isso, as empresas que desenvolvem modelos generativos normalmente enfatizam os resultados em vez do processo. “Há esse progresso algorítmico impressionante, mas muitas vezes o design da interação é negligenciado”, diz Rezwana.
Para Wilson, a escolha crucial em qualquer relacionamento cocriativo é o que você faz com o que recebe. “Você está tendo esse relacionamento com o computador que está tentando mediar”, ela diz. “Às vezes dá errado, e isso faz parte do processo criativo.”
Quando a IA te dá limões, faça arte. “Não seria divertido ter algo completamente antagonista em uma performance, como algo que está ativamente contra você e você meio que tem uma discussão?”, ela questiona. ” Seria, no mínimo, interessante de assistir.”