Como interpretar um dragão pode ensinar uma IA a manipular e persuadir

Uma Inteligência Artificial que completa missões em um jogo de aventura baseado em texto conversando com os personagens aprendeu não apenas como fazer as coisas, mas como persuadir os outros a realizarem as tarefas. O sistema é um passo em direção às máquinas que podem usar a linguagem como forma de atingir seus objetivos.

Prosa sem sentido: modelos de linguagem como o GPT-3 são brilhantes em imitar frases escritas por humanos, produzir histórias, blogs falsos e postagens no Reddit. Mas há pouco sentido para essa produção prolífica além do próprio texto. Quando as pessoas usam a linguagem, ela é manejada como uma ferramenta: nossas palavras convencem, comandam e manipulam; elas fazem as pessoas rirem e chorarem.

Misturando as coisas: para construir uma Inteligência Artificial que usasse palavras com intenção, os pesquisadores do Instituto de Tecnologia da Geórgia em Atlanta e o Facebook AI Research combinaram técnicas de processamento de linguagem natural (PLN) e aprendizado por reforço, onde modelos de machine learning aprendem como se comportar para alcançar determinados objetivos. Ambos os campos tiveram um enorme progresso nos últimos anos, mas houve pouca troca entre os dois.

Jogos de palavras: para testar sua abordagem, os pesquisadores treinaram seu sistema em um jogo multiplayer baseado em texto chamado LIGHT, desenvolvido pelo Facebook no ano passado para estudar a comunicação entre jogadores humanos e de IA. O jogo é ambientado em um mundo com tema de fantasia cheio de milhares de objetos, personagens e locais colaborativos que podem ser interagidos por meio de texto na tela. Os jogadores (humanos ou computador) agem digitando comandos como “abraçar mago”, “bater no dragão” ou “remover o chapéu”. Eles também podem falar com os personagens controlados pelo chatbot.

A missão do dragão: Para dar à sua IA razões para fazer as coisas, os pesquisadores adicionaram cerca de 7.500 missões colaborativas, não incluídas na versão original do LIGHT. Finalmente, eles também criaram um gráfico de conhecimento (um banco de dados de relações sujeito-verbo-objeto) que deu à IA informações de senso comum sobre o mundo do jogo e as conexões entre seus personagens, como o princípio de que um comerciante só confia em um guarda se eles são amigos. O jogo agora tinha ações (como “Vá para as montanhas” e “Coma o cavaleiro”) para realizar a fim de completar missões (como “Construir o maior tesouro já obtido por um dragão”).

Fala mansa: juntando tudo isso, eles treinaram a IA para completar missões apenas usando a linguagem. Para realizar ações, ele pode digitar o comando para aquela ação ou atingir o mesmo fim conversando com outros personagens. Por exemplo, se a IA precisava de uma espada, ele poderia escolher roubar uma ou convencer outro personagem a entregá-la.

Por enquanto, o sistema é uma brincadeira. E o seu modo de se expressar pode ser direto: a certa altura, precisando de um balde, ele simplesmente diz: “Dê-me aquele balde ou eu você será a comida do meu gato!” Mas misturar PNL com aprendizado por reforço é um passo animador que pode levar não apenas a melhores chatbots que podem argumentar e persuadir, mas também àqueles que têm uma compreensão muito mais rica de como funciona nosso mundo orientado pela linguagem.

Assine

Como interpretar um dragão pode ensinar uma IA a manipular e persuadir

Autor

Compartilhar

Newsletter

Compartilhar

Prescrição de esperança: a ciência por trás das emoções no cuidado médico

Adeus, texto! O vídeo é o novo formato de comunicação das nossas vidas

Último vídeo

Ética

Tecnologia, ética e o impacto de nossas escolhas

Inteligência Artificial e Ética Global: entre a promessa do progresso e a ameaça da desumanização

Inteligência estatal

Seu chefe está de olho em você

Por que entregar o controle total a sistemas de IA pode custar caro?

Corpos humanos ‘sobressalentes’ com origem ética poderiam revolucionar a medicina

A comunidade de física dos EUA ainda está reconstruindo a confiança

O papel do marketing de influência na popularização da ciência

Quem é o autor dessa obra?

Energia e Inovação: A força do Estado do Rio no cenário global

Esta startup quer produzir nos EUA um metal mais sustentável para o clima

O verdadeiro estágio dos agentes de IA

Tecnologia, segurança e o imponderável humano: quando o cuidado não pode ser automatizado

É relativamente fácil convencer o DeepSeek a falar safadeza

Como o filme A Rede, 30 anos atrás, previu o nosso isolamento digital

Bilionário de criptomoedas, Brian Armstrong está pronto para investir em tecnologia para edição genética de bebês

A OpenAI pode reabilitar modelos de Inteligência Artificial que desenvolvem uma “personalidade de bad boy”

Nossos tópicos

Newsletter

Conecte-se

Assine nossa newsletter

Autor

Compartilhar

Newsletter

Compartilhar

Último vídeo

Nossos tópicos

Newsletter

Artigos mais lidos