Um conceito em psicologia está ajudando a Inteligência Artificial a operar melhor em nosso mundo

Isso é conhecido como teoria da disponibilidade, um termo cunhado pelo psicólogo James J. Gibson. Segundo ele, quando seres inteligentes olham para o mundo, percebem não apenas objetos e suas relações, mas também suas possibilidades. Em outras palavras, a cadeira “oferece” a possibilidade de sentar. A água “oferece” a possibilidade de nadar. A teoria poderia explicar em parte por que a inteligência animal é tão generalizável – no geral, sabemos imediatamente como nos relacionarmos com novos objetos porque reconhecemos suas possibilidades.

A ideia: os pesquisadores da DeepMind agora estão usando esse conceito para desenvolver uma nova abordagem para o reinforcement learning (em português, aprendizado por esforço). No reinforcement learning (RL) típico, um agente aprende por tentativa e erro, começando com a suposição de que qualquer ação é possível. Um robô aprendendo a mover-se do ponto A para o ponto B, por exemplo, pressupõe que ele possa se mover através de paredes ou móveis até que falhas repetidas digam o contrário. A ideia é que, se o robô aprendesse primeiro as possibilidades de seu ambiente, ele eliminaria imediatamente uma fração significativa das tentativas fracassadas que teria que executar. Isso tornaria seu processo de aprendizagem mais eficiente e ajudaria a generalizar – ou seja, conseguir utilizar as habilidades aprendidas – em diferentes ambientes.

Os experimentos: os pesquisadores montaram um cenário virtual simples. Eles colocaram um agente virtual em um ambiente 2D com uma parede no meio e fizeram com que o agente explorasse sua amplitude de movimento até descobrir as possibilidades do que ele poderia fazer em seu entorno. Os pesquisadores então deram ao agente um conjunto de objetivos simples a serem alcançados por meio do RL, como mover um objeto para a direita ou para a esquerda. Eles descobriram que, em comparação com um agente que não havia aprendido as possibilidades, o agente virtual evitava qualquer movimento que o impedisse de ser bloqueado pela parede no meio do movimento. Assim, ele pôde ser configurado para cumprir seu objetivo com mais eficiência.

Por que é importante: o trabalho ainda está em estágio inicial; portanto, os pesquisadores usaram apenas um ambiente simples e objetivos primitivos. Mas a esperança deles é que seus experimentos iniciais ajudem a estabelecer uma base teórica para expandir a iniciativa para ações muito mais complexas. No futuro, eles veem essa abordagem permitindo que um robô avalie rapidamente se pode, por exemplo, despejar líquido em um copo. Tendo desenvolvido uma compreensão geral de quais objetos oferecem a possibilidade de reter líquidos e quais não, ele não precisará repetidamente errar o copo e derramar líquidos por toda a mesa para aprender como atingir seu objetivo.

Exploramos mais sobre esse assunto em nosso último podcast, entendendo quais são os novos caminhos para o desenvolvimento das IAs.

Confira: Como a psicologia pode ajudar no treinamento de inteligências artificiais

Assine

Um conceito em psicologia está ajudando a Inteligência Artificial a operar melhor em nosso mundo

Autor

Compartilhar

Tags

Newsletter

Compartilhar

É relativamente fácil convencer o DeepSeek a falar safadeza

Como o filme A Rede, 30 anos atrás, previu o nosso isolamento digital

Último vídeo

Ética

Tecnologia, ética e o impacto de nossas escolhas

Inteligência Artificial e Ética Global: entre a promessa do progresso e a ameaça da desumanização

Inteligência estatal

Seu chefe está de olho em você

Por que entregar o controle total a sistemas de IA pode custar caro?

Corpos humanos ‘sobressalentes’ com origem ética poderiam revolucionar a medicina

A comunidade de física dos EUA ainda está reconstruindo a confiança

O papel do marketing de influência na popularização da ciência

Quem é o autor dessa obra?

Bilionário de criptomoedas, Brian Armstrong está pronto para investir em tecnologia para edição genética de bebês

A OpenAI pode reabilitar modelos de Inteligência Artificial que desenvolvem uma “personalidade de bad boy”

Medicamentos inovadores: o caminho para a definição de preços

Essas novas baterias estão encontrando um nicho e criando uma concorrência

O papel no Rio de Janeiro na transição energética

Por que é tão difícil combater o abuso facilitado por tecnologia

Arte e inteligência artificial: plágio ou uma nova forma de criatividade?

Decisões em rede: como os CISOs estão redesenhando o futuro da cibersegurança

Nossos tópicos

Newsletter

Conecte-se

Assine nossa newsletter

Autor

Compartilhar

Tags

Newsletter

Compartilhar

Último vídeo

Nossos tópicos

Newsletter

Artigos mais lidos