Uma infinita variedade de criaturas virtuais galopa pela tela, lutando contra obstáculos ou arrastando bolas em direção a um objetivo. Elas poderiam ser descritas como caranguejos feitos de salsichas — ou talvez a Mãozinha, a mão sem corpo da Família Addams. Só que esses “unimals” (abreviação do inglês “universal animals”, traduzido em português para animais universais) poderiam ser, de fato, a ajuda que os pesquisadores precisavam para a desenvolver mais inteligência de uso geral em máquinas.
Agrim Gupta, da Universidade de Stanford (EUA), e seus colegas (incluindo Fei-Fei Li, codiretora do Instituto de Stanford para Inteligência Artificial Centrada no Homem e que também liderou a criação da ImageNet) usaram esses unimals para explorar duas questões que muitas vezes são esquecidas na pesquisa de IA: como a inteligência é ligada à forma dos corpos, e como as habilidades podem ser desenvolvidas e também aprendidas por meio da evolução.
“Este trabalho é um passo importante pois há décadas tentamos entender melhor a relação corpo-cérebro em robôs”, diz Josh Bongard, que estuda robótica evolutiva na Universidade de Vermont (EUA) e que não teve envolvimento nessa pesquisa.
Se os pesquisadores desejam recriar inteligência nas máquinas, eles devem se atentar a isso, diz Gupta. Na biologia, a inteligência é resultante do trabalho conjunto da mente e do corpo. Aspectos dos planos corporais, como o número e a forma dos membros, determinam o que os animais podem fazer e o que são capazes de aprender. Considere o Aie-aie, um lêmure que desenvolveu um dedo médio alongado para ter acesso às larvas alojadas nos buracos mais profundos.
A IA costuma se concentrar apenas no aspecto da mente e as máquinas são construídas para realizar tarefas que podem ser dominadas sem um corpo, como usar a linguagem, reconhecer imagens e jogar videogames. Esse repertório limitado pode, todavia, se tornar obsoleto em breve. Inserir as IAs em corpos adaptados a tarefas específicas poderia facilitar o processo de aprendizagem de uma ampla gama de novas habilidades. “Algo que todo animal inteligente do planeta tem em comum é um corpo”, diz Bongard. “A corporificação é nossa única esperança de fazer máquinas que não são apenas inteligentes, mas também seguras”.
Os unimals têm cabeça e vários membros. Para ver o que eles seriam capazes de fazer, a equipe desenvolveu uma técnica chamada aprendizagem por reforço evolutivo profundo (DERL, sigla em inglês para Deep Evolutionary Reinforcement Learning). Primeiramente, os unimals são treinados usando o reinforcement learning para completar uma tarefa em um ambiente virtual, como caminhar por diferentes tipos de terreno ou mover um objeto.
Os unimals de melhor desempenho são então escolhidos e algumas alterações são aplicadas a eles, e a forma resultante é reintroduzida naquele ambiente, onde eles aprendem as mesmas tarefas do zero. Esse processo se repete centenas de vezes: evoluir e aprender, evoluir e aprender.
As mutações dos unimals envolvem a adição ou remoção de membros, ou a alteração do comprimento ou flexibilidade deles. O número de configurações corporais possíveis é vasto: há 1018 variações exclusivas com 10 membros ou menos. Com o passar do tempo, os corpos dos unimals se adaptam a diferentes tarefas. Alguns unimals evoluíram para se mover caindo para a frente em terrenos planos; alguns desenvolveram um gingado semelhante a um lagarto; outros desenvolveram pinças para segurar uma caixa.
Os pesquisadores também testaram o quão bem os unimals que evoluíram podiam se adaptar a uma tarefa que eles não tinham visto antes, uma característica essencial de inteligência geral. Aqueles que evoluíram em ambientes mais complexos, contendo obstáculos ou terreno irregular, foram mais rápidos no aprendizado de novas habilidades, como rolar uma bola ao invés de empurrar uma caixa. Eles também descobriram que o DERL escolheu as formas corporais que aprendiam mais rápido, embora não houvesse pressão seletiva para fazê-lo. “Acho isso empolgante porque demonstra como a forma do corpo e a inteligência estão profundamente conectados”, diz Gupta.
“Certos corpos já são conhecidos por acelerar o aprendizado”, diz Bongard. “Este trabalho evidencia um tipo de IA que é capaz de buscar por eles”. O laboratório de Bongard desenvolveu corpos de robôs que são adaptados a tarefas específicas, como a de revestir os pés dos robôs com uma proteção semelhante aos calos humanos para reduzir o desgaste. Gupta e seus colegas estão expandindo essa ideia, diz Bongard. “Eles revelam que o corpo certo também pode acelerar as mudanças no cérebro do robô”.
Em última análise, essa técnica poderia transfigurar a maneira como pensamos a construção de robôs físicos, diz Gupta. Em vez de começar com uma configuração corporal fixa e, em seguida, treinar o robô para realizar uma tarefa específica, será possível usar o DERL para fazer com que o plano corporal ideal para essa tarefa evoluísse. Somente depois desse processo, a construção ocorreria.
Os unimals de Gupta são parte de uma ampla mudança na forma como os pesquisadores estão pensando sobre a IA. Em vez de treinar IAs em tarefas específicas, como jogar Go ou analisar um exame médico, os pesquisadores estão começando a colocar bots em sandboxes virtuais, como a POET, Arena virtual de esconde-esconde da OpenAI, e o Parque virtual da DeepMind, o XLand— e fazer com que eles aprendam a resolver tarefas múltiplas em espaços de treinamento sempre mutáveis e abertos. Em vez de se aperfeiçoarem em um único desafio, as IAs treinadas dessa forma aprendem habilidades gerais.
Para Gupta, essa exploração livre será a chave para a próxima geração de IAs. “Precisamos de ambientes verdadeiramente abertos para criar agentes inteligentes”, diz ele.