Com apenas um ano, um bebê é mais hábil do que um robô. Claro, as máquinas podem fazer mais do que apenas pegar e largar objetos, mas não estamos lá no que diz respeito a replicar uma atração natural para a manipulação de destreza exploratória ou sofisticada.
Cientistas do Laboratório de Ciência da Computação e Inteligência Artificial (CSAIL) do MIT, na busca constante de fazer com que as máquinas repliquem as habilidades humanas, criaram uma estrutura mais ampliada: um sistema que pode reorientar mais de dois mil objetos diferentes, com a mão robótica voltado para cima e para baixo. Essa capacidade de manipular qualquer coisa, desde uma xícara até uma lata de atum e uma caixa Cheez-It, pode ajudar a mão a pegar e colocar objetos rapidamente em maneiras e locais específicos e até generalizar para objetos invisíveis.
Esse “trabalho manual” hábil que é geralmente limitado por tarefas únicas e posições verticais pode ser um trunfo para acelerar a logística e a fabricação, ajudando com demandas comuns, como empacotar objetos em slots para montagem de kits ou manipular habilmente uma ampla gama de ferramentas. A equipe usou uma mão antropomórfica simulada com 24 graus de liberdade e mostrou evidências de que o sistema poderia ser transferido para um sistema robótico real no futuro.
“Na indústria, uma garra de mandíbula paralela é mais comumente usada, em parte devido à sua simplicidade no controle, mas é fisicamente incapaz de lidar com muitas ferramentas que vemos na vida cotidiana”, diz Tao Chen, estudante de doutorado do MIT CSAIL, membro do Improvable AI Lab e o pesquisador principal do projeto. “Mesmo usar um alicate é difícil porque ele não pode mover uma alça para frente e para trás com destreza. Nosso sistema permitirá que uma mão com vários dedos manipule habilmente essas ferramentas, o que abre uma nova área para aplicações robóticas”.
Esse tipo de reorientação de objetos ‘na mão’ tem sido um problema desafiador na robótica, devido ao grande número de motores a serem controlados e à frequente mudança no estado de contato entre os dedos e os objetos. E com mais de dois mil objetos, o modelo tinha muito a aprender.
Leia também: Como transformar a sua produção com medição sem contato.
O problema se torna ainda mais complicado quando a mão está voltada para baixo. Não só o robô precisa manipular o objeto, mas também contornar a gravidade para que ele não caia.
A equipe descobriu que uma abordagem simples poderia resolver problemas complexos. Eles usaram um algoritmo de aprendizado por reforço sem modelo (o que significa que o sistema precisa descobrir funções de valor a partir de interações com o ambiente) com aprendizado profundo e algo chamado método de treinamento ‘professor-aluno’.
Para que isso funcione, a rede do ‘professor’ é treinada com informações sobre o objeto e o robô que estão facilmente disponíveis na simulação, mas não no mundo real, como a localização das pontas dos dedos ou a velocidade do objeto. Para garantir que os robôs possam trabalhar fora da simulação, o conhecimento do ‘professor’ é destilado em observações que podem ser adquiridas no mundo real, como imagens de profundidade capturadas por câmeras, pose de objetos e posições conjuntas do robô.
Eles também usaram um ‘currículo de gravidade’, onde o robô primeiro aprende a habilidade em um ambiente de gravidade zero e, em seguida, adapta lentamente o controlador à condição normal de gravidade, o que, ao levar as coisas nesse ritmo, realmente melhorou o desempenho geral.
Embora aparentemente contra-intuitivo, um único controlador (conhecido como cérebro do robô) poderia reorientar um grande número de objetos que nunca havia visto antes e sem conhecimento de forma.
“Inicialmente, pensamos que os algoritmos de percepção visual para inferir a forma enquanto o robô manipula o objeto seriam o principal desafio”, diz o professor do MIT Pulkit Agrawal, autor do artigo sobre a pesquisa. “Pelo contrário, nossos resultados mostram que é possível aprender estratégias de controle robustas que são independentes de forma. Isso sugere que a percepção visual pode ser muito menos importante para a manipulação do que estamos acostumados a pensar, e estratégias de processamento perceptual mais simples podem ser suficientes”.
Muitos objetos pequenos e circulares (maçãs, bolas de tênis, bolinhas de gude), tiveram taxas de sucesso próximas a cem por cento quando reorientadas com a mão voltada para cima e para baixo, com as menores taxas de sucesso, sem surpresa, para objetos mais complexos, como uma colher, uma chave de fenda, ou uma tesoura, sendo mais próxima de trinta.
Além de trazer o sistema para a natureza, uma vez que as taxas de sucesso variam com a forma do objeto, no futuro, a equipe observa que treinar o modelo com base nas formas do objeto pode melhorar o desempenho.
Gostou do conteúdo e quer saber mais sobre o assunto? Confira nosso site.