Controle inteligente de um robô móvel omnidirecional com tomada de decisão utilizando aprendizagem por reforço
Aprendizagem por reforço, Controle inteligente, Epsilon greedy, Redes neurais artificiais, Robôs móveis
A evolução dos sistemas robóticos se tornou evidente no decorrer do tempo. Tanto pelos avanços em fabricação mecânica quanto pelos novos algoritmos utilizados, os robôs móveis têm se tornado cada vez mais independentes em suas ações. No que tange às estratégias de aprendizagem de máquina, uma atenção especial vem sendo dada aos algoritmos de aprendizagem por reforço, em virtude de suas semelhanças com o processo de aprendizado biológico. Neste trabalho propõe-se o desenvolvimento de um agente autônomo, combinando estratégias de controle inteligente com algoritmos de tomada de decisão. Para a implementação da estratégia proposta, será utilizado o robô móvel omnidirecional Robotino. Foram realizadas simulações de atuação do robô que tem por objetivo a exploração espacial de um ambiente, sendo para isso aplicado um modelo matemático específico. Para o controle do sistema, a estratégia de Linearização por Realimentação foi combinada a um compensador baseado em Redes Neurais Artificiais para lidar com as incertezas, eventuais perturbações externas e compensar a dinâmica não modelada. O algoritmo epsilon-greedy, por sua vez, foi escolhido para capacitar o robô no processo de tomada de decisão. Os resultados da implementação experimental mostram que a estratégia de controle inteligente foi eficiente e o agente inteligente proposto foi capaz de explorar o ambiente de maneira efetiva, obtendo uma alta recompensa média.