Sistemas mecânicos subatuados, Controle por Modos Deslizantes, Redes Neurais Artificiais, Aprendizagem por Reforço, Upper Confidence Bound
Os sistemas mecânicos subatuados (UMS, Underactuated mechanical systems) são frequentemente encontrados em várias aplicações industriais e do mundo real, como manipuladores robóticos com componentes elásticos, veículos aeroespaciais, embarcações marítimas e guindastes de contêineres. O projeto de controladores precisos para este tipo de sistema mecânico pode ser muito desafiador, especialmente se um alto nível de incerteza estiver envolvido. Além disso, para aumentar a confiabilidade e produtividade, é importante que os algoritmos de controle possam tornar o sistema capaz de se adaptar a condições diferentes das de projeto, como por exemplo mudanças dos objetivos de operação e as falhas que porventura podem ocorrer nos atuadores. Nesse sentido, um ajuste em tempo real dos parâmetros do controlador é necessário para melhorar o desempenho de controle quando as configurações operacionais são alteradas. Este trabalho apresenta um controlador por Modos Deslizantes para UMS utilizando Redes Neurais Artificiais para representar e compensar dinâmicas não modeladas e incertezas de modelagem e um novo Sistema de Supervisão Inteligente baseado em Aprendizagem por Reforço para realizar os ajustes necessários nos parâmetros do controlador. As propriedades de estabilidade do controlador são provadas utilizando o Teorema de Estabilidade de Lyapunov. Em relação ao Supervisor Inteligente, foi utilizada a abordagem do problema MAB (\textit{Multi-Armed Bandit}) como base para o algoritmo de ajuste dos parâmetros de controle de acordo com o método UCB (Upper Confidence Bound). A metodologia é testada com o problema de rastreamento de trajetória de um sistema de ponte rolante.