Aplicação de Aprendizado por Reforço Profundo na Seleção de Amostras para Estimação de Tempo de Execução no PaScal Suite
Análise de Escalabilidade,Reinforcement Learning, Estimativas de Desempenho, PaScal Suite
A alocação eficiente de recursos em HPC depende da predição precisa do comportamento de aplicações. Contudo, a geração de dados para treinamento de modelos é computacionalmente custosa. Esta dissertação propõe uma estratégia baseada em Aprendizado por Reforço Profundo para otimizar a coleta de amostras na modelagem de desempenho. O objetivo é minimizar o número de execuções necessárias para treinar um modelo de regressão com alta acurácia. A metodologia emprega um agente de Deep Q-Learning que seleciona iterativamente configurações (núcleos e tamanho do problema) visando maximizar o ganho de informação. Análises experimentais serão realizadas para avaliar abordagem em relação a métodos aleatórios e heurísticos, buscando atingir a convergência com menos amostras. A solução, quando integrada ao PaScal Suite, validará o uso de agentes inteligentes para reduzir custos temporais em análises de escalabilidade.