Balanceamento de carga intra nó e inter nó e outras abordagens escaláveis para processamento sísmico de alto desempenho
Inversão da Forma de Onda Multiescala (MFWI), Minimizadores Locais Acoplados (CLM), Eficiência, Escalabilidade, Ajuste Automático, Coupled Simulated Annealing (CSA), Migração Reversa no Tempo (RTM), Balanceamento de Carga, Roubo de Trabalho Cíclico Baseado em Token (CTWS), Comunicação Unilateral, Memória Distribuída, Memória Compartilhada, Modelagem Visco-Acústica.
A modelagem sísmica, a migração reversa no tempo (RTM) e inversão de forma de onda multiescala (MFWI) são três das técnicas mais importantes no levantamento sísmico. A modelagem sísmica simula a propagação de ondas, a RTM gera uma imagem da subsuperfície e a MFWI produz um modelo de velocidades de propagação de ondas. Esses métodos possuem um alto custo computacional devido à grande quantidade de dados que eles processam e à complexidade de seus algoritmos. Por isso, na prática, eles são implementados apenas para sistemas paralelos. Embora existam implementações paralelas eficientes de modelagem, RTM e MFWI na literatura, melhorias podem ser feitas para melhor explorar o paralelismo nesses métodos e as características dos sistemas paralelos atuais. Esta pesquisa propõe a inversão de forma de onda multiescala acoplada (CMFWI), um método alternativo à MFWI, que melhora a escalabilidade paralela ao reduzir a dependência paralela entre o processamento de diferentes conteúdos de frequência dos dados. É apresentada uma implementação do CMFWI usando o método de minimizadores locais acoplados (CLM). Os resultados utilizando a norma L2 mostraram que a CMFWI teve desempenho inferior quando comparado ao MFWI. Esses testes indicam que mais pesquisa é necessária para implementar a CMFWI, pois ela compara dados com diferentes conteúdos de frequência. Este trabalho também apresenta uma estratégia de ajuste automático para escolher adequadamente o tamanho ideal dos blocos de carga de trabalho que reduz o tempo de execução de uma RTM 3D em sistemas de memória compartilhada. O método Coupled Simulated Annealing (CSA) é empregado para ajustar o tamanho dos blocos de carga de trabalho que os laços paralelos atribuem dinamicamente às threads. Testes mostram que o método proposto é consistentemente melhor do que dois agendamentos de laços padrão do OpenMP, sendo até 44% mais rápido. Esta tese também introduz o roubo de trabalho cíclico baseado em token (CTWS) para sistemas de memória distribuída. A nova abordagem de token cíclico reduz o número de falhas de roubo, reduz o overhead de comunicação e simplifica a seleção de vítimas e a estratégia de finalização. Os resultados obtidos com a aplicação da técnica proposta para equilibrar a carga de trabalho de uma RTM 3D apresentam um fator de 14,1% de aceleração e redução do desequilíbrio de carga de 78,4% quando comparadas à distribuição estática convencional. Por fim, é apresentada uma implementação de uma modelagem visco-acústica 2D.