A-DOBRA: WEBSERVICE DE ALTO DESEMPENHO APLICADO À BIOINFORMÁTICA ESTRUTURAL
HPC; Modelagem de proteínas; Workload; Containers; Webservices
A predição da estrutura tridimensional de proteínas representa um dos maiores desafios da biologia molecular moderna, sendo fundamental para o desenvolvimento de múltiplas áreas da sociedade. Métodos experimentais como cristalografia de raios-X, ressonância magnética nuclear e criomicroscopia eletrônica foram empregados por muito tempo para determinar essas estruturas, porém demandam recursos consideráveis, tempo extenso, além de não serem aplicáveis a todas as proteínas. Esta limitação impulsionou o desenvolvimento de abordagens computacionais baseadas em inteligência artificial, destacando-se o AlphaFold, tecnologia desenvolvida pelo DeepMind que revolucionou a predição estrutural através de redes neurais de atenção e treinamento com bases de dados evolutivos. Desta forma, o objetivo deste estudo é desenvolver o A-DOBRA, um webservice de alto desempenho integrado a sistemas de computação de alto desempenho (HPC) para democratizar o acesso à modelagem de proteínas utilizando AlphaFold, fornecendo uma plataforma intuitiva para profissionais das ciências naturais sem expertise computacional. A metodologia envolveu otimizações significativas no pipeline do AlphaFold 2, incluindo melhorias nos scripts de download das bases de dados genéticas e estruturais, implementação de verificações de integridade e caminhos alternativos para tratamento de falhas. No entanto, com o lançamento da versão 3 do Alphafold, a abordagem teve que ser atualizada, com o intuito de potencializar os resultados das modelagens com o que se tem de mais moderno nessa área científica. Foram utilizados containers com Apptainer para isolamento de ambientes e integração com workload manager SLURM para otimização de recursos computacionais. No desenvolvimento web foi utilizada a linguagem PHP com o framework Laravel e o PostgreSQL.