Banca de DEFESA: KARLA CRISTINA TABOSA MACHADO

Uma banca de DEFESA de MESTRADO foi cadastrada pelo programa.
DISCENTE : KARLA CRISTINA TABOSA MACHADO
DATA : 27/07/2018
HORA: 09:00
LOCAL: Sala B206 IMD
TÍTULO:

Desenvolvimento de abordagens computacionais para proteogenômica de procariotos


PALAVRAS-CHAVES:

Proteômica, proteogenômica, espectrometria de massas, procariotos, banco de dados


PÁGINAS: 60
RESUMO:

Com o desenvolvimento de sequenciadores de próximageração, uma revolução ocorreu na pesquisa genômica, e atualmente o genoma completo de milhares de linhagens de bactérias são conhecidos. A análise de proteínas por espectrometria de massas (MS) também passou por grandes desenvolvimentos tecnológicos na última década em termos de sensibilidade e capacidade de sequenciamento. A proteômica ainda não se encontra no mesmo nível que a genômica, mas para amostras contendo proteínas de um eucarioto simples (por exemplo, levedura) ou de uma bactéria, a proteômica já é capaz de detectar e quantificar proteínas de maneira completa e exaustiva. Mas há ainda há desafios no que tange a caracterização de regiões codificadoras de um genoma, bem como na validação de modelos genéticos. Dados da literatura mostram que anotações de um mesmo genoma realizado por abordagens independentes geram resultados conflitantes tanto no número de ORFs anotados, quanto aos seus tamanhos (i.e., diferentes escolhas de início de transcrição/tradução). A caracterização de sequências peptídicas em amostras de proteômica pode ser utilizada para validar regiões do genoma como codificantes, área de pesquisa conhecida como proteogenômica. Para tal ocorrer, é necessário a construção de bancos de sequências customizados, que permitem a identificação de novas regiões que anteriormente não eram preditas como codificadoras e se encontravam ausentes em bancos de dados proteicos. Neste trabalho, foi desenvolvida uma estratégia computacional que constrói bancos de sequências de proteínas customizados, a partir do processamento e análise de dados de sequências proteicas de várias linhagens de uma mesma espécie de bacteria. A abordagem identifica e compara proteínas homólogas e unicamente anotadas em todas as linhagens, e reporta as sequências de proteínas de forma não-redundante, ou seja, sequências extensivamente repetidas entre anotações são reportadas somente uma vez com o intuito de manter o tamanho do espaço de busca sob controle. Os bancos também reportam variações de sequência, sejam elas resultantes de variações genéticas ou divergências de anotação de genes, que normalmente são abdicadas em bancos de dados utilizados em análise proteômica. Além dos bancos, houve também uma preocupação de se criar um arquivo de registro, no qual cada observação referente a presença de homólogos, diferenças de sequências, tipo de modificação e presença em linhagens estivesse bem descrita. Com o objetivo de avaliar se os bancos gerados produziam sequências relevantes e não ocorria perda de informação se comparados às sequências originais utilizadas, dados de MS coletados de linhagens clínicas de Mycobacterium tuberculosis foram submetidas à identificação proteica. Comparou-se o banco de dados criado com essa abordagem com uma base de dados formada pela mera concatenação de todas as proteínas anotadas em M. tuberculosis. Além de reduzir o tempo computacional, o número de identificações obtidas em ambas as buscas foi praticamente idêntico. Finalmente, foram criados bancos para 10 espécies bacterianas com pelo menos 65 linhagens caracterizadas. Ao analisar tais bancos, percebeu-se que quanto maior a diversidade do pangenoma da espécie bacteriana, maior a quantidade de proteínas e peptídeos esperados. Os resultados também demonstram a possibilidade de se utilizar tal estratégia para criar bancos contendo sequências de múltiplas espécies, com o intuito de realizar análises metaproteômicas de dados de MS.


MEMBROS DA BANCA:
Presidente - 2267860 - GUSTAVO ANTONIO DE SOUZA
Interno - 1513597 - JOAO PAULO MATOS SANTOS LIMA
Externo à Instituição - LUCIANO FERNANDES HUERGO - UFPR
Notícia cadastrada em: 05/07/2018 18:30
SIGAA | Superintendência de Tecnologia da Informação - (84) 3342 2210 | Copyright © 2006-2024 - UFRN - sigaa14-producao.info.ufrn.br.sigaa14-producao