Ciclo de Seminários do Programa de Pós-Graduação em Matemática Aplicada e Estatística da UFRN - 2015
Ciclo de Seminários do Programa de Pós-Graduação em Matemática Aplicada e Estatística da UFRN - 2015
Na próxima sexta-feira daremos continuidade ao Ciclo de Seminários do Programa de Pós-Graduação em Matemática Aplicada e Estatística
(PPgMAE) da UFRN - 2015
Seguem as informações:
Ciclo de Seminários do Programa de Pós-Graduação em Matemática Aplicada e Estatística (PPgMAE) da UFRN - 2015
Título: Análise de Dados RNA-Seq com Excesso de Zeros
Palestrante: Marcus Alexandre Nunes - Departamento de Estatística - UFRN
DATA: 08 de maio de 2015 (sexta-feira)
HORÁRIO: 15:00 horas
LOCAL: Auditório do CCET - UFRN
* Depois da apresentação é oferecido um coffee-break para socialização e discussões científicas.
Resumo: As tecnologias de sequenciamento de RNA next-gen estão revolucionando a análise de dados genéticos. Também chamadas de massively parallel signature sequencing (MPSS), estes métodos geram grandes quantidades de dados devido à produção e identificação de milhões de pequenas sequências de código genético. Estas sequências são alinhadas a um genoma de referência e suas ocorrências são contadas. As contagens obtidas por este procedimento são definidas como a expressão gênica dos genes.
Entretanto, uma grande parte destas contagens são zeros. Os Modelos Lineares
Generalizados convencionais utilizados para testar a diferença na expressão gênica neste tipo de dado não são capazes de lidar satisfatoriamente com eles. Neste trabalho propomos um método capaz de lidar com esta característica dos dados RNA-Seq. Mostramos como ajustar estes modelo aos dados de contagem e desenvolvemos um Teste de Razão de Verossimilhança para comparar o ajuste de dois diferentes modelos e assim poder escolher aquele que melhor se ajusta ao dados que analisamos.
Apresentamos simulações para demonstrar o desempenho do nosso método quando comparado a métodos já existentes na literatura da área. Para obtermos um entendimento das principais características do método, apresentamos resultados utilizando diversos parâmetros. Para verificar o poder do teste e o comportamento assintótico do estimador, simulamos exemplos simples onde analisamos apenas um gene por vez. Para verificar o comportamento do teste em situações similares ao mundo real, simulamos conjuntos de
dados que se parecem com aqueles encontrados em experimentos de RNA-Seq.