MÉTODOS DE CLASSIFICAÇÃO MULTIVARIADA E ESPECTROSCOPIA DO INFRAVERMELHO MÉDIO EM TECIDOS DE CÂNCER DE PRÓSTATA
Métodos Multivariados de Classificação; FT-MIR; Câncer de Próstata; Tecidos.
Esta pesquisa é um aporte para a categorização dos tipos de câncer de próstata por meio de métodos quimiométricos de classificação aplicados em espectros do infravermelho médio oriundos de tecidos humanos. Os métodos multivariados de classificação têm como vantagens objetividade; rapidez; acurácia; fácil procedimento; podem ser aplicados como métodos exploratórios e ou preditivos; de acordo com o método, podem ser aplicados diretamente nos dados originais; separam as classes de acordo com um comportamento ótimo encontrado (linear, quadrático, não-linear, etc). A aplicação desses métodos surge para reduzir, selecionar e classificar informações úteis ao diagnóstico e categorização dos tipos de câncer, diante da grande quantidade informações contidas na região espectral do infravermelho médio (400 – 4,000 cm-1). A espectroscopia do infravermelho médio (FT-MIR) por sua vez, simplifica os procedimentos de preparação das amostras e minimiza possíveis modificações, conferindo rapidez ao diagnóstico; é independe da variabilidade intra e inter-observador, e demonstra alta sensibilidade e especificidade, rapidez e confiabilidade dos resultados. Com base em dados obtidos dos espectros vibracionais de uma dada amostra, é possível diferenciar estados patológicos dos tecidos. Com o objetivo geral de aplicar métodos de classificação multivariada (PCA, SPA, GA, LDA, QDA, SVM) e FT-MIR para diferenciar graus de câncer de próstata via análise de tecidos, buscou-se a identificar diferenças espectrais entre os graus de câncer de próstata e a determinar marcadores bioquímicos responsáveis pela diferenciação, bem como a comparar e avaliar as performances dos métodos de classificação. Foram utilizadas amostras de tecido humano cedidas pelo Departamento de Patologia (DPAT/UFRN), previamente classificadas em três graus de acordo com o sistema de graduação de Gleason. Foram coletados 40 a 100 espectros de transmissão por amostra (resolução 8 cm-1, 32 scans). Os espectros médios foram cortados na região de maior informação bioquímica (800-1900 cm-1) e pré-processados via EMSC e suavização de Savitzky-Golay (15 pontos). Os algoritmos de redução e seleção de variáveis PCA, SPA e GA foram associados aos algoritmos de classificação multivariada LDA, QDA e SVM para imprimir robustez à separação dos estágios de câncer de próstata e para a identificação de marcadores bioquímicos responsáveis pela diferenciação. Os modelos aplicados foram comparados de acordo com a taxa de classificação, sensibilidade e especificidade, e outras métricas. Todos os métodos obtiveram indicadores de qualidade satisfatórios na classificação, com destaque aos modelos GA-QDA e GA-LDA. Os principais marcadores bioquímicos identificados, em diferentes ordens de intensidade, foram: região de proteínas secundárias (≈ 1591–1483 cm-1), de DNA e RNA (≈1000–1490 cm−1) e de fosforolização de proteínas (≈ 970 cm-1). Alterações nessas regiões podem indicar modificações metabólicas provocadas pelos estágios do câncer. Os resultados encontrados indicam que os métodos de classificação multivariada associados à FT-MIR possibilitaram diferenciar estados patológicos dos tecidos inclusive nos estados iniciais do câncer de próstata com alta sensibilidade e especificidade. As técnicas propostas poderão provocar impactos econômicos e sociais benéficos provenientes do diagnóstico precoce e da viabilidade do tratamento nos estágios iniciais, o que pode possibilitar ganho em qualidade de vida e sobrevida dos pacientes.