00 CAMPUS ARISTÓTELES CALAZANS SIMÕES (CAMPUS A. C. SIMÕES) IC - INSTITUTO DE COMPUTAÇÃO Dissertações e Teses defendidas na UFAL - IC
Use este identificador para citar ou linkar para este item: http://www.repositorio.ufal.br/jspui/handle/riufal/5940
Tipo: Dissertação
Título: Caracterização de dados de sobrevivência em câncer colorretal através de uma abordagem de agrupamento de dados
Título(s) alternativo(s): Characterization of Survival Data in Colorectal Cancer through a Data Clustering Approach
Autor(es): Lima, Felipe Prata
Primeiro Orientador: Almeida, Eliana Silva de
metadata.dc.contributor.advisor-co1: Freitas Neto, Manoel Álvaro de Lins
metadata.dc.contributor.referee1: Pereira, Leonardo Viana
metadata.dc.contributor.referee2: Flesia, Ana Georgina
metadata.dc.contributor.referee3: Almeida, André Atanasio Maranhão
Resumo: O câncer colorretal é um dosmais incidentes. Na prática clínica habitual, taxas de sobrevivência são avaliadas a partir do TNM Staging System, considerado o principal sistema prognóstico para o câncer. Diversos trabalhos têmusado diferentes fatores e técnicas de aprendizado de máquina em busca de outros fatores e modelos prognósticos para diversos tipos de câncer. A base de dados do SEER (Surveillance, Epidemiology, and End Results program of the National Cancer Institute) disponibiliza publicamente registros de milhares de casos de câncer nos Estados Unidos nas últimas décadas, com disponibilidade de dados para vários fatores prognósticos relacionados à cada caso da doença. Dadas as características da base de dados do SEER, esse trabalho tem o objetivo de avaliar a aplicação de algumas abordagens baseadas em técnicas de agrupamento de dados para a análise de sobrevivência de pacientes de câncer colorretal: a primeira é uma abordagem tradicional que define uma matriz de dissimilaridade e a outra umensemble clustering para a obtenção de uma matriz de dissimilaridade a partir da acumulação de evidência. Essas técnicas são aplicadas na construção de matrizes de dissimilaridade e umsistema prognóstico. Vários algoritmos de agrupamento de dados foram aplicados com as abordagens, e para cada uma deles foi computado o valor do Akaike Information Criterion (AIC). Considerando o AIC como critério para seleção de modelos, os resultados indicam que a abordagemsem o uso do Ensemble Clustering produziu melhores resultados.
Abstract: The colorectal cancer is one of the most incident. In the usual clinical practice, survival rates are evaluated from the TNM Staging System, considered the main prognostic system for the cancer. Several works have used different factors and techniques ofmachine learning in search of other factors and prognostic models for several cancer types. The SEER (Surveillance, Epidemiology, and End Results program of the National Cancer Institute) database offers publicly thousands of records of cancer cases in the United States in the last decades, with availability of data for several prognostic factors that are related to the disease. Given the SEER database features, this work has the objective of evaluate the application of some approaches based on data clustering techniques to the survival analysis of colorectal câncer patients: the first is a traditional approach which defines a dissimilaritymatrix and the other an ensemble clustering for obtain the dissimilarity matrix from the evidence accumulation. These techniques are applied in the building of dissimilarities matrices and a prognostic system. Several data clustering algorithms were applied with these approaches, and for each was computed the Akaike Information Criterion (AIC) value. Considering the AIC as criterion for model selection, the results showed that the approach without the use of the ensemble clustering gived better results.
Palavras-chave: Câncer colorretal – Análise de sobrevivência
Armazenamento de dados
Análise espacial (Estatística)
Surveillance, Epidemiology, and End Results Program (SEER)
Modelagem computacional
Colorectal Cancer - Survival Analysis
Data storage
Spatial Analysis (Statistics)
SEER data
Computational Modelling
Data clustering
CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Idioma: por
País: Brasil
Editor: Universidade Federal de Alagoas
Sigla da Instituição: UFAL
metadata.dc.publisher.program: Programa de Pós-Graduação em Modelagem Computacional de Conhecimento
Citação: LIMA, Felipe Prata. Caracterização de dados de sobrevivência em câncer colorretal através de uma abordagem de agrupamento de dados. 2019. 98 f. Dissertação (Mestrado em Modelagem Computacional de Conhecimento) – Instituto de Computação, Programa de Pós Graduação em Modelagem Computacional de Conhecimento, Universidade Federal de Alagoas, Maceió, 2014.
Tipo de Acesso: Acesso Aberto
URI: http://www.repositorio.ufal.br/handle/riufal/5940
Data do documento: 2-jun-2014
Aparece nas coleções:Dissertações e Teses defendidas na UFAL - IC



Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.