Use este identificador para citar ou linkar para este item:
http://www.repositorio.ufal.br/jspui/handle/123456789/13028
Tipo: | Dissertação |
Título: | Recomendação de um modelo de aprendizado de máquina parapredição de risco cardiovascular com biomarcadores da síndrome metabólica e Escore de Framingham |
Autor(es): | Silva, Wellignton Batista da |
Primeiro Orientador: | Silva, Rafael de Amorim |
metadata.dc.contributor.advisor-co1: | Pimentel, Bruno Almeida |
metadata.dc.contributor.referee1: | Paiva, Ranilson Oscar Araújo |
metadata.dc.contributor.referee2: | Guimarães, Almir Pereira |
metadata.dc.contributor.referee3: | Mello, Rafael Ferreira Leite de |
Resumo: | A previsão de eventos cardiovasculares em pacientes diagnosticados com Síndrome Metabólica (SM) é um tema de grande relevância para a área da Saúde, em geral, e fundamental para a da Endocrinologia. Esta dissertação objetiva recomendar um modelo de Machine Learning (ML) para estimar os riscos de eventos cardiovasculares em pacientes com SM, explorando os marcadores do escore de Framingham (FRS) e da SM. Metodologicamente, utilizamos um modelo de regressão logística e análises com árvore de decisão, floresta aleatória, impulsionamento de gradiente, máquina de vetores de suporte e k-vizinhos mais próximos para testar nossa hipótese central de que os bioindicadores (variáveis relacionadas à SM) exercem um impacto positivo, forte e significativo nos eventos cardiovasculares em pacientes com SM. Tecnicamente a pesquisa foi conduzida por meio de experimentos realizados em diferentes cenários. No primeiro cenário, um algoritmo foi desenvolvido para avaliar o risco cardiovascular em pacientes com e sem SM. Nos cenários 2, 3 e 4, foram analisados pacientes com e sem SM, considerando os marcadores de SM e FRS como variáveis dependentes, enquanto a condição de Síndrome Metabólica foi adotada como variável independente. No quinto cenário, uma análise foi realizada para selecionar o modelo de regressão e classificação mais adequado para a predição do risco cardiovascular em um conjunto de dados combinado de doenças cardíacas. No sexto cenário, o modelo desenvolvido foi fundamentado no Escore de Risco Global (ERG) de Framingham, incorporando os marcadores da SM nos experimentos. Os dados foram obtidos a partir do repositório do National Center for Health Statistics (NHANES), um conjunto de dados combinados de doenças cardíacas do Repositório de aprendizado de máquina UCI. e da plataforma Kaggle. Em resumo, os principais achados desta dissertação são os seguintes: (1) No primeiro cenário, uma diferença percentual de 81,74% foi observada nas médias de Risco ECV entre as populações com e sem Síndrome Metabólica, evidenciando um aumento significativo do risco cardiovascular na população com SM; (2) nos cenários dois, três e quatro, o modelo Random Forest (RF) se destacou, alcançando alta acurácia em todas as combinações de variáveis, especialmente na combinação dos marcadores da Sm como marcador de sexo; (3)no quinto cenário, o modelo RF foi identificado como o mais indicado, destacando a importância das variáveis relacionadas à SM na predição do risco cardiovascular e ressaltando a necessidade de aprimoramentos nos modelos para melhor identificação dos casos positivos; (4) tanto o modelo com quatro marcadores da SM quanto o modelo com cinco marcadores da SM combinados ao escore de Framingham (SM + FRS) apresentaram desempenho considerável, com correlações e acurácias significativas (0.80 e 0.84, respectivamente). Essas combinações mais simples de variáveis podem ser uma abordagem interessante, uma vez que fornecem informações relevantes para a predição do risco cardiovascular de forma menos invasiva, evitando a necessidade de exames mais complexos. |
Abstract: | The prediction of cardiovascular events in patients diagnosed with Metabolic Syndrome (MS) is a topic of great importance in the field of Health in general and crucial for Endocrinology. This dissertation aims to recommend a Machine Learning (ML) model to estimate the risks of cardiovascular events in patients with MS, exploring the markers of the Framingham Risk Score (FRS) and MS. Methodologically, we used a logistic regression model and conducted analyses with decision trees, random forest, gradient boosting, support vector machine, and k-nearest neighbors to test our central hypothesis that bioindicators (variables related to MS) exert a positive, strong, and significant impact on cardiovascular events in MS patients. Technically, the research was carried out through experiments conducted in different scenarios. In the first scenario, an algorithm was developed to assess cardiovascular risk in patients with and without MS. In scenarios 2, 3, and 4, patients with and without MS were analyzed, considering MS and FRSmarkersasdependentvariables,whiletheMetabolicSyndromeconditionwasadoptedasan independent variable. In the fifth scenario, an analysis was performed to select the most suitable regression and classification model for predicting cardiovascular risk in a combined dataset of heart diseases. In the sixth scenario, the developed model was based on the Framingham Global Risk Score (FRS), incorporating MS markers into the experiments. Data were obtained from the National Center for Health Statistics (NHANES) repository, a combined dataset of heart diseases from the UCI Machine Learning Repository, and the Kaggle platform. In summary, the main findings of this dissertation are as follows: In the first scenario, a percentage difference of 81.74% was observed in mean CVD Risk between populations with and without Metabolic Syndrome, demonstrating a significant increase in cardiovascular risk in the population with MS. In scenarios two, three, and four, the Random Forest (RF) model excelled, achieving high accuracy in all variable combinations, especially in the combination of MS markers with gender. In the fifth scenario, the RF model was identified as the most suitable, emphasizing the importance of variables related to MS in predicting cardiovascular risk and highlighting the need for model improvements to better identify positive cases. Both the model with four MS markers and the model with five MS markers combined with the Framingham Risk Score (SM + FRS) demonstrated considerable performance, with significant correlations and accuracies (0.80 and 0.84, respectively). These simpler variable combinations can be an interesting approach as they provide relevant information for predicting cardiovascular risk in a less invasive manner, avoiding the need for more complex tests. |
Palavras-chave: | Aprendizado de máquina Modelo de predição Síndrome metabólica Escore de risco global (ERG) de Framingham Machine Learning Prediction model Metabolic Syndrome Framingham Global Risk Score (GRS) |
CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
Idioma: | por |
País: | Brasil |
Editor: | Universidade Federal de Alagoas |
Sigla da Instituição: | UFAL |
metadata.dc.publisher.program: | Programa de Pós-Graduação em Informática |
Citação: | SILVA, Wellignton Batista da. Recomendação de um modelo de aprendizado de máquina para predição de risco cardiovascular com biomarcadores da síndrome metabólica e Escore de Framingham. 2024. 135 f. Dissertação (Mestrado em Informática) – Programa de Pós-Graduação em Informática, Instituto de Computação. Universidade Federal de Alagoas. Maceió, 2023. |
Tipo de Acesso: | Acesso Aberto |
URI: | http://www.repositorio.ufal.br/jspui/handle/123456789/13028 |
Data do documento: | 30-ago-2023 |
Aparece nas coleções: | Dissertações e Teses defendidas na UFAL - IC |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
Recomendação de um modelo de aprendizado de máquina parapredição de risco cardiovascular com biomarcadores da síndrome....pdf | 1.95 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.