Use este identificador para citar ou linkar para este item:
http://www.repositorio.ufal.br/jspui/handle/123456789/12903
Tipo: | Trabalho de Conclusão de Curso |
Título: | Melhorando o desempenho na classificação de imagens médicas: uma análise comparativa de técnicas de aumento de dados |
Autor(es): | Alves, Phyllipe Matheus Bezerra |
Primeiro Orientador: | Oliveira, Marcelo Costa de |
metadata.dc.contributor.referee1: | Santos Neto, Baldoino Fonseca dos |
metadata.dc.contributor.referee2: | Lima, Lucas Lins de |
Resumo: | Os métodos de classificação e segmentação de imagens médicas baseados em redes neurais convolucionais (CNNs) possuem o estado da arte quando se trata de acurácia. No entanto, a escassez de dados médicos rotulados disponíveis para o treinamento supervisionado das CNNs pode comprometer sua performance. Para contornar essa limitação, os métodos de aumento de dados têm sido empregados com sucesso. Esses métodos consistem na aplicação de transformações nos dados de entrada, como rotação, translação, escala e espelhamento, a fim de gerar novas imagens sintéticas que possam enriquecer o conjunto de treinamento. Além disso, podem ser aplicadas a diferentes tipos de dados, incluindo aplicações com o uso de diferentes tipos de imagens médicas. O objetivo desse trabalho é analisar a eficácia de quatro métodos automáticos de aumento de dados: Método base, AugMix, RandAugment e TrivialAugment. Propõe-se assim, a análise da eficácia de um modelo de CNN na categorização de imagens de raio-x de pneumonia por COVID-19, em que o conjunto de dados está categorizado em quatro diferentes classes e será aumentado a partir de quatro cenários de aumento de dados diferentes, ao final dos treinamentos e validações os resultados foram comparados. Os resultados mostraram que o uso do método AugMix obteve o melhor resultado dentre os métodos avaliados, com F1-Score de 0.910368, cerca de 5% maior quando comparado ao método base. Seguido dos métodos RandAugment e TrivialAugment com valores de F1-Score de 0.896375 e 0.893653 respectivamente. Além disso, notou-se que em comparação com o método base, os métodos avaliados foram capazes de reduzir o overfitting do modelo, melhorando sua capacidade de generalização para novos casos. Espera-se que o resultado desse estudo possam contribuir para a melhor compreensão da importância do aumento de dados, auxiliar na escolha do melhor método de aumento de dados para o domínio de imagens de raio-x de pneumonia por COVID-19 e analisar o impacto de diferentes métodos automáticos de aumento de dados no desempenho de modelos supervisionados de classificação de imagens de pneumonia por COVID-19. |
Abstract: | Classification and segmentation methods for medical image analysis based on convolutional neural networks (CNNs) have achieved state-of-the-art accuracy. However, the scarcity of labeled medical data available for supervised training of CNNs can compromise their performance. To overcome this limitation, data augmentation methods have been successfully employed. These methods involve applying transformations to the input data, such as rotation, translation, scaling, and mirroring, to generate synthetic images that enrich the training set. Additionally, they can be applied to different types of data, including applications involving various types of medical images. The objective of this study is to evaluate the effectiveness of four automatic data augmentation methods: Baseline, AugMix, RandAugment, and TrivialAugment. We aim to assess the performance of a CNN model in classifying X-ray images of COVID-19 pneumonia, utilizing a dataset divided into four distinct classes. The dataset will be augmented using four different data augmentation scenarios. Subsequently, the results obtained from the training and validation processes will be compared and analyzed. The results showed that the AugMix method achieved the best performance among the evaluated methods, with an F1-Score of 0.910368, approximately 5% higher than the baseline method. The RandAugment and TrivialAugment methods followed, with F1-Scores of 0.896375 and 0.893653, respectively. Furthermore, it was noticed that compared to the baseline method, the evaluated methods were able to reduce model overfitting, improving its generalization capability for new cases. It is expected that the results of this study will contribute to a better understanding of the importance of data augmentation, assist in selecting the best data augmentation method for the domain of COVID-19 pneumonia X-ray images, and analyze the impact of different automatic data augmentation methods on the performance of supervised classification models for COVID-19 pneumonia image analysis. |
Palavras-chave: | Imagens médicas - Classificação Redes neurais convolucionais Aumento de dados Aprendizagem profunda Medical images - Classification Convolutional neural networks Data augmentation Deep learning |
CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
Idioma: | por |
País: | Brasil |
Editor: | Universidade Federal de Alagoas |
Sigla da Instituição: | UFAL |
metadata.dc.publisher.department: | Curso de Ciências da Computação - Bacharelado |
Citação: | ALVES, Phyllipe Matheus Bezerra. Melhorando o desempenho na classificação de imagens médicas: uma análise comparativa de técnicas de aumento de dados. 2024. 35 f. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) – Instituto de Computação, Universidade Federal de Alagoas, Maceió, 2023. |
Tipo de Acesso: | Acesso Aberto |
URI: | http://www.repositorio.ufal.br/jspui/handle/123456789/12903 |
Data do documento: | 19-jun-2023 |
Aparece nas coleções: | Trabalhos de Conclusão de Curso (TCC) - Bacharelado - CIÊNCIA DA COMPUTAÇÃO- IC |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
Melhorando o desempenho na classificação de imagens médicas: uma análise comparativa de técnicas de aumento de dados.pdf | 1.91 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.