00 CAMPUS ARISTÓTELES CALAZANS SIMÕES (CAMPUS A. C. SIMÕES) IC - INSTITUTO DE COMPUTAÇÃO Dissertações e Teses defendidas na UFAL - IC
Use este identificador para citar ou linkar para este item: http://www.repositorio.ufal.br/jspui/handle/123456789/9690
Tipo: Dissertação
Título: Estudo comparativo sobre meta-heurísticas em GPU para clusterização de dados
Título(s) alternativo(s): A comparative study of GPU metaheuristics for data clustering
Autor(es): Santos, Mario Diego Ferreira dos
Primeiro Orientador: Nogueira, Bruno Costa e Silva
metadata.dc.contributor.advisor-co1: Pinheiro, Rian Gabriel Santos
metadata.dc.contributor.referee1: Barboza, Erick de Andrade
metadata.dc.contributor.referee2: Andrade, Ermeson Carneiro de
Resumo: Clusterização é uma classe fundamental de problemas com aplicações em muitas áreas do conhecimento, incluindo: bioinformática, visão computacional, mineração de dados, mineração de texto e agrupamento de páginas na Web. Dado um conjunto de n objetos, a clusterização objetiva agrupar automaticamente tais objetos em k grupos, geralmente disjuntos, denominados clusters ou agrupamentos utilizando uma medida de similaridade preestabelecida. Problemas de clusterização em geral têm alta complexidade computacional e envolvem uma grande quantidade de dados de entrada. Dessa forma, o uso de arquiteturas paralelas como Graphics Processing Units (GPUs) são alternativas interessantes para acelerar o processo de clusterização. Neste trabalho, foi conduzido um estudo comparativo de meta-heurísticas aceleradas por GPU para agrupamento de dados. Três meta- eurísticas populacionais foram implementadas na GPU: Particle Swarm Optimization (PSO), Differential Evolution (DE) e Scatter Search (SS). A implementação dessas meta-heurísticas foi dividida em duas partes: a parte independente do problema e a parte dependente problema. A parte independente do problema se refere aos operadores de seleção, reposição e combinação de cada meta-heurística, enquanto que a parte dependente se refere a função objetivo. A parte independente foi implementada usando o framework libCudaOptimize, e a parte dependente foi criada transformando o problema de clusterização em um problema de otimização global sujeito a restrições de caixa. As metaheurísticas propostas foram comparadas com o melhor algoritmo de clusterização da atualidade C-GRASP-Clu considerando o tempo de execução e qualidade da solução. Os resultados indicam que o PSO baseado em GPU (GPU-PSO) obteve os melhores resultados em comparação com as outras meta-heurísticas baseadas em GPU e o melhor método da atualidade. Além disso, nossa implementação em GPU da função objetivo obteve um speedup médio de 175x sobre a versão sequencial. Os resultados demonstram que uma abordagem de GPU para o problema de clusterização é muito promissora.
Abstract: Clustering is a fundamental class of problems with applications in many areas of knowledge, including: bioinformatics, computer vision, data mining, text mining, and web page grouping. Given a set of n objects, clustering aims to automatically group such objects in k groups, usually disjunct, called clusters or groupings using a pre-established similarity measure. Clustering problems in general have high computational complexity and involve a large amount of input data. Thus, the use of parallel architectures such as Graphics Processing Units (GPUs) is interesting alternatives to accelerate the clustering process. In this work, we conducted a comparative study of GPU-accelerated metaheuristics for grouping data. Three population meta-heuristics were implemented in the GPU: Particle Swarm Optimization (PSO), Differential Evolution (DE), and Scatter Search (SS). The implementation of these meta-heuristics was divided into two parts: the independent part of the problem and the dependent part of the problem. The independent part of the problem refers to the selection, replacement, and combination operators for each meta-heuristic, while the dependent part refers to the objective function. The independent part was implemented using the libCudaOptimize framework, and the dependent part was created by transforming the clustering problem into a global optimization problem subject to cash constraints. The proposed meta-heuristics were compared with the best current clustering algorithm C-GRASP-Clu considering the execution time and quality of the solution. The results indicate that the GPU-based PSO (GPU-PSO) obtained the best results in comparison with the other GPU-based metaheuristics and the best method today. Also, our GPU implementation of the objective function obtained an average speedup of 175x over the sequential version. These results demonstrate that a GPU approach to the clustering problem is very promising.
Palavras-chave: Clusterização de dados
Meta-heurística
Unidades de processamento gráfico
Otimização
Data clustering
Metaheuristics
GPU
Optimization
CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Idioma: por
País: Brasil
Editor: Universidade Federal de Alagoas
Sigla da Instituição: UFAL
metadata.dc.publisher.program: Programa de Pós-Graduação em Informática
Citação: SANTOS, Mario Diego Ferreira dos. Estudo comparativo sobre meta-heurísticas em GPU para clusterização de dados. 2022. Dissertação (Mestrado em Informática) - Instituto de Computação, Programa de Pós-Graduação em Informática, Universidade Federal de Alagoas, Maceió, 2021.
Tipo de Acesso: Acesso Aberto
URI: http://www.repositorio.ufal.br/jspui/handle/123456789/9690
Data do documento: 30-abr-2021
Aparece nas coleções:Dissertações e Teses defendidas na UFAL - IC

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Estudo comparativo sobre meta-heurísticas em GPU para clusterização de dados.pdf732.52 kBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.