Use este identificador para citar ou linkar para este item:
http://www.repositorio.ufal.br/jspui/handle/123456789/9690
Tipo: | Dissertação |
Título: | Estudo comparativo sobre meta-heurísticas em GPU para clusterização de dados |
Título(s) alternativo(s): | A comparative study of GPU metaheuristics for data clustering |
Autor(es): | Santos, Mario Diego Ferreira dos |
Primeiro Orientador: | Nogueira, Bruno Costa e Silva |
metadata.dc.contributor.advisor-co1: | Pinheiro, Rian Gabriel Santos |
metadata.dc.contributor.referee1: | Barboza, Erick de Andrade |
metadata.dc.contributor.referee2: | Andrade, Ermeson Carneiro de |
Resumo: | Clusterização é uma classe fundamental de problemas com aplicações em muitas áreas do conhecimento, incluindo: bioinformática, visão computacional, mineração de dados, mineração de texto e agrupamento de páginas na Web. Dado um conjunto de n objetos, a clusterização objetiva agrupar automaticamente tais objetos em k grupos, geralmente disjuntos, denominados clusters ou agrupamentos utilizando uma medida de similaridade preestabelecida. Problemas de clusterização em geral têm alta complexidade computacional e envolvem uma grande quantidade de dados de entrada. Dessa forma, o uso de arquiteturas paralelas como Graphics Processing Units (GPUs) são alternativas interessantes para acelerar o processo de clusterização. Neste trabalho, foi conduzido um estudo comparativo de meta-heurísticas aceleradas por GPU para agrupamento de dados. Três meta- eurísticas populacionais foram implementadas na GPU: Particle Swarm Optimization (PSO), Differential Evolution (DE) e Scatter Search (SS). A implementação dessas meta-heurísticas foi dividida em duas partes: a parte independente do problema e a parte dependente problema. A parte independente do problema se refere aos operadores de seleção, reposição e combinação de cada meta-heurística, enquanto que a parte dependente se refere a função objetivo. A parte independente foi implementada usando o framework libCudaOptimize, e a parte dependente foi criada transformando o problema de clusterização em um problema de otimização global sujeito a restrições de caixa. As metaheurísticas propostas foram comparadas com o melhor algoritmo de clusterização da atualidade C-GRASP-Clu considerando o tempo de execução e qualidade da solução. Os resultados indicam que o PSO baseado em GPU (GPU-PSO) obteve os melhores resultados em comparação com as outras meta-heurísticas baseadas em GPU e o melhor método da atualidade. Além disso, nossa implementação em GPU da função objetivo obteve um speedup médio de 175x sobre a versão sequencial. Os resultados demonstram que uma abordagem de GPU para o problema de clusterização é muito promissora. |
Abstract: | Clustering is a fundamental class of problems with applications in many areas of knowledge, including: bioinformatics, computer vision, data mining, text mining, and web page grouping. Given a set of n objects, clustering aims to automatically group such objects in k groups, usually disjunct, called clusters or groupings using a pre-established similarity measure. Clustering problems in general have high computational complexity and involve a large amount of input data. Thus, the use of parallel architectures such as Graphics Processing Units (GPUs) is interesting alternatives to accelerate the clustering process. In this work, we conducted a comparative study of GPU-accelerated metaheuristics for grouping data. Three population meta-heuristics were implemented in the GPU: Particle Swarm Optimization (PSO), Differential Evolution (DE), and Scatter Search (SS). The implementation of these meta-heuristics was divided into two parts: the independent part of the problem and the dependent part of the problem. The independent part of the problem refers to the selection, replacement, and combination operators for each meta-heuristic, while the dependent part refers to the objective function. The independent part was implemented using the libCudaOptimize framework, and the dependent part was created by transforming the clustering problem into a global optimization problem subject to cash constraints. The proposed meta-heuristics were compared with the best current clustering algorithm C-GRASP-Clu considering the execution time and quality of the solution. The results indicate that the GPU-based PSO (GPU-PSO) obtained the best results in comparison with the other GPU-based metaheuristics and the best method today. Also, our GPU implementation of the objective function obtained an average speedup of 175x over the sequential version. These results demonstrate that a GPU approach to the clustering problem is very promising. |
Palavras-chave: | Clusterização de dados Meta-heurística Unidades de processamento gráfico Otimização Data clustering Metaheuristics GPU Optimization |
CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
Idioma: | por |
País: | Brasil |
Editor: | Universidade Federal de Alagoas |
Sigla da Instituição: | UFAL |
metadata.dc.publisher.program: | Programa de Pós-Graduação em Informática |
Citação: | SANTOS, Mario Diego Ferreira dos. Estudo comparativo sobre meta-heurísticas em GPU para clusterização de dados. 2022. Dissertação (Mestrado em Informática) - Instituto de Computação, Programa de Pós-Graduação em Informática, Universidade Federal de Alagoas, Maceió, 2021. |
Tipo de Acesso: | Acesso Aberto |
URI: | http://www.repositorio.ufal.br/jspui/handle/123456789/9690 |
Data do documento: | 30-abr-2021 |
Aparece nas coleções: | Dissertações e Teses defendidas na UFAL - IC |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
Estudo comparativo sobre meta-heurísticas em GPU para clusterização de dados.pdf | 732.52 kB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.