00 CAMPUS ARISTÓTELES CALAZANS SIMÕES (CAMPUS A. C. SIMÕES) IC - INSTITUTO DE COMPUTAÇÃO Dissertações e Teses defendidas na UFAL - IC
Use este identificador para citar ou linkar para este item: http://www.repositorio.ufal.br/jspui/handle/123456789/10760
Tipo: Dissertação
Título: Algoritmo BRKGA multipopulacional (MultiPop-BRKGA-PCA) para o problema de clusterização automática
Título(s) alternativo(s): Multipopulation BRKGA Algorithm (MultiPop-BRKGA-PCA) for Automatic Clustering Problem
Autor(es): Lima, Alexandre Sérgio Dantas de
Primeiro Orientador: Pinheiro, Rian Gabriel Santos
metadata.dc.contributor.advisor-co1: Nogueira, Bruno Costa e Silva
metadata.dc.contributor.referee1: Aquino, André Luiz Lins de
metadata.dc.contributor.referee2: Araújo, Jean Carlos Teixeira de
Resumo: O processo de agrupamento de dados é conhecido como clusterização. Na literatura, o processo de clusterização, ou agrupamento, tem duas variações: (i) se o número de clusters for predefinido, esse processo é conhecido como Problema de Clusterização (CP — Clustering Problem) ou Problema de k-Clusterização, e (ii) quando o número de clusters não é definido, o processo torna-se conhecido como Problema de Clusterização Automática (ACP —Automatic Clustering Problem). A importância de ter dados bem agrupados é crucial para a tomada decisões mais assertivas. A técnica de agrupamento de dados possui aplicabilidade nas mais diversas áreas do conhecimento, como: engenharia, administração, economia, biologia, física, entre outras. Os algoritmos genéticos são baseados em processos de evolução darwinistas, selecionando as melhores soluções dentro de uma população. O BRKGA (Biased Random Key Genetic Algorithm), é apresentado como uma variação dos algoritmos genéticos, em que as soluções de um problema são representadas como vetores de chaves reais, geradas aleatoriamente, no intervalo contínuo de [0,1). O fitness de uma solução viável é determinado pelo decodificador, que mapeia este vetor em um valor real. Este trabalho propõe um BRKGA multipopulacional para identificar o número ideal de clusters, de acordo com o índice de silhueta — uma medida de eficácia de agrupamento bastante utilizada na literatura. No algoritmo proposto, o espaço de soluções é particionado de forma que cada subpopulação o algoritmo represente soluções com um número k de cluster. Assim, a cada subpopulação, um BRKGA independente é aplicado. Experimentos computacionais foram realizados em cinquenta e cinco instâncias da literatura. As instâncias utilizadas neste trabalho possuem dimensões que variam de 30 a 2.000 objetos e 2 a 13 atributos, com diferentes graus de dificuldade e características, por exemplo, coesão de grupo, separação, formatos e densidades. O algoritmo proposto é comparado com métodos existentes na literatura, apresentando resultados superiores, levando ao entendimento de que o algoritmo é promissor.
Abstract: he process of grouping data is known as clustering. In the literature, the clustering process, or grouping, has two variations: (i) if the number of clusters is predefined, this process is known as the Clustering Problem (CP) or k -Clustering Problem , and (ii) when the number of clusters is not defined, the process becomes known as Automatic Clustering Problem (ACP). The importance of having well-grouped data is crucial to making more assertive decisions. The data grouping technique has applicability in the most diverse areas of knowledge, such as: engineering, administration, economics, biology, physics, among others. Genetic algorithms are based on Darwinian evolution processes, selecting the best solutions within a population. The BRKGA (Bised Random Key Genetic Algorithm), is presented as a variation of the genetic algorithms, in which the solutions of a problem are represented as vectors of real keys, generated randomly, in the continuous interval of [0.1). The suitability of a viable solution is determined by the decoder that maps this vector to a real value. This work proposes a multi-population BRKGA to identify the ideal number of clusters, according to the silhouette index — a measure of clustering efficiency widely used in the literature. In the proposed algorithm, the solution space is partitioned so that each subpopulation the algorithm represents solutions with a k number of cluster. Thus, for each subpopulation, an independent BRKGA is applied. Computational experiments were carried out in fifty-five instances of the literature.The instances used in this work have dimensions ranging from 30 to 2,000 objects and 2 to 13 attributes, with different degrees of difficulty and characteristics, for example, group cohesion, separation, shapes and densities.The proposed algorithm is compared with existing methods in the literature, presenting superior results, leading to the understanding that the algorithm is promising.
Palavras-chave: Clusterização
Biased Random Key Genetic Algorithm
Algoritmos genéticos
Genetic algorithm
Multi-population
BRKGA
Clustering
CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Idioma: por
País: Brasil
Editor: Universidade Federal de Alagoas
Sigla da Instituição: UFAL
metadata.dc.publisher.program: Programa de Pós-Graduação em Informática
Citação: LIMA, Alexandre Sérgio Dantas de. Algoritmo BRKGA multipopulacional (MultiPop-BRKGA-PCA) para o problema de clusterização automática. 2023. 61 f. Dissertação (Mestrado em Informática) – Programa de Pós-Graduação em Informática, Instituto de Computação, Universidade Federal de Alagoas, Maceió, 2021.
Tipo de Acesso: Acesso Aberto
URI: http://www.repositorio.ufal.br/jspui/handle/123456789/10760
Data do documento: 30-abr-2021
Aparece nas coleções:Dissertações e Teses defendidas na UFAL - IC

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Algoritmo BRKGA multipopulacional (MultiPop-BRKGA-PCA) para o problema de clusterização automática.pdf2.42 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.