00 CAMPUS ARISTÓTELES CALAZANS SIMÕES (CAMPUS A. C. SIMÕES) IC - INSTITUTO DE COMPUTAÇÃO TRABALHOS DE CONCLUSÃO DE CURSO (TCC) - GRADUAÇÃO - IC Trabalhos de Conclusão de Curso (TCC) - Bacharelado - CIÊNCIA DA COMPUTAÇÃO- IC
Use este identificador para citar ou linkar para este item: http://www.repositorio.ufal.br/jspui/handle/123456789/10217
Tipo: Trabalho de Conclusão de Curso
Título: Modelagem assíncrona do Page Rank
Autor(es): Santos, Matheus Inacio Batista
Primeiro Orientador: Aquino, Andre Luiz Lins de
metadata.dc.contributor.referee1: Pereira, Leonardo Viana
metadata.dc.contributor.referee2: Ramos, Geymerson dos Santos
Resumo: Neste trabalho, apresentamos uma solução distribuída exata para o problema de classificação dos vértices mais populares de um grafo. Nos últimos anos, a quantidade de links WWW tem se tornado cada vez maior, então algoritmos sequenciais ou apenas paralelos não são mais viáveis, pois são executados em apenas uma máquina. Neste artigo, redesenhamos o algoritmo PageRank, proposto pelos fundadores do Google, para que funcione de forma eficiente em clusters de máquinas. Trazendo uma proposta inovadora em relação a literatura com a modelagem assíncrona. A solução usa o middleware Java Cá & Lá (JCL) e foi testada em um dos líderes do setor - o Apache GraphX. Os resultados usando instâncias aleatórias e reais demonstraram que nossa solução, chamada JCL PageRank, foi 10x mais rápida que o GraphX. Realizamos experimentos com máquinas de poder computacional diferentes, desde as configurações mais simples à configurações mais robustaz de clusters diferentes e os resultados de tempo de execução foram semelhantes. Ambas as soluções JCL e GraphX calculam os valores PageRank para todos os vértices de um grafo, portanto, sem aproximações. O cálculo personalizado PageRank também é executado pelas soluções GraphX e JCL PageRank.
Abstract: In this work, we present an exact distributed solution for the problem of ranking the most popular vertices of a graph. In recent years, the amount of WWW links has become increasing, so sequential or just parallel algorithms are no longer feasible as they run on just one machine. In this work, we redesign the PageRank algorithm, proposed by Google’s founders, so that it runs efficiently under machine clusters. Bringing an innovative proposal in relation to the literature with asynchronous modeling. The solution uses the Java Cá & Lá (JCL) middleware and it has been tested against one of the industry leaders-the Apache GraphX. The results using synthetic and real instances demonstrated that our solution, named JCL PageRank, was 10x faster than GraphX. We have performed experiments with small and big machines in two different cluster configurations and the runtime results were similar. Both JCL and GraphX solutions calculate the PageRank values for all vertices of a graph, thus without approximations. Personalized PageRank calculus is also performed by both GraphX and JCL PageRank solutions.
Palavras-chave: Pagerank (Algoritmo)
Sistemas distribuídos
Assíncrona
Distributed systems
asynchronous
CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Idioma: por
País: Brasil
Editor: Universidade Federal de Alagoas
Sigla da Instituição: UFAL
metadata.dc.publisher.department: Curso de Ciências da Computação
Citação: SANTOS, Matheus Inacio Batista. Modelagem assíncrona do Page Rank. 2023. 22 f. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Instituto de Computação, Curso de Computação, Universidade Federal de Alagoas, Maceió, 2021.
Tipo de Acesso: Acesso Aberto
URI: http://www.repositorio.ufal.br/jspui/handle/123456789/10217
Data do documento: 23-ago-2021
Aparece nas coleções:Trabalhos de Conclusão de Curso (TCC) - Bacharelado - CIÊNCIA DA COMPUTAÇÃO- IC

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Modelagem assíncrona do Page Rank.pdf2.39 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.