Use este identificador para citar ou linkar para este item:
http://www.repositorio.ufal.br/jspui/handle/123456789/10217
Tipo: | Trabalho de Conclusão de Curso |
Título: | Modelagem assíncrona do Page Rank |
Autor(es): | Santos, Matheus Inacio Batista |
Primeiro Orientador: | Aquino, Andre Luiz Lins de |
metadata.dc.contributor.referee1: | Pereira, Leonardo Viana |
metadata.dc.contributor.referee2: | Ramos, Geymerson dos Santos |
Resumo: | Neste trabalho, apresentamos uma solução distribuída exata para o problema de classificação dos vértices mais populares de um grafo. Nos últimos anos, a quantidade de links WWW tem se tornado cada vez maior, então algoritmos sequenciais ou apenas paralelos não são mais viáveis, pois são executados em apenas uma máquina. Neste artigo, redesenhamos o algoritmo PageRank, proposto pelos fundadores do Google, para que funcione de forma eficiente em clusters de máquinas. Trazendo uma proposta inovadora em relação a literatura com a modelagem assíncrona. A solução usa o middleware Java Cá & Lá (JCL) e foi testada em um dos líderes do setor - o Apache GraphX. Os resultados usando instâncias aleatórias e reais demonstraram que nossa solução, chamada JCL PageRank, foi 10x mais rápida que o GraphX. Realizamos experimentos com máquinas de poder computacional diferentes, desde as configurações mais simples à configurações mais robustaz de clusters diferentes e os resultados de tempo de execução foram semelhantes. Ambas as soluções JCL e GraphX calculam os valores PageRank para todos os vértices de um grafo, portanto, sem aproximações. O cálculo personalizado PageRank também é executado pelas soluções GraphX e JCL PageRank. |
Abstract: | In this work, we present an exact distributed solution for the problem of ranking the most popular vertices of a graph. In recent years, the amount of WWW links has become increasing, so sequential or just parallel algorithms are no longer feasible as they run on just one machine. In this work, we redesign the PageRank algorithm, proposed by Google’s founders, so that it runs efficiently under machine clusters. Bringing an innovative proposal in relation to the literature with asynchronous modeling. The solution uses the Java Cá & Lá (JCL) middleware and it has been tested against one of the industry leaders-the Apache GraphX. The results using synthetic and real instances demonstrated that our solution, named JCL PageRank, was 10x faster than GraphX. We have performed experiments with small and big machines in two different cluster configurations and the runtime results were similar. Both JCL and GraphX solutions calculate the PageRank values for all vertices of a graph, thus without approximations. Personalized PageRank calculus is also performed by both GraphX and JCL PageRank solutions. |
Palavras-chave: | Pagerank (Algoritmo) Sistemas distribuídos Assíncrona Distributed systems asynchronous |
CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
Idioma: | por |
País: | Brasil |
Editor: | Universidade Federal de Alagoas |
Sigla da Instituição: | UFAL |
metadata.dc.publisher.department: | Curso de Ciências da Computação |
Citação: | SANTOS, Matheus Inacio Batista. Modelagem assíncrona do Page Rank. 2023. 22 f. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Instituto de Computação, Curso de Computação, Universidade Federal de Alagoas, Maceió, 2021. |
Tipo de Acesso: | Acesso Aberto |
URI: | http://www.repositorio.ufal.br/jspui/handle/123456789/10217 |
Data do documento: | 23-ago-2021 |
Aparece nas coleções: | Trabalhos de Conclusão de Curso (TCC) - Bacharelado - CIÊNCIA DA COMPUTAÇÃO- IC |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
Modelagem assíncrona do Page Rank.pdf | 2.39 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.