00 CAMPUS ARISTÓTELES CALAZANS SIMÕES (CAMPUS A. C. SIMÕES) IC - INSTITUTO DE COMPUTAÇÃO TRABALHOS DE CONCLUSÃO DE CURSO (TCC) - GRADUAÇÃO - IC Trabalhos de Conclusão de Curso (TCC) - Bacharelado - ENGENHARIA DE COMPUTAÇÃO- IC
Use este identificador para citar ou linkar para este item: http://www.repositorio.ufal.br/jspui/handle/123456789/16418
Tipo: Trabalho de Conclusão de Curso
Título: Solução integrada de engenharia de dados para gestão e análise, utilizando uma abordagem open source e de baixo custo
Autor(es): Rocha Filho, Aldemir Melo
Primeiro Orientador: Barboza, Erick de Andrade
metadata.dc.contributor.referee1: Souza, Jairo Raphael Moreira Correia de
metadata.dc.contributor.referee2: Santos Neto, Baldoino Fonseca dos
Resumo: A crescente geração de dados, impulsionada pela transformação digital e pela disseminação de tecnologias como a Internet das Coisas, exige soluções inovadoras e acessíveis para a gestão eficiente das informações. A democratização do acesso à análise de dados, por meio da adoção de tecnologias open source e de baixo custo, permite que organizações de todos os portes e setores extraiam informações valiosas para otimizar processos, tomar decisões mais assertivas e impulsionar o crescimento dos negócios. Ao combinar a escalabilidade e flexibilidade das soluções open source com a acessibilidade e o custo reduzido, essa abordagem possibilita que um número maior de negócios aproveite o potencial dos seus dados, impulsionando a inovação e a competitividade. Este trabalho apresenta a implementação de um ambiente de gestão de dados baseado em ferramentas de código aberto, visando criar uma solução eficiente e de baixo custo para a construção de um lakehouse. O estudo aborda a crescente necessidade de gerenciar grandes volumes de dados, propondo um ecossistema acessível para organizações de diversos setores, integrando as funcionalidades de um Data Lake e um Data Warehouse para permitir a coleta, organização e análise de dados de forma estruturada. Durante o desenvolvimento, um dos desafios foi integrar as diversas ferramentas open source, garantindo compatibilidade e segurança no processo de gerenciamento de dados. A abordagem modular adotada facilitou a configuração e automação das etapas, assegurando a integridade dos dados e otimizando o desempenho geral do ambiente, consolidando-se como uma solução eficaz para o armazenamento e processamento de grandes volumes de dados. Os resultados demonstram a viabilidade técnica e econômica do ambiente, o qual foi aplicado ao Sistema Eletrônico de Informações (SEI) como estudo de caso em questão. O ambiente permitiu a criação de uma infraestrutura confiável para a organização, armazenamento e processamento eficiente de dados, oferecendo uma base otimizada para suportar análises detalhadas e melhorar a gestão de informações. A comparação com o Azure Synapse, uma solução amplamente utilizada no mercado para gerenciamento de dados, evidenciou não apenas a economia significativa, mas também a capacidade do ambiente open source de oferecer uma solução robusta sem exigir altos investimentos, tornando-se uma alternativa viável para instituições com recursos limitados.
Abstract: The increasing generation of data, driven by digital transformation and the spread of technologies like the Internet of Things, demands innovative and accessible solutions for efficient information management. The democratization of data analysis through the adoption of open source and low-cost technologies enables organizations of all sizes and sectors to extract valuable insights to optimize processes, make more accurate decisions, and drive business growth. By combining the scalability and flexibility of open-source solutions with accessibility and reduced costs, this approach allows a greater number of businesses to harness the potential of their data, fostering innovation and competitiveness. This work presents the implementation of a data management environment based on open-source tools, aiming to create an efficient and low-cost solution for building a lakehouse. The study addresses the growing need to manage large volumes of data, proposing an accessible ecosystem for organizations in various sectors, integrating the functionalities of both a Data Lake and a Data Warehouse to enable the collection, organization, and analysis of data in a structured manner. During the development, one of the challenges was integrating the various open-source tools, ensuring compatibility and security in the data management process. The modular approach adopted facilitated the configuration and automation of the stages, ensuring data integrity and optimizing the overall performance of the environment, consolidating itself as an effective solution for storing and processing large volumes of data. The results demonstrate the technical and economic feasibility of the environment, which was applied to the Electronic Information System (SEI) as a case study. The environment enabled the creation of a reliable infrastructure for the organization, storage, and efficient processing of data, providing an optimized foundation to support detailed analyses and improve information management. The comparison with Azure Synapse, a widely used solution in the market for data management, highlighted not only significant cost savings but also the ability of the open-source environment to offer a robust solution without requiring large investments, making it a viable alternative for institutions with limited resources.
Palavras-chave: Gestão de dados
Código aberto
Democratização da informação
Armazenamento de dados
Processamento de dados
Análise de dados
Data management
Open source
Democratization of information
Data storage
Data processing
Data analysis
Data Warehouse
CNPq: CNPQ::ENGENHARIAS
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Idioma: por
País: Brasil
Editor: Universidade Federal de Alagoas
Sigla da Instituição: UFAL
metadata.dc.publisher.department: Curso de Engenharia da Computação - Bacharelado
Citação: ROCHA FILHO, Aldemir Melo. Solução integrada de engenharia de dados para gestão e análise, utilizando uma abordagem open source e de baixo custo. 2025. 42 f. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Computação) - Instituto de Computação, Universidade Federal de Alagoas, Maceió, 2024.
Tipo de Acesso: Acesso Aberto
URI: http://www.repositorio.ufal.br/jspui/handle/123456789/16418
Data do documento: 25-nov-2024
Aparece nas coleções:Trabalhos de Conclusão de Curso (TCC) - Bacharelado - ENGENHARIA DE COMPUTAÇÃO- IC

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Solução integrada de engenharia de dados para gestão e análise, utilizando uma abordagem open source e de baixo custo.pdfSolução integrada de engenharia de dados para gestão e análise, utilizando uma abordagem open source e de baixo custo3.9 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.