00 CAMPUS ARISTÓTELES CALAZANS SIMÕES (CAMPUS A. C. SIMÕES) IC - INSTITUTO DE COMPUTAÇÃO Dissertações e Teses defendidas na UFAL - IC
Use este identificador para citar ou linkar para este item: http://www.repositorio.ufal.br/jspui/handle/riufal/1844
Tipo: Dissertação
Título: Alinhamento de dados conectados a partir de conceitos primários e secundários
Título(s) alternativo(s): Instance matching from primary and secondary concepts
Autor(es): Barbosa Sobrinho, Armando
Primeiro Orientador: Pinto, Ig Bert Bittencourt Santana
metadata.dc.contributor.advisor-co1: Siqueira, Sean Wolfgand Matsui
metadata.dc.contributor.referee1: Silva, Rafael Amorim da
metadata.dc.contributor.referee2: Nunes, Bernardo Pereira
Resumo: Nos últimos anos, dados conectados têm sido a forma mais proeminente para abertura de dados em diversos países. Tal forma utiliza padrões para descrição destes dados, promovendo a sua interoperabilidade, seu reuso e a sua integração. No entanto, integrar a informação entre diferentes conjuntos de dados surge como um empecilho para o seu desenvolvimento, principalmente se tal integração consistir na correspondência de uma determinada entidade do mundo real em conjuntos de dados distintos. Neste contexto, este trabalho propõe uma abordagem para auxiliar na identificação de instâncias correspondentes. Para isso, baseia-se na modelagem conceitual dos dados, permitindo que os relacionamentos entre os conceitos sejam utilizados para descobrir novas correspondências entre os dados. Para avaliar a eficácia da proposta foram realizados um estudo de caso e um experimento. No estudo de caso, a proposta foi utilizada para encontrar as correspondências de pesquisadores e publicações em quatro datasets (Lattes, RBIE, SBIE e WIE) e, então, responder um conjunto com mais de trinta perguntas realizadas pela comunidade de Informática na Educação. No experimento, a proposta foi utilizada em dois cenários (C1 e C2) e comparada a outras abordagens através das métricas de precisão, revocação e medida-f. De acordo com os resultados apresentados, a proposta posicionou-se em primeiro e segundo lugar nos cenários C1 e C2 respectivamente, mesmo não utilizando computações específicas para os datasets, permitindo sua utilização em outros contextos com o mínimo de esforço.
Abstract: Recently linked data has been the most prominent way to open data in several countries. This way it uses standards to describe this data, promoting its interoperability, its reuse and its integration. However, integrating information between different datasets is a hindrance to their development, especially if such integration consists of matching a particular real-world entity in distinct datasets. In this context, this work proposes an approach to assist in the identification of corresponding instances. For this, it is based on the conceptual modeling of the data, allowing the relationships between the concepts to be used to discover new correspondences between the data. To evaluate the effectiveness of the proposal, a case study and an experiment were carried out. In the case study, the proposal was used to find the correspondence of researchers and publications in four datasets (Lattes, RBIE, SBIE and WIE). These correspondences was used to answer a set with more than thirty questions provided by the informatics community in Education. In the experiment, the proposal was used in two scenarios (C1 and C2) and compared to other approaches through precision, recall and f-measure metrics. According to the presented results, the proposal ranked first and second place in scenarios C1 and C2 respectively, even though it did not use specific computations for the datasets, allowing its use in other contexts with the least effort.
Palavras-chave: Correspondência de instância
Alinhamento de dados
Datasets
Dados conectados
Web de dados
Instance matching
Data correspondence
Linked data
Web of data
CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Idioma: por
País: Brasil
Editor: Universidade Federal de Alagoas
Sigla da Instituição: UFAL
metadata.dc.publisher.program: Programa de Pós-Graduação em Informática
Citação: BARBOSA SOBRINHO, Armando. Alinhamento de dados conectados a partir de conceitos primários e secundários. 2017. 62 f. Dissertação (Mestrado em Informática) - Instituto de Computação, Programa de Pós-Graduação em Informática, Universidade Federal de Alagoas, Maceió, 2017.
Tipo de Acesso: Acesso Aberto
URI: http://www.repositorio.ufal.br/handle/riufal/1844
Data do documento: 1-fev-2017
Aparece nas coleções:Dissertações e Teses defendidas na UFAL - IC

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Alinhamento de dados conectados a partir de conceitos primários e secundários.pdf2.18 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.