00 CAMPUS ARISTÓTELES CALAZANS SIMÕES (CAMPUS A. C. SIMÕES) IC - INSTITUTO DE COMPUTAÇÃO TRABALHOS DE CONCLUSÃO DE CURSO (TCC) - GRADUAÇÃO - IC Trabalhos de Conclusão de Curso (TCC) - Bacharelado - ENGENHARIA DE COMPUTAÇÃO- IC
Use este identificador para citar ou linkar para este item: http://www.repositorio.ufal.br/jspui/handle/123456789/16185
Registro completo de metadados
Campo DCValorIdioma
dc.contributor.advisor1Vieira, Thales Miranda de Almeida-
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/8181104476035846pt_BR
dc.contributor.referee1Oliveira, Marcelo Costa-
dc.contributor.referee2Barbosa, Adriano Oliveira-
dc.creatorCosta, Yuri Dimitri Ramos-
dc.creator.Latteshttp://lattes.cnpq.br/6955991842118370pt_BR
dc.date.accessioned2025-05-12T14:10:37Z-
dc.date.available2025-05-08-
dc.date.available2025-05-12T14:10:37Z-
dc.date.issued2024-10-23-
dc.identifier.citationCOSTA, Yuri Dimitri Ramos. Reconhecimento e análise de entidades nomeadas em textos não-estruturados usando LLMs e redes complexas. 2025. 61 f. Trabalho de Conclusão de Curso (Bacharelado em Engenharia da Computação) – Instituto de Computação, Universidade Federal de Alagoas, Maceió, 2024.pt_BR
dc.identifier.urihttp://www.repositorio.ufal.br/jspui/handle/123456789/16185-
dc.description.abstractThe availability of textual data on the internet has been growing exponentially. While access to information was a major challenge in the past, today, the vast amount of available content requires increasingly sophisticated methods to automate information extraction. Whether through books, articles, emails, or social media posts, the information available in these media can contribute to generating innovative ideas, better understanding the target audience in advertising campaigns, and advancing science through literature reviews. In this way, textual data has proven to be valuable in an increasingly connected world. Named entity recognition (NER) allows identifying words in a text that refer to a common theme. Structuring the named entities in a relation graph provides a framework capable of representing the context of the dataset, enabling the identification of patterns. With the recent advances in generative models, such as Large Language Models (LLM), this study evaluated the performance of this type of model in named entity recognition, discussing the advantages and disadvantages through a quantitative analysis of the task performed, comparing ChatGPT with models like BERT and BiLSTM. Additionally, a qualitative analysis seeks to evaluate the capabilities of the BERT and ChatGPT models in generating relation graphs between named entities, as well as proposing exploration techniques for this type of complex network. Thus, the aim of this study was to present a methodology for generating representations in complex networks of textual data. The presented methodology allows two approaches: the use of LLM models, such as ChatGPT, through prompt engineering, requiring a minimal number of examples, and the training or fine-tuning of state-of-the-art models, such as BERT.pt_BR
dc.languageporpt_BR
dc.publisherUniversidade Federal de Alagoaspt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentCurso de Engenharia da Computação - Bachareladopt_BR
dc.publisher.initialsUFALpt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectProcessamento de linguagem natural (Computação)pt_BR
dc.subjectRedes complexaspt_BR
dc.subjectTransformerspt_BR
dc.subjectNatural language processingpt_BR
dc.subjectComplex networkspt_BR
dc.subjectTransformer modelspt_BR
dc.subject.cnpqCNPQ::ENGENHARIASpt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOpt_BR
dc.titleReconhecimento e análise de entidades nomeadas em textos não-estruturados usando LLMs e redes complexaspt_BR
dc.typeTrabalho de Conclusão de Cursopt_BR
dc.description.resumoA disponibilidade de dados textuais na internet vem crescendo exponencialmente. Se o acesso à informação já foi um grande desafio em outros momentos, hoje, o grande volume de conteúdo disponível exige a utilização de métodos cada vez mais sofisticados para automatizar a extração de informações. Seja por meio de livros, artigos, e-mails ou postagens em redes sociais, as informações disponíveis nesses meios podem contribuir para a geração de ideias inovadoras, a melhor compreensão do público alvo em campanhas publicitárias e o avanço da ciência por meio de revisões de literatura. Dessa forma, os dados textuais tem se mostrado valiosos em um mundo cada vez mais conectado. O reconhecimento de entidades nomeadas (NER) permite identificar palavras de um texto que se referem a um tema em comum. A estruturação das entidades nomeadas em um grafo de relações fornece uma estrutura capaz de representar o contexto do conjunto de dados, permitindo a identificação de padrões. Com os recentes avanços dos modelos generativos Large Language Models (LLM), o presente trabalho avaliou o desempenho desse tipo de modelo no reconhecimento de entidades nomeadas, discutindo acerca de vantagens e desvantagens por meio de uma análise quantitativa da tarefa realizada, comparando o ChatGPT com modelos como BERT e BILSTM. Além disso, uma análise qualitativa busca avaliar as capacidades dos modelos BERT e ChatGPT na geração de grafos de relações entre entidades nomeadas, além de propor técnicas de exploração para esse tipo de rede complexa. Desta forma, buscou-se neste estudo apresentar uma metodologia para a geração de representações em redes complexas de dados textuais. A metodologia apresentada permite duas abordagens: a utilização de modelos LLM, como o ChatGPT, por meio da engenharia de prompt, necessitando uma quantidade mínima de exemplos, e o treinamento ou refino de modelos estado da arte, como o BERT.pt_BR
Aparece nas coleções:Trabalhos de Conclusão de Curso (TCC) - Bacharelado - ENGENHARIA DE COMPUTAÇÃO- IC

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Reconhecimento e análise de entidades nomeadas em textos não-estruturados usando LLMs e redes complexas.pdfReconhecimento e análise de entidades nomeadas em textos não-estruturados usando LLMs e redes complexas1.9 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.