Use este identificador para citar ou linkar para este item:
http://www.repositorio.ufal.br/jspui/handle/123456789/16185
Registro completo de metadados
Campo DC | Valor | Idioma |
---|---|---|
dc.contributor.advisor1 | Vieira, Thales Miranda de Almeida | - |
dc.contributor.advisor1Lattes | http://lattes.cnpq.br/8181104476035846 | pt_BR |
dc.contributor.referee1 | Oliveira, Marcelo Costa | - |
dc.contributor.referee2 | Barbosa, Adriano Oliveira | - |
dc.creator | Costa, Yuri Dimitri Ramos | - |
dc.creator.Lattes | http://lattes.cnpq.br/6955991842118370 | pt_BR |
dc.date.accessioned | 2025-05-12T14:10:37Z | - |
dc.date.available | 2025-05-08 | - |
dc.date.available | 2025-05-12T14:10:37Z | - |
dc.date.issued | 2024-10-23 | - |
dc.identifier.citation | COSTA, Yuri Dimitri Ramos. Reconhecimento e análise de entidades nomeadas em textos não-estruturados usando LLMs e redes complexas. 2025. 61 f. Trabalho de Conclusão de Curso (Bacharelado em Engenharia da Computação) – Instituto de Computação, Universidade Federal de Alagoas, Maceió, 2024. | pt_BR |
dc.identifier.uri | http://www.repositorio.ufal.br/jspui/handle/123456789/16185 | - |
dc.description.abstract | The availability of textual data on the internet has been growing exponentially. While access to information was a major challenge in the past, today, the vast amount of available content requires increasingly sophisticated methods to automate information extraction. Whether through books, articles, emails, or social media posts, the information available in these media can contribute to generating innovative ideas, better understanding the target audience in advertising campaigns, and advancing science through literature reviews. In this way, textual data has proven to be valuable in an increasingly connected world. Named entity recognition (NER) allows identifying words in a text that refer to a common theme. Structuring the named entities in a relation graph provides a framework capable of representing the context of the dataset, enabling the identification of patterns. With the recent advances in generative models, such as Large Language Models (LLM), this study evaluated the performance of this type of model in named entity recognition, discussing the advantages and disadvantages through a quantitative analysis of the task performed, comparing ChatGPT with models like BERT and BiLSTM. Additionally, a qualitative analysis seeks to evaluate the capabilities of the BERT and ChatGPT models in generating relation graphs between named entities, as well as proposing exploration techniques for this type of complex network. Thus, the aim of this study was to present a methodology for generating representations in complex networks of textual data. The presented methodology allows two approaches: the use of LLM models, such as ChatGPT, through prompt engineering, requiring a minimal number of examples, and the training or fine-tuning of state-of-the-art models, such as BERT. | pt_BR |
dc.language | por | pt_BR |
dc.publisher | Universidade Federal de Alagoas | pt_BR |
dc.publisher.country | Brasil | pt_BR |
dc.publisher.department | Curso de Engenharia da Computação - Bacharelado | pt_BR |
dc.publisher.initials | UFAL | pt_BR |
dc.rights | Acesso Aberto | pt_BR |
dc.subject | Processamento de linguagem natural (Computação) | pt_BR |
dc.subject | Redes complexas | pt_BR |
dc.subject | Transformers | pt_BR |
dc.subject | Natural language processing | pt_BR |
dc.subject | Complex networks | pt_BR |
dc.subject | Transformer models | pt_BR |
dc.subject.cnpq | CNPQ::ENGENHARIAS | pt_BR |
dc.subject.cnpq | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO | pt_BR |
dc.title | Reconhecimento e análise de entidades nomeadas em textos não-estruturados usando LLMs e redes complexas | pt_BR |
dc.type | Trabalho de Conclusão de Curso | pt_BR |
dc.description.resumo | A disponibilidade de dados textuais na internet vem crescendo exponencialmente. Se o acesso à informação já foi um grande desafio em outros momentos, hoje, o grande volume de conteúdo disponível exige a utilização de métodos cada vez mais sofisticados para automatizar a extração de informações. Seja por meio de livros, artigos, e-mails ou postagens em redes sociais, as informações disponíveis nesses meios podem contribuir para a geração de ideias inovadoras, a melhor compreensão do público alvo em campanhas publicitárias e o avanço da ciência por meio de revisões de literatura. Dessa forma, os dados textuais tem se mostrado valiosos em um mundo cada vez mais conectado. O reconhecimento de entidades nomeadas (NER) permite identificar palavras de um texto que se referem a um tema em comum. A estruturação das entidades nomeadas em um grafo de relações fornece uma estrutura capaz de representar o contexto do conjunto de dados, permitindo a identificação de padrões. Com os recentes avanços dos modelos generativos Large Language Models (LLM), o presente trabalho avaliou o desempenho desse tipo de modelo no reconhecimento de entidades nomeadas, discutindo acerca de vantagens e desvantagens por meio de uma análise quantitativa da tarefa realizada, comparando o ChatGPT com modelos como BERT e BILSTM. Além disso, uma análise qualitativa busca avaliar as capacidades dos modelos BERT e ChatGPT na geração de grafos de relações entre entidades nomeadas, além de propor técnicas de exploração para esse tipo de rede complexa. Desta forma, buscou-se neste estudo apresentar uma metodologia para a geração de representações em redes complexas de dados textuais. A metodologia apresentada permite duas abordagens: a utilização de modelos LLM, como o ChatGPT, por meio da engenharia de prompt, necessitando uma quantidade mínima de exemplos, e o treinamento ou refino de modelos estado da arte, como o BERT. | pt_BR |
Aparece nas coleções: | Trabalhos de Conclusão de Curso (TCC) - Bacharelado - ENGENHARIA DE COMPUTAÇÃO- IC |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
Reconhecimento e análise de entidades nomeadas em textos não-estruturados usando LLMs e redes complexas.pdf | Reconhecimento e análise de entidades nomeadas em textos não-estruturados usando LLMs e redes complexas | 1.9 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.