Reconhecimento e análise de entidades nomeadas em textos não-estruturados usando LLMs e redes complexas

Costa, Yuri Dimitri Ramos

E-mail: ri@sibi.ufal.br - Horário: 8h às 17h - Fone: 3214-1660

ATENÇÃO

1) As PRODUÇÕES ACADÊMICAS devem ser encaminhadas para o e-mail ri@sibi.ufal.br, juntamente com o Termo de Autorização para a Publicação (assinado).
2) Devem estar inseridas no CORPO da produção acadêmica, os seguintes documentos:
FICHA CATALOGRÁFICA - elaborada por um bibliotecário.
FOLHA DE APROVAÇÃO - deve estar assinada por todos ou, pelo menos, dois membros da banca examinadora. Excepcionalmente, poderá ser assinada por um
membro da banca examinadora e pelo respectivo Coordenador do Curso de Graduação ou Programa de Pós-Graduação.
3) O TERMO DE AUTORIZAÇÃO PARA PUBLICAÇÃO deverá estar preenchido, de acordo com o tipo de produção, assinado pelo(a) autor(a) e enviado por e-mail,
juntamente com o trabalho acadêmico.
OBS 1.: os TCC dos CURSOS DE PEDAGOGIA (Presencial e EaD) do Centro de Educação (CEDU) devem ser enviados, exclusivamente, para os e-mails
coordpedufal@gmail.com e pedagogiauab@gmail.com.
OBS 2.: o tempo de resposta às solicitações enviadas ao RIUFAL é de quatro dias úteis.
OBS 3.: para mais informações sobre o RIUFAL, acesse www.sibi.ufal.br.

00 CAMPUS ARISTÓTELES CALAZANS SIMÕES (CAMPUS A. C. SIMÕES) IC - INSTITUTO DE COMPUTAÇÃO TRABALHOS DE CONCLUSÃO DE CURSO (TCC) - GRADUAÇÃO - IC Trabalhos de Conclusão de Curso (TCC) - Bacharelado - ENGENHARIA DE COMPUTAÇÃO- IC

Use este identificador para citar ou linkar para este item: https://www.repositorio.ufal.br/handle/123456789/16185

Registro completo de metadados

Campo DC	Valor	Idioma
dc.contributor.advisor1	Vieira, Thales Miranda de Almeida	-
dc.contributor.advisor1Lattes	http://lattes.cnpq.br/8181104476035846	pt_BR
dc.contributor.referee1	Oliveira, Marcelo Costa	-
dc.contributor.referee2	Barbosa, Adriano Oliveira	-
dc.creator	Costa, Yuri Dimitri Ramos	-
dc.creator.Lattes	http://lattes.cnpq.br/6955991842118370	pt_BR
dc.date.accessioned	2025-05-12T14:10:37Z	-
dc.date.available	2025-05-08	-
dc.date.available	2025-05-12T14:10:37Z	-
dc.date.issued	2024-10-23	-
dc.identifier.citation	COSTA, Yuri Dimitri Ramos. Reconhecimento e análise de entidades nomeadas em textos não-estruturados usando LLMs e redes complexas. 2025. 61 f. Trabalho de Conclusão de Curso (Bacharelado em Engenharia da Computação) – Instituto de Computação, Universidade Federal de Alagoas, Maceió, 2024.	pt_BR
dc.identifier.uri	http://www.repositorio.ufal.br/jspui/handle/123456789/16185	-
dc.description.abstract	The availability of textual data on the internet has been growing exponentially. While access to information was a major challenge in the past, today, the vast amount of available content requires increasingly sophisticated methods to automate information extraction. Whether through books, articles, emails, or social media posts, the information available in these media can contribute to generating innovative ideas, better understanding the target audience in advertising campaigns, and advancing science through literature reviews. In this way, textual data has proven to be valuable in an increasingly connected world. Named entity recognition (NER) allows identifying words in a text that refer to a common theme. Structuring the named entities in a relation graph provides a framework capable of representing the context of the dataset, enabling the identification of patterns. With the recent advances in generative models, such as Large Language Models (LLM), this study evaluated the performance of this type of model in named entity recognition, discussing the advantages and disadvantages through a quantitative analysis of the task performed, comparing ChatGPT with models like BERT and BiLSTM. Additionally, a qualitative analysis seeks to evaluate the capabilities of the BERT and ChatGPT models in generating relation graphs between named entities, as well as proposing exploration techniques for this type of complex network. Thus, the aim of this study was to present a methodology for generating representations in complex networks of textual data. The presented methodology allows two approaches: the use of LLM models, such as ChatGPT, through prompt engineering, requiring a minimal number of examples, and the training or fine-tuning of state-of-the-art models, such as BERT.	pt_BR
dc.language	por	pt_BR
dc.publisher	Universidade Federal de Alagoas	pt_BR
dc.publisher.country	Brasil	pt_BR
dc.publisher.department	Curso de Engenharia da Computação - Bacharelado	pt_BR
dc.publisher.initials	UFAL	pt_BR
dc.rights	Acesso Aberto	pt_BR
dc.subject	Processamento de linguagem natural (Computação)	pt_BR
dc.subject	Redes complexas	pt_BR
dc.subject	Transformers	pt_BR
dc.subject	Natural language processing	pt_BR
dc.subject	Complex networks	pt_BR
dc.subject	Transformer models	pt_BR
dc.subject.cnpq	CNPQ::ENGENHARIAS	pt_BR
dc.subject.cnpq	CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO	pt_BR
dc.title	Reconhecimento e análise de entidades nomeadas em textos não-estruturados usando LLMs e redes complexas	pt_BR
dc.type	Trabalho de Conclusão de Curso	pt_BR
dc.description.resumo	A disponibilidade de dados textuais na internet vem crescendo exponencialmente. Se o acesso à informação já foi um grande desafio em outros momentos, hoje, o grande volume de conteúdo disponível exige a utilização de métodos cada vez mais sofisticados para automatizar a extração de informações. Seja por meio de livros, artigos, e-mails ou postagens em redes sociais, as informações disponíveis nesses meios podem contribuir para a geração de ideias inovadoras, a melhor compreensão do público alvo em campanhas publicitárias e o avanço da ciência por meio de revisões de literatura. Dessa forma, os dados textuais tem se mostrado valiosos em um mundo cada vez mais conectado. O reconhecimento de entidades nomeadas (NER) permite identificar palavras de um texto que se referem a um tema em comum. A estruturação das entidades nomeadas em um grafo de relações fornece uma estrutura capaz de representar o contexto do conjunto de dados, permitindo a identificação de padrões. Com os recentes avanços dos modelos generativos Large Language Models (LLM), o presente trabalho avaliou o desempenho desse tipo de modelo no reconhecimento de entidades nomeadas, discutindo acerca de vantagens e desvantagens por meio de uma análise quantitativa da tarefa realizada, comparando o ChatGPT com modelos como BERT e BILSTM. Além disso, uma análise qualitativa busca avaliar as capacidades dos modelos BERT e ChatGPT na geração de grafos de relações entre entidades nomeadas, além de propor técnicas de exploração para esse tipo de rede complexa. Desta forma, buscou-se neste estudo apresentar uma metodologia para a geração de representações em redes complexas de dados textuais. A metodologia apresentada permite duas abordagens: a utilização de modelos LLM, como o ChatGPT, por meio da engenharia de prompt, necessitando uma quantidade mínima de exemplos, e o treinamento ou refino de modelos estado da arte, como o BERT.	pt_BR
Aparece nas coleções:	Trabalhos de Conclusão de Curso (TCC) - Bacharelado - ENGENHARIA DE COMPUTAÇÃO- IC

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
Reconhecimento e análise de entidades nomeadas em textos não-estruturados usando LLMs e redes complexas.pdf	Reconhecimento e análise de entidades nomeadas em textos não-estruturados usando LLMs e redes complexas	1.9 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro simples do item Visualizar estatísticas