00 CAMPUS ARISTÓTELES CALAZANS SIMÕES (CAMPUS A. C. SIMÕES) IC - INSTITUTO DE COMPUTAÇÃO TRABALHOS DE CONCLUSÃO DE CURSO (TCC) - GRADUAÇÃO - IC Trabalhos de Conclusão de Curso (TCC) - Bacharelado - ENGENHARIA DE COMPUTAÇÃO- IC
Use este identificador para citar ou linkar para este item: http://www.repositorio.ufal.br/jspui/handle/123456789/11641
Tipo: Trabalho de Conclusão de Curso
Título: Classificação de produtos em Notas Fiscais Eletrônicas usando descrições textuais não estruturadas
Autor(es): Santos, Maria Tatiane Medeiros dos
Primeiro Orientador: Vieira, Thales Miranda de Almeida
metadata.dc.contributor.referee1: Oliveira, Krerley Irraciel Martins
metadata.dc.contributor.referee2: Barbosa, Adriano Oliveira
Resumo: Este trabalho apresenta uma análise acerca da viabilidade do uso de algoritmos de aprendizagem de máquina para a classificação de itens de produtos de Nota Fiscal Eletrônica (NFE), se baseando nas descrições textuais dos produtos para os atribuir às unidades comerciais correspondentes. A base de dados selecionada foi a base de dados de NFE disponibilizada pelo Ministério Público do Estado da Paraíba (MPPB). Esta pesquisa tem o objetivo de contribuir com a busca de soluções para o desafio de definir exatamente qual produto está sendo descrito e qual a quantidade que foi comercializada em uma NFE, e assim auxiliar em uma possível fiscalização automatizada dos preços. Para realizar a classificação, primeiro foi realizada uma rotulação manual de uma amostra dos dados, classificando-as quanto à unidade de medida. Essa amostra foi utilizada no treinamento de dois modelos para realizar a classificação da descrição do produto: uma solução tradicional a nível de palavras, adotado como baseline; e uma solução mais a nível do estado da arte baseado em redes neurais recorrentes, a nível de caracteres. Realizamos uma comparação do desempenho dessas duas abordagens.
Abstract: This work presents an analysis about the feasibility of using machine learning algorithms to product item classification in Electronic Invoices (NFE), based on the textual descriptions of the products to associate them with the corresponding commercial units. The database used in this work was extracted from a NFE database made available by Public Ministry of Paraiba (MPPB). This research has as purpose to contribute to the challenge of defining exactly which product is being described and what quantity was sold in an NFE, and thus help in a possible automated price inspection. To the classification, first was performed a manual labeling of a data sample, classifying them with the matching unit of measurement. This sample was used in the training of two models to perform a product description classification: a traditional word-based solution, adopted as baseline; and a state-of-the-art character-based solution based on recurrent neural networks. We perform a comparison of the performance of these two approaches.
Palavras-chave: Aprendizagem de máquina
Processamento de linguagem natural
Redes neurais recorrentes
Machine learning
Natural language processing
Recurrent neural network
CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::ENGENHARIA DE SOFTWARE
Idioma: por
País: Brasil
Editor: Universidade Federal de Alagoas
Sigla da Instituição: UFAL
metadata.dc.publisher.department: Curso Engenharia da Computação
Citação: SANTOS, Maria Tatiane Medeiros dos. Classificação de produtos em Notas Fiscais Eletrônicas usando descrições textuais não estruturadas. 2023. 39 f. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Computação) - Instituto de Computação, Universidade Federal de Alagoas, Maceió, 2022.
Tipo de Acesso: Acesso Aberto
URI: http://www.repositorio.ufal.br/jspui/handle/123456789/11641
Data do documento: 13-jan-2023
Aparece nas coleções:Trabalhos de Conclusão de Curso (TCC) - Bacharelado - ENGENHARIA DE COMPUTAÇÃO- IC

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Classificação de produtos em Notas Fiscais Eletrônicas usando descrições textuais não estruturadas.pdf885.4 kBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.