Use este identificador para citar ou linkar para este item:
http://www.repositorio.ufal.br/jspui/handle/123456789/11641
Tipo: | Trabalho de Conclusão de Curso |
Título: | Classificação de produtos em Notas Fiscais Eletrônicas usando descrições textuais não estruturadas |
Autor(es): | Santos, Maria Tatiane Medeiros dos |
Primeiro Orientador: | Vieira, Thales Miranda de Almeida |
metadata.dc.contributor.referee1: | Oliveira, Krerley Irraciel Martins |
metadata.dc.contributor.referee2: | Barbosa, Adriano Oliveira |
Resumo: | Este trabalho apresenta uma análise acerca da viabilidade do uso de algoritmos de aprendizagem de máquina para a classificação de itens de produtos de Nota Fiscal Eletrônica (NFE), se baseando nas descrições textuais dos produtos para os atribuir às unidades comerciais correspondentes. A base de dados selecionada foi a base de dados de NFE disponibilizada pelo Ministério Público do Estado da Paraíba (MPPB). Esta pesquisa tem o objetivo de contribuir com a busca de soluções para o desafio de definir exatamente qual produto está sendo descrito e qual a quantidade que foi comercializada em uma NFE, e assim auxiliar em uma possível fiscalização automatizada dos preços. Para realizar a classificação, primeiro foi realizada uma rotulação manual de uma amostra dos dados, classificando-as quanto à unidade de medida. Essa amostra foi utilizada no treinamento de dois modelos para realizar a classificação da descrição do produto: uma solução tradicional a nível de palavras, adotado como baseline; e uma solução mais a nível do estado da arte baseado em redes neurais recorrentes, a nível de caracteres. Realizamos uma comparação do desempenho dessas duas abordagens. |
Abstract: | This work presents an analysis about the feasibility of using machine learning algorithms to product item classification in Electronic Invoices (NFE), based on the textual descriptions of the products to associate them with the corresponding commercial units. The database used in this work was extracted from a NFE database made available by Public Ministry of Paraiba (MPPB). This research has as purpose to contribute to the challenge of defining exactly which product is being described and what quantity was sold in an NFE, and thus help in a possible automated price inspection. To the classification, first was performed a manual labeling of a data sample, classifying them with the matching unit of measurement. This sample was used in the training of two models to perform a product description classification: a traditional word-based solution, adopted as baseline; and a state-of-the-art character-based solution based on recurrent neural networks. We perform a comparison of the performance of these two approaches. |
Palavras-chave: | Aprendizagem de máquina Processamento de linguagem natural Redes neurais recorrentes Machine learning Natural language processing Recurrent neural network |
CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::ENGENHARIA DE SOFTWARE |
Idioma: | por |
País: | Brasil |
Editor: | Universidade Federal de Alagoas |
Sigla da Instituição: | UFAL |
metadata.dc.publisher.department: | Curso Engenharia da Computação - Bacharelado |
Citação: | SANTOS, Maria Tatiane Medeiros dos. Classificação de produtos em Notas Fiscais Eletrônicas usando descrições textuais não estruturadas. 2023. 39 f. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Computação) - Instituto de Computação, Universidade Federal de Alagoas, Maceió, 2022. |
Tipo de Acesso: | Acesso Aberto |
URI: | http://www.repositorio.ufal.br/jspui/handle/123456789/11641 |
Data do documento: | 13-jan-2023 |
Aparece nas coleções: | Trabalhos de Conclusão de Curso (TCC) - Bacharelado - ENGENHARIA DE COMPUTAÇÃO- IC |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
Classificação de produtos em Notas Fiscais Eletrônicas usando descrições textuais não estruturadas.pdf | 885.4 kB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.