Please use this identifier to cite or link to this item: http://www.repositorio.ufal.br/handle/riufal/2920
metadata.dc.type: Dissertação
Title: Classificação de rasuras em textos manuscritos
Other Titles: Erasure classification in manuscript texts
metadata.dc.creator: Tenório, Marcos Antonio Rocha
metadata.dc.contributor.advisor1: Costa, Evandro de Barros
metadata.dc.contributor.advisor-co1: Vieira, Tiago Figueiredo
metadata.dc.contributor.referee1: Machado, Aydano Pamponet
metadata.dc.contributor.referee2: Oliveira, Eduardo Calil de
metadata.dc.contributor.referee3: Rêgo, Joílson Batista de Almeida
metadata.dc.description.resumo: Este trabalho se insere na linha de pesquisa Modelos Computacionais em Educação do Programa de Pós-graduação Interdisciplinar em Modelagem Computacional de Conhecimento, realizando um estudo sobre classificacão de rasuras em textos manuscritos. O estudo dessas rasuras é feito para a determinação das dificuldades no processo de aprendizagem, pois leva a entender o conflito do estudante em processo de aquisição da escrita, na identificação das fronteiras da palavra ortográfica. Neste contexto, o objetivo deste trabalho foi a construção de um modelo para identificação e detecção das rasuras em textos, através da análise das rasuras geradas em palavras de enunciados produzidos pelos referidos estudantes. Para representar matematicamente as imagens, devido à diferença de dimensões das imagens adquiridas, fez-se necessário a utilização de um parâmetro que caracterizasse a imagem de uma forma única, independente da mesma ser uma letra ou palavra, ou das dimensões dos caracteres utilizados na escrita. Na solução deste problema, propõe-se a identificação da direção dos traços que compõem a escrita, pois a mesma independe das dimensões e caracteriza bem principalmente as rasuras, normalmente composta por muitos traços paralelos em uma única direção. As imagens foram classificadas por processos de aprendizagem de máquina, das técnicas: Máquina de Vetores de Suporte (SVM), Árvores de Decisão (boostedand bagged trees), Vizinhos mais Próximos (KNN), Naive Bayes, análise de discriminante (QDA e outros) e Regressão Logística, que analisam os dados e reconhecem padrões, usados para classificação e análise de regressão. Os resultados obtidos mostram que os descritores de imagem quando utilizados isoladamente obtém valores limites de acurácia na ordem de 90%, porém quando combinados com outros (Histograma de Orientação de Borda + Centróide Hierárquico + Momentos de Zernike), excedem 98% de acurácia. Assim, uma das conclusões obtidas nessa pesquisa é a da apropriação de técnicas de aprendizagem de máquina para o reconhecimento de rasuras.
Abstract: This work is included in the research line “Computational Models in Education” of the Interdisciplinary Postgraduate Program in Computational Modeling of Knowledge, conducting a study on erasures in texts produced by students of primary education. This study is performed aiming to detect difficulties in the learning process, because it leads to understand the conflict of the student in the process of acquisition of writing, in the identification of the orthographic word boundaries. In this context, the objective of this paper is the construction of a model for identification and detection of erasures in texts, through the analysis of erasures generated in words of statements produced by students. In order to represent the images mathematically, due to the difference in the dimensions of the images acquired, it was necessary to use a parameter that characterized the image in a unique way, regardless of whether it is a letter or word, or the dimensions of the characters used in writing. In the solution of this problem, it is proposed to identify the direction of the traces that compose the writing, since it is independent of the dimensions and characterizes mainly the erasures, usually composed by many parallel traces in a single direction. The images were classified by machine learning processes, using techniques such as: Support Vector Machines (SVM), Boosted and bagged trees, Nearest Neighbors (KNN), Naive Bayes, discriminant analysis (QDA and others) and Logistic Regression, which analyze the data and recognize used for classification and regression analysis. The obtained results show that the image descriptors when used alone obtains limits around 90% of accuracy, but when combined with others (Edge Orientation Histogram + Hierarchical Centroid + Zernike Moments), they exceed 98% of accuracy. Thus, one of the conclusions obtained in this research is the appropriation of machine learning techniques for the recognition of erasures.
Keywords: Modelagem computacional
Texto manuscrito – Identificação de rasuras
Linguística
Computational modeling
Handwritten text - Identification of Erasures
Linguistics
metadata.dc.subject.cnpq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
metadata.dc.language: por
metadata.dc.publisher.country: Brasil
Publisher: Universidade Federal de Alagoas
metadata.dc.publisher.initials: UFAL
metadata.dc.publisher.program: Programa de Pós-Graduação em Modelagem Computacional de Conhecimento
Citation: TENÓRIO, Marcos Antonio Rocha. Classificação de rasuras em textos manuscritos. 2018. 82 f. Dissertação (Mestrado em Modelagem computacional de Conhecimento) - Instituto de Computação, Programa de Pós-Graduação em Modelagem Computacional de Conhecimento, Universidade Federal de Alagoas, Maceió, 2018.
metadata.dc.rights: Acesso Aberto
URI: http://www.repositorio.ufal.br/handle/riufal/2920
Issue Date: 8-Feb-2018
Appears in Collections:Dissertações e Teses defendidas na UFAL - IC

Files in This Item:
File Description SizeFormat 
Classificação de rasuras em textos manuscritos.pdf5.88 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.