00 CAMPUS ARISTÓTELES CALAZANS SIMÕES (CAMPUS A. C. SIMÕES) IM - INSTITUTO DE MATEMÁTICA Dissertações e Teses defendidas na UFAL - IM
Use este identificador para citar ou linkar para este item: http://www.repositorio.ufal.br/jspui/handle/riufal/3784
Tipo: Dissertação
Título: Aprendizagem profunda para reconhecimento de gestos da mão usando imagens e esqueletos com aplicações em Libras
Título(s) alternativo(s): Deep learning for hand gestures recognition using images and skeletons with Libras applications
Autor(es): Voigt, Johann Felipe
Primeiro Orientador: Vieira, Thales Miranda de Almeida
metadata.dc.contributor.referee1: Silva, Adelailson Peixoto da
metadata.dc.contributor.referee2: Morera, Dimas Martinez
metadata.dc.contributor.referee3: Vieira, Tiago Figueiredo
Resumo: Neste trabalho apresentamos metodologias baseadas em Aprendizagem Profunda (Deep Learning) para reconhecimento de gestos estáticos e dinâmicos da mão, com aplicações em sinais de Libras. Através de dados capturados pelo dispositivo Leap Motion, incluindo tanto imagens quanto esqueletos da palma da mão, avaliamos diversas arquiteturas de Redes Neurais para reconhecer gestos, com ênfase em sinais de Libras. As metodologias podem ser descritas em três etapas. Na primeira, buscamos reconhecer os gestos estáticos (poses) usando redes perceptron multicamadas (MLP) para os dados do esqueleto, redes convolucionais (CNN) para as imagens, e redes de múltiplas entradas, utilizando ambos os tipos de informação. Na segunda, classificamos individualmente gestos que incluam movimento, e para tanto incluímos camadas recorrentes Long Short-Term Memory (LSTM) em nossas arquiteturas. Para tornar o processo ainda mais preciso, aplicamos Transferência de Aprendizado nos blocos convolucionais, trazendo os parâmetros já treinados com as poses estáticas para dentro da rede projetada para os gestos dinâmicos, e avaliamos o resultado com e sem a transferência. Por fim, apresentamos um novo algoritmo que nos permita reconhecer online os mesmos gestos dinâmicos da etapa anterior, mas executados de forma sequencial, sem pausas, e sem ter informação sobre o início e final da execução de cada gesto.
Abstract: In this work we present methodologies based on Deep Learning for the recognition of static and dynamic gestures of the hand, with applications in signs of Libras (Brazilian Sign Language). Through data captured by the Leap Motion device, including both images and skeletons of the palm, we evaluated several architectures of Neural Networks to recognize gestures, with emphasis on signs of Libras. The methodologies can be described in three stages. In the first one, we sought to recognize static gestures (poses) using multilayer perceptron networks (MLP) for skeletal data, convolutional networks (CNN) for images, and multiple input networks using both types of information. In the second, we individually classify gestures that include motion, and for this we include recurrent Long Short-Term Memory (LSTM) layers in our architectures. To make the process even more precise, we apply Learning Transfer to the convolutional blocks, bringing the previously trained parameters with the static poses into the network designed for the dynamic gestures, and evaluate the result with and without the transfer. Finally, we present a new algorithm that allows us to recognize online the same dynamic gestures from the previous step, but executed sequentially, without pauses, and without having information about the beginning and end of the execution of each gesture.
Palavras-chave: Matemática – Estudo e ensino
Língua brasileira de sinais
Redes neurais
Reconhecimento de gestos
Mathematics - Study and teaching
Brazilian Sign Language
Neural networks
Gesture recognition
Leap motion
CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::MATEMATICA
Idioma: por
País: Brasil
Editor: Universidade Federal de Alagoas
Sigla da Instituição: UFAL
metadata.dc.publisher.program: Programa de Pós-Graduação em Matemática
Citação: VOIGT, Johann Felipe. Aprendizagem profunda para reconhecimento de gestos da mão usando imagens e esqueletos com aplicações em Libras. 2018. 92 f. Dissertação (Mestrado em Matemática) – Instituto de Matemática, Programa de Pós Graduação em Matemática, Universidade Federal de Alagoas, Maceió, 2018.
Tipo de Acesso: Acesso Aberto
URI: http://www.repositorio.ufal.br/handle/riufal/3784
Data do documento: 5-dez-2018
Aparece nas coleções:Dissertações e Teses defendidas na UFAL - IM



Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.