00 CAMPUS ARISTÓTELES CALAZANS SIMÕES (CAMPUS A. C. SIMÕES) IC - INSTITUTO DE COMPUTAÇÃO Dissertações e Teses defendidas na UFAL - IC
Use este identificador para citar ou linkar para este item: http://www.repositorio.ufal.br/jspui/handle/123456789/14927
Tipo: Dissertação
Título: Use of information theory measures extracted from OBD-II interface data for driver identification
Autor(es): Santos, Gean da Silva
Primeiro Orientador: Aquino, André Luiz Lins de
metadata.dc.contributor.referee1: Rosso, Osvaldo Aníbal
metadata.dc.contributor.referee2: Rosário, Denis Lima do
metadata.dc.contributor.referee3: Cabral, Raquel da Silva
Resumo: Investigamos o uso de ferramentas de Aprendizado de Máquina aplicadas à identificação de motoristas. Propomos o uso de medidas de Teoria da Informação como recursos em modelos de Aprendizado de Máquina. As medidas utilizadas são Complexidade Estatística, Entropia de Permutação e Informação de Fisher. Calculamos essas medidas sobre os dados brutos dos valores dos sensores do Sistema de Diagnóstico Embarcado versão 2 (OBD-II) e as utilizamos como novas características aplicadas aos seguintes modelos de classificação: k-Nearest Neighbors, Support Vector Machine, Decision Tree, Random Forest, Multi-Layer Perceptron e Naive Bayes. Avaliamos o cenário de identificação de motorista considerando janelas deslizantes de 120 amostras e uma sobreposição de 60 amostras. Em cada janela, os modelos bem estabelecidos são treinados e avaliados. Os modelos são analisados pela acurácia, pela Área Sob a Curva da Curva Característica de Operação do Receptor (que determina quão relevante o classificador é em termos de sua sensibilidade e specificidade), pela precisão e pela cobertura. Observamos ganhos significativos para todos os modelos considerados no cenário. Seguindo o procedimento tradicional, obtivemos os valores: de 78,5 a 91,1% de acurácia, de 74,5 a 87,8% de ROC AUC, de 62,5 a 84,2% de precisão e de 60,6 a 85,3% de revocação. Enquanto usando nossa proposta, obtivemos os valores: de 94,3 a 99,9% de acurácia, de 91,7 a 99,9% de ROC AUC, de 89,8 a 99,9% de precisão e de 86,4 a 99,9% de cobertura.
Abstract: We investigate the use of Machine Learning tools applied to driver identification. We propose us ing Information Theory measures as features in Machine Learning models. The measures used are Statistical Complexity, Permutation Entropy, and Fisher Information. We calculate these mea sures over the raw data of On Board Diagnostics version 2 (OBD-II) sensor values and use them as new features applying to the following classification models: k-Nearest Neighbors, Support Vector Machine, Decision Tree, Random Forest, Multi-Layer Perceptron, and Naive Bayes. We evaluate the driver identification scenario considering sliding windows of 120 samples and an overlap of 60 samples. In each window, the well-established models are trained and evaluated. The models are analyzed by accuracy, by the Area Under the Curve of the Receiver Operating Characteristic Curve (which determines how relevant the classifier is in terms of its sensitivity and specificity), by precision and by recall. We observed significant gains for all models consid ered in the scenario. Following the traditional procedure, we obtained the values: 78.5 to 91.1 % of accuracy, 74.5 to 87.8 % of ROC AUC, 62.5 to 84.2 % of precision, and 60.6 to 85.3 % of recall. While using our proposal, we obtained the values: 94.3 to 99.9 % of accuracy, 91.7 to 99.9 % of ROC AUC, 89.8 to 99.9 % of precision, and 86.4 to 99.9 % of recall.
Palavras-chave: Identificação de motorista (Aprendizado do computador)
Teoria da informação
Complexidade estatística
Shannon, Entropia de
Fisher, informação de
Aprendizado do computador
Dados de veículo
Sistema de Diagnóstico Embarcado
CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Idioma: por
País: Brasil
Editor: Universidade Federal de Alagoas
Sigla da Instituição: UFAL
metadata.dc.publisher.program: Programa de Pós-Graduação em Informática
Citação: SANTOS, Gean da Silva. Use of information theory measures extracted from OBD-II interface data for driver identification. 2024.33 f. Dissertação (Mestrado em informática) – Programa de Pós - Graduação em Informática, Instituto de Computação, Universidade Federal de Alagoas, Maceió, 2024.
Tipo de Acesso: Acesso Aberto
URI: http://www.repositorio.ufal.br/jspui/handle/123456789/14927
Data do documento: 25-mar-2024
Aparece nas coleções:Dissertações e Teses defendidas na UFAL - IC

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Use of information theory measures extracted from OBD-II interface data for driver identification.pdf2.94 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.