Use este identificador para citar ou linkar para este item:
http://www.repositorio.ufal.br/jspui/handle/123456789/14927
Tipo: | Dissertação |
Título: | Use of information theory measures extracted from OBD-II interface data for driver identification |
Autor(es): | Santos, Gean da Silva |
Primeiro Orientador: | Aquino, André Luiz Lins de |
metadata.dc.contributor.referee1: | Rosso, Osvaldo Aníbal |
metadata.dc.contributor.referee2: | Rosário, Denis Lima do |
metadata.dc.contributor.referee3: | Cabral, Raquel da Silva |
Resumo: | Investigamos o uso de ferramentas de Aprendizado de Máquina aplicadas à identificação de motoristas. Propomos o uso de medidas de Teoria da Informação como recursos em modelos de Aprendizado de Máquina. As medidas utilizadas são Complexidade Estatística, Entropia de Permutação e Informação de Fisher. Calculamos essas medidas sobre os dados brutos dos valores dos sensores do Sistema de Diagnóstico Embarcado versão 2 (OBD-II) e as utilizamos como novas características aplicadas aos seguintes modelos de classificação: k-Nearest Neighbors, Support Vector Machine, Decision Tree, Random Forest, Multi-Layer Perceptron e Naive Bayes. Avaliamos o cenário de identificação de motorista considerando janelas deslizantes de 120 amostras e uma sobreposição de 60 amostras. Em cada janela, os modelos bem estabelecidos são treinados e avaliados. Os modelos são analisados pela acurácia, pela Área Sob a Curva da Curva Característica de Operação do Receptor (que determina quão relevante o classificador é em termos de sua sensibilidade e specificidade), pela precisão e pela cobertura. Observamos ganhos significativos para todos os modelos considerados no cenário. Seguindo o procedimento tradicional, obtivemos os valores: de 78,5 a 91,1% de acurácia, de 74,5 a 87,8% de ROC AUC, de 62,5 a 84,2% de precisão e de 60,6 a 85,3% de revocação. Enquanto usando nossa proposta, obtivemos os valores: de 94,3 a 99,9% de acurácia, de 91,7 a 99,9% de ROC AUC, de 89,8 a 99,9% de precisão e de 86,4 a 99,9% de cobertura. |
Abstract: | We investigate the use of Machine Learning tools applied to driver identification. We propose us ing Information Theory measures as features in Machine Learning models. The measures used are Statistical Complexity, Permutation Entropy, and Fisher Information. We calculate these mea sures over the raw data of On Board Diagnostics version 2 (OBD-II) sensor values and use them as new features applying to the following classification models: k-Nearest Neighbors, Support Vector Machine, Decision Tree, Random Forest, Multi-Layer Perceptron, and Naive Bayes. We evaluate the driver identification scenario considering sliding windows of 120 samples and an overlap of 60 samples. In each window, the well-established models are trained and evaluated. The models are analyzed by accuracy, by the Area Under the Curve of the Receiver Operating Characteristic Curve (which determines how relevant the classifier is in terms of its sensitivity and specificity), by precision and by recall. We observed significant gains for all models consid ered in the scenario. Following the traditional procedure, we obtained the values: 78.5 to 91.1 % of accuracy, 74.5 to 87.8 % of ROC AUC, 62.5 to 84.2 % of precision, and 60.6 to 85.3 % of recall. While using our proposal, we obtained the values: 94.3 to 99.9 % of accuracy, 91.7 to 99.9 % of ROC AUC, 89.8 to 99.9 % of precision, and 86.4 to 99.9 % of recall. |
Palavras-chave: | Identificação de motorista (Aprendizado do computador) Teoria da informação Complexidade estatística Shannon, Entropia de Fisher, informação de Aprendizado do computador Dados de veículo Sistema de Diagnóstico Embarcado |
CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
Idioma: | por |
País: | Brasil |
Editor: | Universidade Federal de Alagoas |
Sigla da Instituição: | UFAL |
metadata.dc.publisher.program: | Programa de Pós-Graduação em Informática |
Citação: | SANTOS, Gean da Silva. Use of information theory measures extracted from OBD-II interface data for driver identification. 2024.33 f. Dissertação (Mestrado em informática) – Programa de Pós - Graduação em Informática, Instituto de Computação, Universidade Federal de Alagoas, Maceió, 2024. |
Tipo de Acesso: | Acesso Aberto |
URI: | http://www.repositorio.ufal.br/jspui/handle/123456789/14927 |
Data do documento: | 25-mar-2024 |
Aparece nas coleções: | Dissertações e Teses defendidas na UFAL - IC |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
Use of information theory measures extracted from OBD-II interface data for driver identification.pdf | 2.94 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.