00 CAMPUS ARISTÓTELES CALAZANS SIMÕES (CAMPUS A. C. SIMÕES) IC - INSTITUTO DE COMPUTAÇÃO Dissertações e Teses defendidas na UFAL - IC
Use este identificador para citar ou linkar para este item: http://www.repositorio.ufal.br/jspui/handle/123456789/17081
Tipo: Dissertação
Título: Uma abordagem de aprendizado de máquina para identificação de tendências de sucesso de jogadores de basquete universitário americano para a liga profissional: conciliando predição e explicabilidade
Título(s) alternativo(s): A machine learning approach to identify success trends in ncaa players with good chance to reach nba: a balance between prediction performance and explainability
Autor(es): Brito, José Rubens da Silva
Primeiro Orientador: Costa, Evandro de Barros
metadata.dc.contributor.advisor-co1: Lopes, Roberta Vilhena Vieira
metadata.dc.contributor.referee1: Pimentel, Bruno Almeida
metadata.dc.contributor.referee2: Fechine, Joseana Macedo
metadata.dc.contributor.referee3: Vieira, Thales Miranda de Almeida
metadata.dc.contributor.referee4: Moura, José Antão Beltrão
Resumo: Este estudo investiga a aplicação de técnicas de aprendizado de máquina em dados históricos do basquete universitário americano (NCAA), com o objetivo de prever quais jogadores têm maior potencial de chegar à NBA. Nos últimos anos, a análise de dados no basquete ganhou destaque, indo além das estatísticas convencionais e incorporando dados de sensores e câmeras, a fim de identificar padrões que possam aprimorar o desempenho de jogadores e equipes. Contudo, embora esse crescente complexidade aumente o valor preditivo, ela também gera um conjunto de dados que pode conter características redundantes, ruidosas e irrelevantes, as quais podem impactar negativamente a atividade preditiva. Para mitigar esse problema e buscar uma solução que concilie predição e explicabilidade dos modelos preditivos, propôs-se, neste trabalho, uma abordagem composta por três etapas principais: (I) seleção dos atributos mais relevantes para auxiliar na tomada de decisão; (II) utilização de algoritmos de aprendizado de máquina; (III) análise dos resultados preditivos por meio da explicabilidade de cada modelo. Na etapa (I), foi feita a seleção de dados que, quando combinados, formam um conjunto de atributos do jogador, influenciando direta ou indiretamente sua contratação por equipes da NBA, considerando a configuração atual do time. Utilizaram-se técnicas consolidadas na literatura, como Wrapper, Filter, Embedding, além do Algoritmo Genético, com o objetivo de melhorar a precisão preditiva e reduzir o número de características. Na etapa (II), buscou-se equilibrar interpretabilidade e precisão preditiva, empregando métodos de classificação transparente, como Árvores de Decisão, Regressão Logística e o Algoritmo de Regras (PRISM). Como referência de modelo de opaco, utilizou-se a Máquina de Vetores de Suporte (SVM). Já na etapa (III), analisou-se a explicabilidade de cada modelo. Isso foi feito de duas maneiras: pela própria construção dos algoritmos, como os de indução via Árvores de Decisão e via regras, e por meio da ferramenta de explicabilidade SHAP. Para a validação da abordagem, utilizou-se a base de dados mencionada, e os resultados indicaram um impacto positivo da seleção de atributos nos modelos preditivos, com destaque para a influência benéfica do Algoritmo Genético na etapa de seleção. Essa abordagem contribuiu para a identificação de um conjunto mínimo de atributos e para a melhoria das métricas de predição dos classificadores. Especificamente, a combinação do Algoritmo Genético com SVM na função de aptidão, na etapa de seleção gerou um conjunto de atributos que, ao ser utilizado na Árvore de Decisão (CART), alcançou uma acurácia de 80%. Por fim, foi realizada uma análise da interpretabilidade dos modelos Árvore de Decisão CART e PRISM, destacando a clareza fornecida por cada um: o primeiro baseado em estrutura de Árvore de Decisão e o segundo em algoritmo de regras. Adicionalmente, utilizamos a ferramenta SHAP para analisar as saídas geradas pelos algoritmos de aprendizado de máquina, permitindo uma interpretação mais clara dos resultados, para assim, auxiliar na tomada de decisão. Espere-se com esses resultados poder contribuir para a aplicação eficiente de técnicas de aprendizado de máquina no basquete, sobretudo na predição de comportamentos futuros de jogadores com base em variáveis explicáveis e selecionadas de forma criteriosa.
Abstract: This study investigates the application of machine learning techniques on historical data from American college basketball (NCAA), with the aim of predicting which players have the highest potential to make it to the NBA. In recent years, data analysis in basketball has gained prominence, going beyond conventional statistics and incorporating data from sensors and cameras to identify patterns that can enhance player and team performance. However, although this growing complexity increases the predictive value, it also generates a dataset that may contain redundant, noisy, and irrelevant features, which can negatively impact predictive accuracy. To mitigate this problem and seek a solution that balances prediction and explainability of predictive models, this work proposes an approach composed of three main steps: (I) selection of the most relevant features to aid decision-making; (II) use of machine learning algorithms; (III) analysis of predictive results through the explainability of each model. In step (I), data selection was performed, and when combined, these features form a set of player attributes that directly or indirectly influence their hiring by NBA teams, considering the team’s current configuration. Established techniques from the literature, such as Wrapper, Filter, Embedding, as well as the Genetic Algorithm, were used to improve predictive accuracy and reduce the number of features. In step (II), the goal was to balance interpretability and predictive accuracy by employing transparent classification methods such as Decision Trees, Logistic Regression, and the Rule-based Algorithm (PRISM). The Support Vector Machine (SVM) was used as a reference for opaque models. In step (III), the explainability of each model was analyzed. This was done in two ways: through constructing the algorithms themselves, such as decision tree induction and rule-based algorithms, and through the SHAP explainability tool. For validation, the mentioned dataset was used, and the results indicated a positive impact of feature selection on the predictive models, with particular emphasis on the beneficial influence of the Genetic Algorithm in the selection phase. This approach contributed to identifying a minimal set of features and improving the prediction metrics of the classifiers. Specifically, combining the Genetic Algorithm with SVM in the fitness function during the selection phase produced a set of features that, when used in the Decision Tree (CART), achieved an accuracy of 80%. Finally, an analysis of the interpretability of the CART Decision Tree and PRISM models was carried out, highlighting the clarity provided by each: the first based on a decision tree structure and the second on a rule-based algorithm. Additionally, the SHAP tool was used to analyze the outputs generated by the machine learning algorithms, allowing for a clearer interpretation of the results, and thus aiding decision-making. Hopefully, these results will contribute to the efficient application of machine learning techniques in basketball, particularly in predicting future player behaviors based on explainable variables selected in a rigorous manner.
Palavras-chave: Aprendizado de máquina
Esporte universitário americano
Jogadores de Basquetebol
Performance
CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Idioma: por
País: Brasil
Editor: Universidade Federal de Alagoas
Sigla da Instituição: UFAL
metadata.dc.publisher.program: Programa de Pós-Graduação em Informática
Citação: BRITO, José Rubens da Silva. Uma abordagem de aprendizado de máquina para identificação de tendências de sucesso de jogadores de basquete universitário americano para a liga profissional: conciliando predição e explicabilidade. 2025. 119 f. Dissertação (Mestrado em Informática) – Instituto de Computação, Programa de Pós-Graduação em Informática, Universidade Federal de Alagoas, Maceió, 2024.
Tipo de Acesso: Acesso Aberto
URI: http://www.repositorio.ufal.br/jspui/handle/123456789/17081
Data do documento: 29-out-2024
Aparece nas coleções:Dissertações e Teses defendidas na UFAL - IC

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Uma abordagem de aprendizado de máquina para identificação de tendências de sucesso de jogadores de basquete universitário americano para a liga profissional_conciliando predição e explicabilidade.pdfUma abordagem de aprendizado de máquina para identificação de tendências de sucesso de jogadores de basquete universitário americano para a liga profissional: conciliando predição e explicabilidade4.58 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.