DSpace/Manakin Repository

A machine learning approach comparing predictive performance and interpretability of models for predicting success of NCAA basketball players to reach NBA.

Mostrar registro simples

dc.creator.ID COSTA, D. A. pt_BR
dc.contributor.advisor1 FECHINE, Joseana Macêdo.
dc.contributor.advisor1ID FECHINE, J. M. pt_BR
dc.contributor.advisor1Lattes http://lattes.cnpq.br/7179691582151907 pt_BR
dc.contributor.referee1 MACHADO, Patricia Duarte de Lima.
dc.contributor.referee1ID MACHADO, P. D. L. pt_BR
dc.contributor.referee1Lattes http://lattes.cnpq.br/2495918356675019 pt_BR
dc.contributor.referee2 BRASILEIRO, Francisco Vilar.
dc.contributor.referee2ID BRASILEIRO, F. pt_BR
dc.contributor.referee2Lattes http://lattes.cnpq.br/5957855817378897 pt_BR
dc.description.resumo Modelos preditivos em aprendizado de máquina e processos de descoberta de conhecimento em bases de dados, particularmente em domínios como o basquete, são inestimáveis para obter insights sobre o desempenho dos jogadores. Este estudo compara abordagens de aprendizado de máquina supervisionado (modelos de caixa preta e caixa branca, incluindo métodos de conjunto) para analisar dados estatísticos de jogadores de basquete universitário (NCAA). Nosso objetivo é identificar jogadores da NCAA com alto potencial para sucesso na NBA, determinar quais características dos jogadores mais influenciam as decisões de seleção e como esses modelos chegam a tais conclusões para comparar seus desempenhos e a explicabilidade associada. Esta tarefa é desafiadora devido a fatores além das estatísticas, como o contexto do jogador e as considerações do elenco da equipe durante a seleção. O objetivo principal é fornecer aos tomadores de decisão insights cruciais para a seleção de jogadores, ajudar na melhor avaliação de jogadores e desenvolver jovens talentos enfatizando aspectos-chave do jogo. Comparamos os resultados de modelos de predição interpretáveis com níveis satisfatórios de precisão. Equilibrando interpretabilidade e precisão preditiva, empregamos métodos de classificação de caixa branca, caixa preta e de conjunto, como Árvores de Decisão, Regressão Logística, Máquina de Vetores de Suporte, Perceptron Multicamadas, Floresta Aleatória e XGBoost. Além disso, algoritmos genéticos foram usados para reduzir o conjunto de características de cada modelo, retendo apenas as características mais impactantes. Comparado aos procedimentos padrão sem seleção de características, todos os modelos mostraram desempenho melhorado. Encontramos diferenças mínimas na precisão preditiva entre os melhores modelos de caixa branca e caixa preta. A combinação de algoritmos genéticos e regressão logística superou a precisão preditiva de outros modelos, reduzindo significativamente as características e melhorando a interpretabilidade dos resultados. A análise também destaca as características mais influentes no modelo e como os modelos chegaram a tais conclusões. pt_BR
dc.publisher.country Brasil pt_BR
dc.publisher.department Centro de Engenharia Elétrica e Informática - CEEI pt_BR
dc.publisher.initials UFCG pt_BR
dc.subject.cnpq Ciência da Computação pt_BR
dc.title A machine learning approach comparing predictive performance and interpretability of models for predicting success of NCAA basketball players to reach NBA. pt_BR
dc.date.issued 2024-05-15
dc.description.abstract Predictive models in machine learning and knowledge discovery in database processes, particularly in domains like basketball, are invaluable for gaining insights into player performance. This study compares supervised machine learning approaches (black-box and white-box models, including ensemble methods) to analyze statistical data from college basketball players (NCAA). We aim to identify NCAA players with high potential for NBA success, determine which player characteristics most influence selection decisions, and how these models have such conclusions to compare their performances and the associated explainability. This task is challenging due to factors beyond statistics, such as player context and team roster considerations during selection. The main objective is to provide decision-makers with crucial insights for player selection, aid in better player assessment, and develop young talents by emphasizing key game aspects. We compare interpretable prediction model results with satisfactory accuracy levels. Balancing interpretability and predictive accuracy, we employ white-box, black-box, and ensemble classification methods like Decision Trees, Logistic Regression, Support Vector Machine, Multi-Layer Perceptron, Random Forest, and XGBoost. Additionally, genetic algorithms were used to reduce each model's feature set, retaining only the most impactful features. Compared to standard procedures without feature selection, all models showed improved performance. We found minimal differences in predictive accuracy between the best white-box and black-box models. Genetic algorithms and logistic regression combination outperformed other models' predictive accuracy while significantly reducing features and enhancing result interpretability. The analysis also highlights the most influential features in the model and how models came to such conclusions. pt_BR
dc.identifier.uri http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/38052
dc.date.accessioned 2024-09-26T16:32:59Z
dc.date.available 2024-09-26
dc.date.available 2024-09-26T16:32:59Z
dc.type Trabalho de Conclusão de Curso pt_BR
dc.subject Predictive Models pt_BR
dc.subject Machine Learning pt_BR
dc.subject Feature Selection pt_BR
dc.subject Genetic Algorithms pt_BR
dc.subject Interpretability pt_BR
dc.subject Modelos Preditivos pt_BR
dc.subject Aprendizado de Máquina pt_BR
dc.subject Seleção de Recursos pt_BR
dc.subject Algoritmos Genéticos pt_BR
dc.subject Interpretabilidade pt_BR
dc.rights Acesso Aberto pt_BR
dc.creator COSTA, Dante de Araújo.
dc.publisher Universidade Federal de Campina Grande pt_BR
dc.language por pt_BR
dc.title.alternative Uma abordagem de aprendizado de máquina comparando o desempenho preditivo e a interpretabilidade de modelos para prever o sucesso de jogadores de basquete da NCAA em alcançar a NBA. pt_BR
dc.identifier.citation COSTA, Dante de Araújo. A machine learning approach comparing predictive performance and interpretability of models for predicting success of NCAA basketball players to reach NBA. 13 f. Artigo (Bacharelado em Ciência da Computação) - Universidade Federal de Campina Grande, Centro de Engenharia Elétrica e Informática, Campina Grande, Paraíba, Brasil, 2024. pt_BR


Arquivos deste item

Este item aparece na(s) seguinte(s) coleção(s)

Mostrar registro simples

Buscar DSpace


Busca avançada

Navegar

Minha conta