Football Learning - Avaliação de Jogadores de Futebol usando Machine Learning

Ao longo das últimas décadas, o futebol passou por uma evolução que transformou o que era um desporto para um negócio com enorme impacto social e financeiro. Essa transformação, aliada à constante necessidade de obter sucesso desportivo, criou a necessidade de inovação por parte de um clube desporti...

Full description

Bibliographic Details
Main Author: Costa, Domingos Bernardino Pereira da (author)
Format: masterThesis
Language:por
Published: 2021
Subjects:
Online Access:http://hdl.handle.net/10400.22/19349
Country:Portugal
Oai:oai:recipp.ipp.pt:10400.22/19349
Description
Summary:Ao longo das últimas décadas, o futebol passou por uma evolução que transformou o que era um desporto para um negócio com enorme impacto social e financeiro. Essa transformação, aliada à constante necessidade de obter sucesso desportivo, criou a necessidade de inovação por parte de um clube desportivo de forma a distanciar-se dos seus adversários e de conquistar títulos e alcançar mais lucro financeiro. O principal objetivo desta dissertação passa pela criação de um rating de qualidade de um jogador com recurso a um modelo de previsão de resultados de futebol com apenas duas possibilidades, jogo ganho ou jogo não ganho, em que serão retirados os pesos de estatísticas simples e avançadas, desde golos marcados a duelos aéreos ganhos. Várias metodologias de machine learning foram estudadas para perceber quais as melhores para resolver os problemas de classificação e regressão presentes neste tema, tendo sido escolhidos aplicações de algoritmos de support-vector machine (SVM) e de regressão linear. Os dados foram tratados de forma a retirar "lixo" que possa diminuir a performance da fase de modelação, que consistiu na criação de vários modelos divididos por competição, bem como um modelo com todos os jogos, aplicando os algoritmos estudados e comparando os resultados dos modelos e algoritmos entre si. O modelo de previsão de resultados que utilizou regressão linear foi o escolhido para o cálculo dos ratings dos jogadores, visto que obteve uma taxa de acerto de 75.40% em comparação com o de SVM, que teve 75.00%. Com os pesos aplicados e os jogadores analisados, verificouse que o modelo tem uma correspondência aceitável com bases de dados já existentes no mercado e com a opinião de conhecedores do negócio, alcançando uma percentagem de acerto de 72.22% num inquérito realizado a 11 pessoas ligadas ao futebol.