Et le vainqueur de la coupe du monde sera….

A quelques jours du lancement de la coupe du monde de football 2018 en Russie, les pronostics sont lancés et les paris vont bon train à la machine à café sur le futur lauréat de cette nouvelle édition. Verteego n’échappe pas à la règle.

En bon supporters de football et surtout en bon geeks, nous ne pouvions pas passer à côté de l’occasion d’analyser les statistiques et les approches développées pour prédire le futur gagnant.

Une fois de plus, ce sont les banquiers de Goldman Sachs qui ont tiré les premiers avec une analyse solide et la construction d’un modèle complexe de prévision des résultats basé sur une succession d’algorithmes de machine learning.

Pour aboutir à ce modèle, les équipes du service économique ont fait fort et se sont même offert les services du légendaire coach Carlo Ancelloti pour affiner le modèle et s’approprier la science du football. La data ne parle pas d’elle-même…

Au delà des 200 000 arbres de décision et du million de simulations lancées, de nombreux paramètres furent pris en compte

  • Estimation de la force individuelle et collective de chaque équipes
  • Historique des résultats
  • Historique des buts marqués
  • Classement FIFA
  • Win-Lose ratio
  • Momentum de chaque équipe
  • ….

Quatre modèles principaux furent utilisés pour prédire successivement les buts marqués, les victoires et les différents scénarios de phases de poule puis de phases à élimination directe : random forest, Bayesian ridge regression, Lasso regression et le gradient boosted machine.

Assez classiquement, une analyse fait également état des paramètres d’influence (feature importance). On retrouve ainsi tous les éléments qui, par ordre d’importance, influent le plus les résultats des prévisions.

  1. Team ratings (40%)
  2. Player ratings (en intensité) (25%)
  3. Performance récente de l’équipe (9%)
  4. Le résultat des dernières oppositions (8%)
  5. Le “momentum” (5%)

 

Et au final…

Pour couper court à tout suspense, le modèle donne gagnant… le Brésil, vainqueur de l’Allemagne en finale. Dommage pour les supporters des bleus, la France sera éliminée en demi-finale après avoir sorti la Croatie en ⅛ et l’Espagne en ¼.

Et voici les résultats tant attendus :

Pour mémoire, Goldman Sachs avait déjà établi une analyse similaire, néanmoins non vérifiée par les événements lors de la coupe du monde 2014 (le Brésil avait été donné gagnant face aux Pays-Bas).

 

A vous de jouer… il ne reste que quelques jours pour finaliser vos pronostics!

 

Source : Goldman Sachs Global Investment Research

http://www.goldmansachs.com/our-thinking/pages/world-cup-2018/index.html?cid=scl-np-twitter-evergreen-post-20171&sf191548159=1