Quel historique pour une prévision des ventes fiable ?

by Rupert Schiessl

#Prévision des ventes #Historique de donnée

Comment un historique de données assure la fiabilité d’une prévision des ventes ? Combien de données sont nécessaires pour un modèle de machine learning ?

  1. Le rôle de l’historique dans la prévision des ventes
  2. Quel est l’historique idéal pour une prévision des ventes fiable ?
  3. Les limites de l’historique dans la prévision des ventes

Nous avons pu découvrir dans un précédent article l’importance d’une prévision des ventes de qualité et les méthodes les plus efficaces pour cet exercice. En effet, la prévision des ventes permet de prendre de meilleures décisions et de réduire les risques contextuels. Si le machine learning présente des avantages non négligeables, il doit néanmoins, et avant tout, s'appuyer sur des données pertinentes pour répondre à l’objectif initial.

Le rôle de l’historique dans la prévision des ventes

La prévision des ventes permet aux entreprises d’anticiper leur demande future afin de prendre des décisions de gestion avec diligence, comme par exemple le niveau de stock optimal, l’investissement en matériel de fabrication ou en énergie, le planning du personnel, etc.

Les décisions que nous prenons dans notre vie quotidienne sont fortement basées sur nos expériences passées. Nos observations ont permis à notre cerveau d’établir des modèles décisionnels qui nous guident dans nos actions. Il est de même pour la prévision des ventes, qui doit s’appuyer en grande partie sur l’historique de données de l’entreprise, comme les tickets de caisse, les prix, les démarches promotionnelles ou encore le trafic en point de vente. Et comme les décisions de notre vie quotidienne, les pronostics sont déduits d’une combinaison entre les schémas appris dans le passé et les paramètres observés au moment de la prévision.

Il existe de nombreuses techniques pour prévoir ses ventes. À côté des multiples méthodes dites “naïves” (ex. la prédiction est égale à la moyenne des ventes des 30 derniers jours), on peut notamment citer les modèles de régression (par exemple linéaires), qui consistent à établir une corrélation entre des variables explicatives et une variable cible afin d’en déduire une tendance. Si ces corrélations peuvent donner des résultats intéressants dans un certain nombre de cas, cette méthode trouve ses limites lorsqu’il s’agit de réduire progressivement l’écart entre les points historiques et la prévision que génère un modèle. Autrement dit, les erreurs du passé forment les erreurs de demain. C’est face à cette limite que le machine learning et les méthodes auto-apprenantes montrent leur utilité.

Les modèles de machine learning s’entraînent à travers des milliers (voire des millions) d’itérations. Au bout de chaque itération, l’algorithme évalue l’écart entre la prévision générée par le modèle et les données réelles issues de l’historique et attache une “pénalité” à cet écart. Cette technique de minimisation de la pénalité présente le grand avantage de pouvoir prendre en compte des objectifs business très précis, comme la maximisation du chiffre d’affaires et des marges ou la minimisation des stocks ou des ruptures. Ce n’est que lorsque le minimum de pénalité est atteint que le modèle sera considéré comme optimal et pourra délivrer les prédictions souhaitées. C’est grâce à ce fonctionnement, orienté par des objectifs précis, que l’algorithme pourra par exemple comprendre que certaines données récentes, ou celles issues d’un même point de vente, sont plus importantes dans la prédiction que des données plus anciennes ou celles provenant de points de ventes plus éloignées.

Quel est l’historique idéal pour une prévision des ventes fiable ?

Par définition, un historique de données issu du monde réel est rempli de fluctuations (et nous ne parlerons ici que des fluctuations liées à l’activité naturelle de l’entreprise et non pas de celles dues à un enregistrement de mauvaise qualité des données). Ces fluctuations peuvent par exemple être liées à une notion de saisonnalité (principalement annuelle, mensuelle, hebdomadaire ou quotidienne). C’est le cas des produits saisonniers comme la crème solaire ou la soupe, mais aussi des produits liés à un évènement du calendrier comme le foie gras à Noël ou les fournitures scolaires. Certaines données peuvent être structurellement fluctuantes, comme les promotions ou les soldes. Enfin, les ventes peuvent également être impactées par de multiples facteurs extérieurs (l’évolution démographique ou économique, un changement de concept de magasin, une pandémie, etc…).

L’algorithme doit donc disposer d’un historique suffisant pour identifier ces fluctuations dans les données à disposition et de différencier leurs composants aléatoires et intrinsèques. De manière générale, on peut s’attendre à une prise en compte satisfaisante des effets de saisonnalité à partir d’un historique de données dépassant 2 ans. Cette temporalité permet en effet d’intégrer les effets de croissance, de saisonnalité ou encore de promotions dans les modèles de prédiction.

Les limites de l’historique dans la prévision des ventes

Une limite importante de la prévision est le fait que les modèles ne peuvent prévoir que ce qu’il connaissent. Il est en effet possible que certains facteurs extérieurs ne soient pas pris en compte dans la modélisation, que cela soit dû à des raisons d’accessibilité des données, qui, dans certains cas, peuvent être difficiles à extraire des systèmes internes ou à collecter, ou simplement à l'inexistence de certaines données. A titre d’exemple, une promotion dans un point de vente situé dans un centre commercial sera fortement impactée par la densité du trafic au sein de ce même point de vente. Pour autant, si le magasin ne dispose pas d’un système de mesure du trafic et si le centre commercial ne partage pas ses chiffres de fréquentation avec ses bailleurs, il sera impossible d’utiliser cette donnée essentielle dans la prévision.

Aussi, et nous l’avions évoqué dans un précédent article, il est également possible qu’un changement de paradigme mène l’historique à ne plus être représentatif du présent. Par exemple, la crise sanitaire liée à la covid-19 ou encore des grèves prolongées peuvent changer brusquement les habitudes de consommation des clients. Il est donc nécessaire de fournir au modèle des variables qui lui permettent d’identifier ce changement de paradigme.

Enfin, une limite importante à l’utilisation de l’historique dans la prévision est l’absence de l’historique pour certains produits. Cette situation peut se produire lors du lancement d’un nouveau produit, l’ouverture d’un point de vente, la création d’un nouveau concept ou encore des conditions de ventes modifiées.

Prenons pour exemple une campagne promotionnelle offrant une réduction de -50% sur une bouteille de lait. Si le point de vente n’a jamais réalisé cette réduction auparavant, il sera difficile pour le modèle de déterminer combien d’unités seront écoulées au cours de la campagne promotionnelle et, à défaut d’apporter des informations supplémentaires, l’algorithme sous-estimera sans doute la quantité vendue lors de cette promotion.

Pour remédier à ce manque d’historique, il est possible de s’appuyer sur des algorithmes complémentaires capables d’estimer la proximité avec d’autres produits dotés d’un historique plus riche. Cela peut se faire en s’appuyant simplement sur la nomenclature produits déjà existante (familles, sous-familles, marques,...) ainsi que sur les propriétés du produit (usage, prix, poids, couleur, etc.), ou bien de manière plus sophistiquée, en rapprochant des produits montrant un comportement client similaire.



Vous souhaitez en savoir plus sur l'utilisation du machine learning pour la prévision des ventes ? Demandez dès maintenant une démo de notre plateforme Verteego.

Être informé(e) des dernières actualités

Recevez nos dernières news directement dans votre boîte mail

Posts similaires