Le machine learning, ou apprentissage automatique, permet aux ordinateurs d’apprendre et de s’améliorer de manière autonome grâce à l’analyse de données et à l’identification de modèles. Le machine learning est à l’origine de nombreuses innovations technologiques et scientifiques et a transformé la façon dont nous interagissons avec notre environnement. De quoi s’agit-il au juste ? Quelles sont les différentes approches de machine learning ? Quelles sont ses applications dans les secteurs commercial et marketing ? Zoom sur cette discipline de l’intelligence artificielle qui a permis de grandes avancées technologiques.
Sommaire
Machine learning, c’est quoi ?
1) Définition de l’apprentissage automatique
Le machine learning (ML) est une discipline de l’intelligence artificielle (IA). Elle se concentre sur le développement de systèmes ayant la capacité d’apprendre ou d’optimiser leurs performances à partir des données qu’ils sont amenés à traiter. Ainsi, les technologies de machine learning s’appuient sur la data science. Le machine learning et L’IA sont régulièrement utilisés à tort pour désigner le même concept. Il s’agit pourtant de deux notions distinctes. L’intelligence artificielle regroupe les machines, outils et techniques capables de simuler l’intelligence humaine. Elle couvre donc un large champ de concepts et de disciplines, dont Le machine learning.
De nos jours, pratiquement tous les secteurs ont recours au machine learning. Nous y sommes en effet confrontés sans le savoir dans nos tâches quotidiennes (achats en ligne, interactions avec les banques, utilisation des réseaux sociaux, etc.). Le machine learning et son champ d’expertise n’en sont qu’à leurs prémices. Cette technologie ne cesse de se développer.
2) Le machine learning : fonctionnement
La mise en place d’un modèle de machine learning nécessite de passer par 4 étapes. La data science est au cœur du processus. La supervision et la gestion du projet sont donc généralement assumées par un data scientist. Ce dernier commence par sélectionner et préparer un jeu de données d’entraînement. Ces données serviront à alimenter le modèle de machine learning afin qu’il apprenne à traiter le problème pour lequel il a été créé. Il est possible de soumettre au système des données étiquetées pour lui indiquer les caractéristiques dont il devra tenir compte. Les données peuvent au contraire être non étiquetées. Le modèle devra alors identifier et sélectionner lui-même les éléments récurrents. Dans tous les cas, le big data exige que les données soient correctement triées et nettoyées. Sinon l’apprentissage du système de machine learning risque d’être biaisé, ce qui aura un impact négatif sur la qualité de ses prédictions.
Dans un deuxième temps, le data scientist sélectionne l’algorithme à appliquer sur l’échantillon de données d’apprentissage. Le choix de cet algorithme découle de la quantité et du type de données, ainsi que de la nature du problème à résoudre. La troisième étape correspond à l’entraînement de l’algorithme. Des variables sont utilisées lors de l’exécution de celui-ci. Le data analyst compare ensuite les résultats avec ceux des prédictions. Il peut ainsi ajuster les poids et les biais afin d’affiner le résultat. Ce processus est itératif. En effet, les variables sont exécutées autant de fois que nécessaire, et ce, jusqu’à ce que les résultats s’avèrent majoritairement corrects. Lorsque cet objectif est atteint, l’algorithme est opérationnel et constitue le modèle de machine learning.
La dernière étape consiste à utiliser et à optimiser le modèle. Le système est enrichi par de nouvelles données dont la source est déterminée en fonction du problème à résoudre. Par exemple, un système de machine learning destiné à identifier les spams sera exécuté sur des courriers électroniques.
Les 3 approches du machine learning
1. Machine learning par renforcement
Le machine learning par renforcement fonctionne selon un programme informatique qui doit réaliser un objectif spécifique en interagissant avec un environnement dynamique. Par exemple, lorsque vous devez combattre un ennemi dans un jeu vidéo, le modèle apprenti est soit récompensé, soit pénalisé. De cette manière, il peut déterminer le comportement le plus adéquat en fonction du contexte. Un algorithme Q-learning s’est notamment distingué en 2013 en apprenant à gagner sans intervention humaine dans six jeux vidéos Atari.
On distingue deux types de système d’apprentissage par renforcement :
- le machine learning par différence temporelle (TD) : le système évalue et accorde au programme des récompenses à toutes les étapes ;
- la méthode Monte Carlo : des récompenses sont accordées au terme de l’état final.
Le machine learning par renforcement est principalement exécuté à travers les algorithmes Q-learning, SARSA (State-Action-Reward-State-Action) et Deep Q Network (DQN).
2. Machine learning supervisé
Si le machine learning supervisé repose sur une technologie de base, cette dernière n’en est pas moins rigoureuse. Le data scientist soumet des exemples d’entrées à l’ordinateur et lui présente les sorties souhaitées. Le programme recherche les solutions qui permettront d’obtenir ces sorties selon les entrées qui lui sont proposées. L’objectif consiste pour l’ordinateur à apprendre la règle globale qui régit les entrées et les sorties. Le machine learning supervisé est fréquemment employé dans le cadre de la modélisation prédictive. Cette dernière consiste à réaliser des prédictions à partir de données futures ou indisponibles. L’algorithme tente de concevoir une fonction destinée à prédire avec exactitude la sortie en se basant sur des variables d’entrée. Il peut s’agir par exemple de déduire le prix d’un bien immobilier (la sortie) en se référant à des variables d’entrée comme la superficie, le nombre de pièces, la localisation, etc. Il existe deux types de machine learning supervisé :
- la régression : La variable de sortie correspond à une valeur précise ;
- la classification : La variable de sortie correspond à une catégorie.
3. Machine learning non supervisé
L’apprentissage non supervisé implique que l’algorithme détermine de manière indépendante la nature de l’entrée. On parle également d’« apprentissage des caractéristiques » (ou « feature learning »). Cette méthode peut constituer un objectif à proprement parler ou une façon d’atteindre un objectif spécifique. Par exemple, l’algorithme de reconnaissance faciale prédictive de Facebook est un modèle d’apprentissage non supervisé. Elle consiste à identifier des personnes sur des photos partagées sur la plateforme par les utilisateurs. Deux types d’apprentissage non supervisé existent :
- l’association : il s’agit de déterminer les règles qui serviront à définir de grands ensembles de données ;
- le clustering : le but est d’identifier des regroupements dans les données.
Applications commerciales et intelligence artificielle : le rôle du machine learning
1) Modélisation du taux de perte des clients
Pour une entreprise, il s’avère plus onéreux et chronophage de générer de nouveaux clients que de fidéliser les clients existants. Modéliser la perte des clients permet aux organisations de repérer les clients qui tendent à ne plus acheter leurs produits ou services et à en identifier les causes. L’efficacité d’un modèle de perte de clientèle repose sur le machine learning. Les entreprises obtiennent alors différentes informations précieuses comme le niveau de risque de perte de clients ou encore les raisons de cette perte par ordre d’importance.
La modélisation du taux de perte des clients permet aux entreprises d’optimiser la satisfaction et la fidélisation client en améliorant leurs campagnes marketing ou en ciblant leurs promotions par exemple. Le choix qui s’offre aux consommateurs est vaste. Ils ont en effet la possibilité de comparer les prix à travers une multitude de canaux. Ainsi, la tarification à la demande (ou tarification dynamique) aide les entreprises à rester compétitives. Elle leur permet de proposer des produits à prix flexibles en tenant compte de différents facteurs tels que le degré d’intérêt du client.
Un tel niveau d’agilité implique d’élaborer une stratégie de machine learning. Cela nécessite de disposer de suffisamment de données sur l’engouement que suscite un produit chez les clients ainsi que sur leur disposition à payer pour l’obtenir. La conception des modèles de tarification dynamique se révèle très complexe. Néanmoins, des entreprises comme des sociétés de services de covoiturage ou des compagnies aériennes sont parvenues à accroître leurs revenus en développant cette stratégie.
À lire aussi: Taux d’attrition.
2) Modélisation de la valeur vie client
La modélisation de la valeur vie client s’avère indispensable pour les e-commerces. Elle se révèle également dans d’autres secteurs. Ce modèle consiste à utiliser des algorithmes de machine learning pour repérer et comprendre les clients qui ont une forte valeur pour l’entreprise. L’objectif de la modélisation de la valeur du cycle de vie des clients est de fidéliser ce type de client. Ces programmes analysent de grands volumes de données dans le but d’identifier les meilleurs clients, les principaux ambassadeurs de la marque ou une combinaison de ces deux caractéristiques.
Les modèles de la valeur vie client permettent notamment de déterminer le chiffre d’affaires susceptible d’être généré par un futur client sur une période précise. Les entreprises sont ainsi en mesure de répartir leurs efforts marketing en fonction de la valeur ajoutée que représente un client. Elles peuvent alors concentrer leurs investissements sur l’acquisition de leads ayant les mêmes caractéristiques que leurs clients à forte valeur ajoutée.
3) Ciblage des clients par segmentation
Pour qu’une campagne marketing soit réussie, il est essentiel de proposer le bon produit au bon moment et à un public qualifié. Encore récemment, les marketeurs faisaient en partie confiance à leur intuition pour segmenter la clientèle afin de mettre en place des campagnes ciblées. Désormais, grâce au machine learning, les data scientists peuvent utiliser des algorithmes de classification et de clustering. Le but est de catégoriser les clients en personnalités selon des caractéristiques spécifiques. Ces personnalités tiennent compte de plusieurs facteurs tels que le comportement en ligne, les caractéristiques démographiques, les centres d’intérêt, etc. En combinant ces facteurs à des modèles de comportement d’achat, les sociétés parviennent à élaborer des campagnes marketing ultra-personnalisées qui leur permettent d’accroître leurs ventes. Plus les entreprises disposent de données, plus les algorithmes développés sont sophistiqués. Il est alors possible de lancer des campagnes de plus en plus personnalisées.
4) La catégorisation des images
Les algorithmes de machine learning sont également utilisés dans le cadre de la classification des images. Le système attribue une étiquette à une image sur la base d’un ensemble donné de catégories. Ce modèle de machine learning offre de multiples possibilités :
- Simplifier le processus de marquage des photos sur les réseaux sociaux ;
- Modéliser des plans de construction 3D en s’appuyant sur des plans de construction 2D ;
- Etayer des diagnostics médicaux ;
- etc.
La classification des images fait régulièrement appel au deep learning et notamment aux réseaux de neurones. Ces technologies permettent de distinguer de manière efficace les caractéristiques intéressantes d’une image, et ce, malgré la présence d’éléments supplémentaires. Il peut s’agir de différences d’éclairage, de points de vue, d’échelle, etc. Le modèle compense ces complications afin de délivrer des résultats qualitatifs et pertinents.