Le machine learning se divise en trois grandes familles selon la façon dont l'algorithme apprend : l'apprentissage supervisé (à partir de données étiquetées), non supervisé (sans étiquettes) et par renforcement (par essais et erreurs). Choisir la bonne famille dépend d'une seule question : disposez-vous d'exemples déjà « corrigés » de ce que vous voulez prédire ?
Ce guide définit chaque type d'apprentissage, donne un exemple concret, cite les algorithmes associés et leurs cas d'usage, puis explique comment choisir. Il complète le hub Machine Learning.
Ce que vous allez apprendre
Section intitulée « Ce que vous allez apprendre »- Distinguer apprentissage supervisé, non supervisé et par renforcement.
- Associer chaque famille à ses algorithmes et cas d'usage.
- Reconnaître le cas particulier de l'apprentissage semi-supervisé.
- Choisir le bon type selon vos données et votre objectif.
Apprentissage supervisé
Section intitulée « Apprentissage supervisé »Dans l'apprentissage supervisé, vous fournissez à l'algorithme des données déjà étiquetées : chaque exemple est accompagné de la bonne réponse. C'est un professeur qui corrige les devoirs d'un élève jusqu'à ce qu'il généralise.
Exemple concret : pour prédire le prix d'une maison, vous donnez des données historiques (surface, nombre de pièces, quartier) et les prix réels correspondants. L'algorithme apprend la relation, puis estime le prix de nouvelles maisons.
Le supervisé se scinde en deux problèmes selon la nature de la réponse :
- Régression : prédire une valeur continue (prix, température, durée). Algorithmes : régression linéaire, arbres de régression.
- Classification : prédire une catégorie (spam ou non, malade ou sain). Algorithmes : régression logistique, k plus proches voisins, forêts aléatoires.
Cas d'usage courants : détection de spam, diagnostic médical assisté, prévision de ventes, notation de crédit.
Apprentissage non supervisé
Section intitulée « Apprentissage non supervisé »Dans l'apprentissage non supervisé, les données n'ont pas d'étiquettes. L'algorithme explore seul et fait émerger des structures cachées, sans qu'on lui dise quoi chercher.
Exemple concret : à partir d'une base de clients, l'algorithme regroupe automatiquement ceux qui ont des comportements similaires (segmentation), sans consigne préalable.
Les deux tâches principales sont :
- Clustering : regrouper les données par similarité (k-means, DBSCAN).
- Réduction de dimension : simplifier des données complexes en gardant l'essentiel (PCA), utile pour visualiser ou accélérer un modèle.
Cas d'usage courants : segmentation marketing, détection d'anomalies bancaires, moteurs de recommandation, compression de données.
Apprentissage supervisé ou non supervisé ?
Section intitulée « Apprentissage supervisé ou non supervisé ? »C'est la distinction la plus importante en pratique, et elle tient à une seule question : disposez-vous d'étiquettes ? Ce comparatif résume tout :
| Critère | Supervisé | Non supervisé |
|---|---|---|
| Données | Étiquetées (réponse connue) | Non étiquetées |
| Objectif | Prédire une valeur ou une classe | Découvrir des structures cachées |
| Tâches types | Régression, classification | Clustering, réduction de dimension |
| Évaluation | Simple (comparaison à la vérité) | Difficile (pas de vérité de référence) |
| Exemples | Spam, prix, diagnostic | Segmentation, anomalies |
En résumé, le supervisé répond à « quelle est la bonne réponse ? » quand vous la connaissez déjà sur vos exemples, tandis que le non supervisé répond à « quelles structures existent dans ces données ? » sans réponse préétablie.
Apprentissage par renforcement
Section intitulée « Apprentissage par renforcement »L'apprentissage par renforcement fonctionne comme le dressage : l'agent reçoit une récompense quand il agit bien, une pénalité quand il se trompe, et optimise sa stratégie par essais et erreurs.
Exemple concret : un robot qui apprend à marcher essaie des mouvements, tombe, se relève, et découvre peu à peu la séquence qui fonctionne le mieux.
Cas d'usage courants : robots autonomes, jeux (AlphaGo), véhicules autonomes, optimisation de systèmes complexes. C'est la famille la plus exigeante en calcul et la moins fréquente chez les débutants.
Comment choisir le bon type
Section intitulée « Comment choisir le bon type »Le choix découle directement de vos données et de votre objectif :
| Votre situation | Type d'apprentissage |
|---|---|
| J'ai des exemples étiquetés et je veux prédire une valeur ou une classe | Supervisé |
| J'ai des données sans étiquettes et je cherche des groupes ou des anomalies | Non supervisé |
| Peu d'étiquettes, beaucoup de données brutes | Semi-supervisé |
| Un agent doit apprendre à décider dans un environnement | Par renforcement |
Pour un premier projet, visez l'apprentissage supervisé : il est le plus concret, le mieux outillé, et scikit-learn permet d'entraîner un modèle en quelques lignes.
À retenir
Section intitulée « À retenir »- Trois familles : supervisé (données étiquetées), non supervisé (sans étiquettes), par renforcement (essais et erreurs).
- Le supervisé se divise en régression (valeur) et classification (catégorie).
- Le non supervisé fait du clustering et de la réduction de dimension.
- Le semi-supervisé comble le manque d'étiquettes quand l'annotation coûte cher.
- Débutez par le supervisé : le plus accessible et le plus courant.