Types d'apprentissage automatique : supervisé et non supervisé

Le machine learning se divise en trois grandes familles selon la façon dont l'algorithme apprend : l'apprentissage supervisé (à partir de données étiquetées), non supervisé (sans étiquettes) et par renforcement (par essais et erreurs). Choisir la bonne famille dépend d'une seule question : disposez-vous d'exemples déjà « corrigés » de ce que vous voulez prédire ?

Ce guide définit chaque type d'apprentissage, donne un exemple concret, cite les algorithmes associés et leurs cas d'usage, puis explique comment choisir. Il complète le hub Machine Learning.

Ce que vous allez apprendre

Distinguer apprentissage supervisé, non supervisé et par renforcement.
Associer chaque famille à ses algorithmes et cas d'usage.
Reconnaître le cas particulier de l'apprentissage semi-supervisé.
Choisir le bon type selon vos données et votre objectif.

Apprentissage supervisé

Dans l'apprentissage supervisé, vous fournissez à l'algorithme des données déjà étiquetées : chaque exemple est accompagné de la bonne réponse. C'est un professeur qui corrige les devoirs d'un élève jusqu'à ce qu'il généralise.

Exemple concret : pour prédire le prix d'une maison, vous donnez des données historiques (surface, nombre de pièces, quartier) et les prix réels correspondants. L'algorithme apprend la relation, puis estime le prix de nouvelles maisons.

Le supervisé se scinde en deux problèmes selon la nature de la réponse :

Régression : prédire une valeur continue (prix, température, durée). Algorithmes : régression linéaire, arbres de régression.
Classification : prédire une catégorie (spam ou non, malade ou sain). Algorithmes : régression logistique, k plus proches voisins, forêts aléatoires.

Cas d'usage courants : détection de spam, diagnostic médical assisté, prévision de ventes, notation de crédit.

Apprentissage non supervisé

Dans l'apprentissage non supervisé, les données n'ont pas d'étiquettes. L'algorithme explore seul et fait émerger des structures cachées, sans qu'on lui dise quoi chercher.

Exemple concret : à partir d'une base de clients, l'algorithme regroupe automatiquement ceux qui ont des comportements similaires (segmentation), sans consigne préalable.

Les deux tâches principales sont :

Clustering : regrouper les données par similarité (k-means, DBSCAN).
Réduction de dimension : simplifier des données complexes en gardant l'essentiel (PCA), utile pour visualiser ou accélérer un modèle.

Cas d'usage courants : segmentation marketing, détection d'anomalies bancaires, moteurs de recommandation, compression de données.

Apprentissage supervisé ou non supervisé ?

C'est la distinction la plus importante en pratique, et elle tient à une seule question : disposez-vous d'étiquettes ? Ce comparatif résume tout :

Critère	Supervisé	Non supervisé
Données	Étiquetées (réponse connue)	Non étiquetées
Objectif	Prédire une valeur ou une classe	Découvrir des structures cachées
Tâches types	Régression, classification	Clustering, réduction de dimension
Évaluation	Simple (comparaison à la vérité)	Difficile (pas de vérité de référence)
Exemples	Spam, prix, diagnostic	Segmentation, anomalies

En résumé, le supervisé répond à « quelle est la bonne réponse ? » quand vous la connaissez déjà sur vos exemples, tandis que le non supervisé répond à « quelles structures existent dans ces données ? » sans réponse préétablie.

Apprentissage par renforcement

L'apprentissage par renforcement fonctionne comme le dressage : l'agent reçoit une récompense quand il agit bien, une pénalité quand il se trompe, et optimise sa stratégie par essais et erreurs.

Exemple concret : un robot qui apprend à marcher essaie des mouvements, tombe, se relève, et découvre peu à peu la séquence qui fonctionne le mieux.

Cas d'usage courants : robots autonomes, jeux (AlphaGo), véhicules autonomes, optimisation de systèmes complexes. C'est la famille la plus exigeante en calcul et la moins fréquente chez les débutants.

Comment choisir le bon type

Le choix découle directement de vos données et de votre objectif :

Votre situation	Type d'apprentissage
J'ai des exemples étiquetés et je veux prédire une valeur ou une classe	Supervisé
J'ai des données sans étiquettes et je cherche des groupes ou des anomalies	Non supervisé
Peu d'étiquettes, beaucoup de données brutes	Semi-supervisé
Un agent doit apprendre à décider dans un environnement	Par renforcement

Pour un premier projet, visez l'apprentissage supervisé : il est le plus concret, le mieux outillé, et scikit-learn permet d'entraîner un modèle en quelques lignes.

À retenir

Trois familles : supervisé (données étiquetées), non supervisé (sans étiquettes), par renforcement (essais et erreurs).
Le supervisé se divise en régression (valeur) et classification (catégorie).
Le non supervisé fait du clustering et de la réduction de dimension.
Le semi-supervisé comble le manque d'étiquettes quand l'annotation coûte cher.
Débutez par le supervisé : le plus accessible et le plus courant.

Prochaines étapes

Machine Learning : les bases Revenir au hub : définition, fonctionnement et parcours.

Installer Conda Préparer un environnement Python isolé pour vos modèles.

Premier notebook Jupyter Explorer données et modèles de façon interactive.