Aller au contenu
MLOps medium

Types d'apprentissage automatique : supervisé et non supervisé

6 min de lecture

Le machine learning se divise en trois grandes familles selon la façon dont l'algorithme apprend : l'apprentissage supervisé (à partir de données étiquetées), non supervisé (sans étiquettes) et par renforcement (par essais et erreurs). Choisir la bonne famille dépend d'une seule question : disposez-vous d'exemples déjà « corrigés » de ce que vous voulez prédire ?

Ce guide définit chaque type d'apprentissage, donne un exemple concret, cite les algorithmes associés et leurs cas d'usage, puis explique comment choisir. Il complète le hub Machine Learning.

  • Distinguer apprentissage supervisé, non supervisé et par renforcement.
  • Associer chaque famille à ses algorithmes et cas d'usage.
  • Reconnaître le cas particulier de l'apprentissage semi-supervisé.
  • Choisir le bon type selon vos données et votre objectif.

Dans l'apprentissage supervisé, vous fournissez à l'algorithme des données déjà étiquetées : chaque exemple est accompagné de la bonne réponse. C'est un professeur qui corrige les devoirs d'un élève jusqu'à ce qu'il généralise.

Exemple concret : pour prédire le prix d'une maison, vous donnez des données historiques (surface, nombre de pièces, quartier) et les prix réels correspondants. L'algorithme apprend la relation, puis estime le prix de nouvelles maisons.

Le supervisé se scinde en deux problèmes selon la nature de la réponse :

  • Régression : prédire une valeur continue (prix, température, durée). Algorithmes : régression linéaire, arbres de régression.
  • Classification : prédire une catégorie (spam ou non, malade ou sain). Algorithmes : régression logistique, k plus proches voisins, forêts aléatoires.

Cas d'usage courants : détection de spam, diagnostic médical assisté, prévision de ventes, notation de crédit.

Dans l'apprentissage non supervisé, les données n'ont pas d'étiquettes. L'algorithme explore seul et fait émerger des structures cachées, sans qu'on lui dise quoi chercher.

Exemple concret : à partir d'une base de clients, l'algorithme regroupe automatiquement ceux qui ont des comportements similaires (segmentation), sans consigne préalable.

Les deux tâches principales sont :

  • Clustering : regrouper les données par similarité (k-means, DBSCAN).
  • Réduction de dimension : simplifier des données complexes en gardant l'essentiel (PCA), utile pour visualiser ou accélérer un modèle.

Cas d'usage courants : segmentation marketing, détection d'anomalies bancaires, moteurs de recommandation, compression de données.

C'est la distinction la plus importante en pratique, et elle tient à une seule question : disposez-vous d'étiquettes ? Ce comparatif résume tout :

CritèreSuperviséNon supervisé
DonnéesÉtiquetées (réponse connue)Non étiquetées
ObjectifPrédire une valeur ou une classeDécouvrir des structures cachées
Tâches typesRégression, classificationClustering, réduction de dimension
ÉvaluationSimple (comparaison à la vérité)Difficile (pas de vérité de référence)
ExemplesSpam, prix, diagnosticSegmentation, anomalies

En résumé, le supervisé répond à « quelle est la bonne réponse ? » quand vous la connaissez déjà sur vos exemples, tandis que le non supervisé répond à « quelles structures existent dans ces données ? » sans réponse préétablie.

L'apprentissage par renforcement fonctionne comme le dressage : l'agent reçoit une récompense quand il agit bien, une pénalité quand il se trompe, et optimise sa stratégie par essais et erreurs.

Exemple concret : un robot qui apprend à marcher essaie des mouvements, tombe, se relève, et découvre peu à peu la séquence qui fonctionne le mieux.

Cas d'usage courants : robots autonomes, jeux (AlphaGo), véhicules autonomes, optimisation de systèmes complexes. C'est la famille la plus exigeante en calcul et la moins fréquente chez les débutants.

Le choix découle directement de vos données et de votre objectif :

Votre situationType d'apprentissage
J'ai des exemples étiquetés et je veux prédire une valeur ou une classeSupervisé
J'ai des données sans étiquettes et je cherche des groupes ou des anomaliesNon supervisé
Peu d'étiquettes, beaucoup de données brutesSemi-supervisé
Un agent doit apprendre à décider dans un environnementPar renforcement

Pour un premier projet, visez l'apprentissage supervisé : il est le plus concret, le mieux outillé, et scikit-learn permet d'entraîner un modèle en quelques lignes.

  1. Trois familles : supervisé (données étiquetées), non supervisé (sans étiquettes), par renforcement (essais et erreurs).
  2. Le supervisé se divise en régression (valeur) et classification (catégorie).
  3. Le non supervisé fait du clustering et de la réduction de dimension.
  4. Le semi-supervisé comble le manque d'étiquettes quand l'annotation coûte cher.
  5. Débutez par le supervisé : le plus accessible et le plus courant.

Ce site vous est utile ?

Sachez que moins de 1% des lecteurs soutiennent ce site.

Je maintiens +700 guides gratuits, sans pub ni tracking. Un soutien, même symbolique, m'aide à couvrir l'hébergement et à garder ces ressources gratuites. Merci pour votre appui.

Le formulaire ne s'affiche pas ? Ouvrir Ko-fi dans un onglet.

Abonnez-vous et suivez mon actualité DevSecOps sur LinkedIn