Deep learning : réseaux de neurones et différence avec le ML

Le deep learning (apprentissage profond) est une branche du machine learning qui utilise des réseaux de neurones artificiels à plusieurs couches pour apprendre directement à partir de données brutes comme des images, du son ou du texte. Là où le machine learning classique a besoin qu'on lui prépare les bonnes caractéristiques, le deep learning les découvre lui-même.

Ce guide définit le deep learning, explique comment fonctionne un réseau de neurones (perceptron, couches, fonction d'activation, rétropropagation), le distingue du machine learning classique, présente les grandes familles de réseaux et les frameworks. Il prolonge le hub Machine Learning.

Ce que vous allez apprendre

Définir le deep learning et l'apprentissage profond.
Comprendre le fonctionnement d'un réseau de neurones.
Distinguer machine learning et deep learning, et savoir quand choisir l'un ou l'autre.
Reconnaître les familles CNN, RNN et transformers.
Situer les frameworks PyTorch, TensorFlow et Keras.

Qu'est-ce que le deep learning ?

Le deep learning est un machine learning fondé sur des réseaux de neurones profonds, c'est-à-dire empilant de nombreuses couches. Chaque couche apprend une représentation de plus en plus abstraite : sur une image, les premières couches détectent des contours, les suivantes des formes, puis des objets entiers.

Sa force est de se passer du feature engineering manuel. Sur des données complexes et volumineuses (images, audio, langage), il surpasse largement le machine learning classique. Sa contrepartie : il demande beaucoup de données, beaucoup de calcul (souvent des GPU) et reste difficile à expliquer.

Comment fonctionne un réseau de neurones

Un réseau de neurones artificiel s'inspire de loin du cerveau. Son unité de base est le neurone (ou perceptron) : il reçoit des entrées, les multiplie par des poids, les additionne, puis passe le résultat dans une fonction d'activation qui décide de ce qui est transmis.

Ces neurones sont organisés en couches :

La couche d'entrée reçoit les données.
Les couches cachées transforment l'information, de plus en plus abstraite.
La couche de sortie produit la prédiction.

L'apprentissage se fait par rétropropagation : le réseau compare sa prédiction à la bonne réponse, mesure l'erreur, puis ajuste les poids de chaque neurone pour la réduire, couche après couche. Répété des milliers de fois, ce processus fait converger le réseau vers un modèle performant.

Machine learning ou deep learning ?

Le deep learning n'est pas toujours le bon choix. Le tableau résume quand préférer l'un ou l'autre :

Critère	Machine learning classique	Deep learning
Données	Fonctionne avec peu de données	Exige de grands volumes
Type de données	Tabulaires (fichiers, bases)	Images, son, texte
Caractéristiques	À préparer à la main	Apprises automatiquement
Calcul	CPU suffisant	GPU souvent nécessaire
Explicabilité	Plus facile	Difficile (boîte noire)

En pratique : pour des données tabulaires, un modèle classique comme une régression ou une forêt aléatoire est souvent aussi bon et bien plus simple. Le deep learning s'impose sur les données non structurées (vision, langage, audio).

Les grandes familles de réseaux

Chaque type de données a ses architectures de prédilection :

CNN (réseaux convolutifs) : spécialisés dans les images, ils détectent des motifs visuels locaux. Base de la vision par ordinateur.
RNN et LSTM : conçus pour les séquences (texte, séries temporelles, audio), ils gardent une mémoire du passé.
Transformers : l'architecture qui domine aujourd'hui le langage, socle des grands modèles de langage (LLM) comme ceux derrière les assistants actuels.

Les frameworks du deep learning

On ne code pas un réseau de neurones à la main : des frameworks gèrent les calculs et la rétropropagation.

PyTorch : le plus utilisé en recherche et de plus en plus en production, réputé pour sa souplesse. Voir le guide pratique pour entraîner un premier réseau de neurones.
TensorFlow : la solution de Google, robuste pour le déploiement à grande échelle.
Keras : une surcouche de haut niveau qui simplifie la construction de réseaux, intégrée à TensorFlow.

Pour débuter, l'essentiel est de bien maîtriser le machine learning classique et Python avant de plonger dans ces frameworks.

FAQ : questions fréquentes

Le deep learning, c'est quoi ?

C'est une branche du machine learning qui utilise des réseaux de neurones profonds pour apprendre directement à partir de données brutes comme des images, du son ou du texte, sans préparation manuelle.

Quelle différence entre machine learning et deep learning ?

Le deep learning est un sous-ensemble du machine learning fondé sur des réseaux de neurones à plusieurs couches. Il excelle sur les données non structurées mais exige beaucoup de données et de calcul.

Qu'est-ce qu'un réseau de neurones ?

Un ensemble de neurones organisés en couches, où chaque neurone combine ses entrées pondérées et les passe dans une fonction d'activation. Le réseau apprend en ajustant les poids par rétropropagation.

PyTorch ou TensorFlow ?

PyTorch domine la recherche et gagne en production grâce à sa souplesse ; TensorFlow reste très solide pour le déploiement à grande échelle. Les deux permettent de construire les mêmes réseaux.

À retenir

Le deep learning est un ML fondé sur des réseaux de neurones profonds, qui apprennent les caractéristiques tout seuls.
Un réseau de neurones combine des entrées pondérées via des couches et une fonction d'activation, et apprend par rétropropagation.
ML classique pour les données tabulaires, deep learning pour images, son et texte.
Trois familles : CNN (images), RNN (séquences), transformers (langage).
PyTorch et TensorFlow sont les frameworks de référence.

Prochaines étapes

Machine Learning : les bases Revenir au hub : définition, fonctionnement et parcours.

Types d'apprentissage Situer le deep learning dans les familles du ML.

Data science Le domaine qui englobe ML et deep learning.