Le deep learning (apprentissage profond) est une branche du machine learning qui utilise des réseaux de neurones artificiels à plusieurs couches pour apprendre directement à partir de données brutes comme des images, du son ou du texte. Là où le machine learning classique a besoin qu'on lui prépare les bonnes caractéristiques, le deep learning les découvre lui-même.
Ce guide définit le deep learning, explique comment fonctionne un réseau de neurones (perceptron, couches, fonction d'activation, rétropropagation), le distingue du machine learning classique, présente les grandes familles de réseaux et les frameworks. Il prolonge le hub Machine Learning.
Ce que vous allez apprendre
Section intitulée « Ce que vous allez apprendre »- Définir le deep learning et l'apprentissage profond.
- Comprendre le fonctionnement d'un réseau de neurones.
- Distinguer machine learning et deep learning, et savoir quand choisir l'un ou l'autre.
- Reconnaître les familles CNN, RNN et transformers.
- Situer les frameworks PyTorch, TensorFlow et Keras.
Qu'est-ce que le deep learning ?
Section intitulée « Qu'est-ce que le deep learning ? »Le deep learning est un machine learning fondé sur des réseaux de neurones profonds, c'est-à-dire empilant de nombreuses couches. Chaque couche apprend une représentation de plus en plus abstraite : sur une image, les premières couches détectent des contours, les suivantes des formes, puis des objets entiers.
Sa force est de se passer du feature engineering manuel. Sur des données complexes et volumineuses (images, audio, langage), il surpasse largement le machine learning classique. Sa contrepartie : il demande beaucoup de données, beaucoup de calcul (souvent des GPU) et reste difficile à expliquer.
Comment fonctionne un réseau de neurones
Section intitulée « Comment fonctionne un réseau de neurones »Un réseau de neurones artificiel s'inspire de loin du cerveau. Son unité de base est le neurone (ou perceptron) : il reçoit des entrées, les multiplie par des poids, les additionne, puis passe le résultat dans une fonction d'activation qui décide de ce qui est transmis.
Ces neurones sont organisés en couches :
- La couche d'entrée reçoit les données.
- Les couches cachées transforment l'information, de plus en plus abstraite.
- La couche de sortie produit la prédiction.
L'apprentissage se fait par rétropropagation : le réseau compare sa prédiction à la bonne réponse, mesure l'erreur, puis ajuste les poids de chaque neurone pour la réduire, couche après couche. Répété des milliers de fois, ce processus fait converger le réseau vers un modèle performant.
Machine learning ou deep learning ?
Section intitulée « Machine learning ou deep learning ? »Le deep learning n'est pas toujours le bon choix. Le tableau résume quand préférer l'un ou l'autre :
| Critère | Machine learning classique | Deep learning |
|---|---|---|
| Données | Fonctionne avec peu de données | Exige de grands volumes |
| Type de données | Tabulaires (fichiers, bases) | Images, son, texte |
| Caractéristiques | À préparer à la main | Apprises automatiquement |
| Calcul | CPU suffisant | GPU souvent nécessaire |
| Explicabilité | Plus facile | Difficile (boîte noire) |
En pratique : pour des données tabulaires, un modèle classique comme une régression ou une forêt aléatoire est souvent aussi bon et bien plus simple. Le deep learning s'impose sur les données non structurées (vision, langage, audio).
Les grandes familles de réseaux
Section intitulée « Les grandes familles de réseaux »Chaque type de données a ses architectures de prédilection :
- CNN (réseaux convolutifs) : spécialisés dans les images, ils détectent des motifs visuels locaux. Base de la vision par ordinateur.
- RNN et LSTM : conçus pour les séquences (texte, séries temporelles, audio), ils gardent une mémoire du passé.
- Transformers : l'architecture qui domine aujourd'hui le langage, socle des grands modèles de langage (LLM) comme ceux derrière les assistants actuels.
Les frameworks du deep learning
Section intitulée « Les frameworks du deep learning »On ne code pas un réseau de neurones à la main : des frameworks gèrent les calculs et la rétropropagation.
- PyTorch : le plus utilisé en recherche et de plus en plus en production, réputé pour sa souplesse. Voir le guide pratique pour entraîner un premier réseau de neurones.
- TensorFlow : la solution de Google, robuste pour le déploiement à grande échelle.
- Keras : une surcouche de haut niveau qui simplifie la construction de réseaux, intégrée à TensorFlow.
Pour débuter, l'essentiel est de bien maîtriser le machine learning classique et Python avant de plonger dans ces frameworks.
Questions fréquentes
Section intitulée « Questions fréquentes »Le deep learning, c'est quoi ?
Section intitulée « Le deep learning, c'est quoi ? »C'est une branche du machine learning qui utilise des réseaux de neurones profonds pour apprendre directement à partir de données brutes comme des images, du son ou du texte, sans préparation manuelle des caractéristiques.
Quelle différence entre machine learning et deep learning ?
Section intitulée « Quelle différence entre machine learning et deep learning ? »Le deep learning est un sous-ensemble du machine learning qui repose sur des réseaux de neurones à plusieurs couches. Il excelle sur les données non structurées mais exige beaucoup de données et de calcul ; le ML classique suffit pour les données tabulaires.
Qu'est-ce qu'un réseau de neurones ?
Section intitulée « Qu'est-ce qu'un réseau de neurones ? »Un ensemble de neurones organisés en couches, où chaque neurone combine ses entrées pondérées et les passe dans une fonction d'activation. Le réseau apprend en ajustant les poids par rétropropagation.
PyTorch ou TensorFlow ?
Section intitulée « PyTorch ou TensorFlow ? »PyTorch domine la recherche et gagne en production grâce à sa souplesse ; TensorFlow reste très solide pour le déploiement à grande échelle. Les deux permettent de construire les mêmes réseaux.
À retenir
Section intitulée « À retenir »- Le deep learning est un ML fondé sur des réseaux de neurones profonds, qui apprennent les caractéristiques tout seuls.
- Un réseau de neurones combine des entrées pondérées via des couches et une fonction d'activation, et apprend par rétropropagation.
- ML classique pour les données tabulaires, deep learning pour images, son et texte.
- Trois familles : CNN (images), RNN (séquences), transformers (langage).
- PyTorch et TensorFlow sont les frameworks de référence.