
Le choix d'un framework d'agents engage un projet pour longtemps : il décide de la façon de structurer le code, de tester, de déboguer. En 2026, six frameworks Python dominent — LangGraph, PydanticAI, smolagents, CrewAI, AutoGen et l'OpenAI Agents SDK —, et ils ne visent pas le même besoin. Ce guide donne une grille d'analyse — licence, maturité, typage, multi-agents, support MCP, observabilité, expérience de développement —, un tableau comparatif des six, et une recommandation par cas d'usage. Vous verrez aussi comment mener un benchmark honnête plutôt que de choisir sur la réputation. Public visé : développeur ayant pratiqué au moins un framework d'agents et devant arbitrer pour un projet.
Ce que vous allez apprendre
Section intitulée « Ce que vous allez apprendre »- La grille d'analyse pour évaluer un framework d'agents.
- Le positionnement des six frameworks majeurs de 2026.
- Le tableau comparatif synthétique.
- Comment mener un benchmark honnête entre frameworks.
- Quel framework choisir selon le cas d'usage.
Recommandation rapide
Section intitulée « Recommandation rapide »Si vous deviez choisir sans lire le reste, voici la table de décision.
| Votre besoin | Framework recommandé |
|---|---|
| Parcours complexe, état durable, validation humaine | LangGraph |
| Sortie typée, code minimal, intégration FastAPI | PydanticAI |
| Tâches calculatoires, l'agent écrit du code | smolagents |
| Prototype multi-agents rapide, rôles métier | CrewAI |
| Agents conversationnels qui dialoguent | AutoGen |
| Projet 100 % écosystème OpenAI, mise en place express | OpenAI Agents SDK |
Ces recommandations sont des points de départ, pas des verdicts. La suite explique les critères qui les fondent — pour que vous puissiez arbitrer sur votre contexte.
La grille d'analyse
Section intitulée « La grille d'analyse »Comparer des frameworks « au feeling » mène à de mauvais choix. Sept critères structurent une évaluation sérieuse.
La licence conditionne l'usage en entreprise : la plupart sont permissifs (MIT, Apache 2.0), mais il faut le vérifier. La maturité — âge, fréquence des versions, taille de la communauté — pèse sur la stabilité de l'API et la disponibilité de l'aide. Le typage mesure à quel point le framework s'appuie sur les types Python : un atout pour la fiabilité et l'outillage.
Le support multi-agents dit si le framework orchestre nativement plusieurs agents, ou s'il faut le bâtir soi-même. Le support MCP indique s'il consomme les serveurs du Model Context Protocol — un standard d'outils qui prend de l'ampleur. L'observabilité évalue la facilité à tracer ce que fait l'agent — indispensable en production. Enfin, l'expérience de développement (DX) — clarté de l'API, qualité de la documentation, courbe d'apprentissage — décide du confort au quotidien.
Les six frameworks en détail
Section intitulée « Les six frameworks en détail »Chaque framework a une philosophie ; c'est elle, plus que la liste de fonctionnalités, qui doit guider le choix.
LangGraph
Section intitulée « LangGraph »LangGraph modélise un agent comme un graphe d'états. C'est le framework du contrôle explicite : parcours dessiné nœud par nœud, état durable via checkpointer, validation humaine native. Il a dépassé CrewAI en popularité début 2026, porté par l'adoption en entreprise. C'est le choix par défaut pour des agents de production qui demandent état durable, branchements conditionnels ou points de reprise — au prix d'une courbe d'apprentissage plus marquée.
PydanticAI
Section intitulée « PydanticAI »PydanticAI vient de l'équipe de Pydantic, la bibliothèque de validation qui sous-tend FastAPI. Sa marque de fabrique : le typage strict et une abstraction minimale. La sortie d'un agent est un modèle Pydantic validé, pas du texte. C'est le choix pour qui veut du code prévisible et testable, et une intégration naturelle dans une application Python typée.
smolagents
Section intitulée « smolagents »smolagents, maintenu par Hugging Face, est bâti autour des agents-code : le modèle écrit du Python plutôt que du JSON. Mise en place rapide, expressivité du code pour les tâches calculatoires. C'est le choix pour l'analyse de données et les tâches qui sont, par nature, du code — avec la contrainte d'isoler l'exécution.
CrewAI propose une abstraction de haut niveau : des « équipes » (crews) d'agents aux rôles métier distincts, qui se partagent un contexte. C'est le framework le plus rapide pour aboutir à un prototype multi-agents lisible. La contrepartie d'une abstraction haute : un contrôle plus indirect sur le déroulé exact.
AutoGen, de Microsoft, met l'accent sur la conversation entre agents : des agents qui dialoguent jusqu'à un accord. Il a atteint sa version 1.0. C'est le choix pour les systèmes où la résolution émerge d'un échange entre agents, plutôt que d'un parcours figé.
OpenAI Agents SDK
Section intitulée « OpenAI Agents SDK »L'OpenAI Agents SDK, sorti en 2025, a remplacé le projet expérimental Swarm. Son abstraction centrale est le handoff : un agent passe explicitement la main à un autre. Mise en place très rapide, mais le SDK est centré sur les modèles OpenAI — les autres modèles passent par une extension — et n'offre pas de checkpointing intégré pour les tâches longues.
Tableau comparatif
Section intitulée « Tableau comparatif »La synthèse des sept critères. Les évaluations sont qualitatives : elles situent, elles ne notent pas.
| Critère | LangGraph | PydanticAI | smolagents | CrewAI | AutoGen | OpenAI SDK |
|---|---|---|---|---|---|---|
| Licence | MIT | MIT | Apache 2.0 | MIT | MIT | MIT |
| Modèle mental | Graphe d'états | Agent typé | Agent-code | Équipes de rôles | Conversation | Handoffs |
| Typage | Moyen | Fort | Moyen | Moyen | Moyen | Moyen |
| Multi-agents | Natif | Manuel | Natif | Natif | Natif | Natif |
| Support MCP | Oui | Oui | Oui | Oui | Oui | Oui |
| Modèles | Tous | Tous | Tous | Tous | Tous | OpenAI d'abord |
| Courbe | Marquée | Douce | Douce | Douce | Moyenne | Douce |
| Terrain de prédilection | Production, état | Code typé | Tâches-code | Prototype multi-agents | Agents en dialogue | Écosystème OpenAI |
Aucune ligne ne fait gagner un framework à elle seule. Un projet qui a besoin d'état durable regarde la ligne « modèle mental » ; un projet multi-modèles regarde la ligne « modèles » ; une équipe pressée regarde la « courbe ».
Comment mener un benchmark honnête
Section intitulée « Comment mener un benchmark honnête »La réputation est un mauvais guide. Avant d'engager un projet, mesurez — et mesurez bien.
Le principe est celui du guide sur les patterns : une tâche identique, une métrique objective. Implémentez le même agent — mêmes outils, même modèle, même tâche — dans les frameworks finalistes, puis comparez sur des critères mesurables : la tâche est-elle réussie ? combien de lignes de code ? combien d'appels au modèle ? quelle latence ?
Trois pièges à éviter. Tester sur une tâche jouet : un « hello world » ne révèle rien des vraies différences — prenez une tâche proche de votre cas réel. Oublier le coût : un framework qui réussit en dix appels de modèle là où un autre en utilise trois n'est pas équivalent. Négliger le débogage : mesurez aussi le temps qu'il faut pour comprendre un échec — c'est lui qui pèsera en production.
Quel framework pour quel cas
Section intitulée « Quel framework pour quel cas »La décision se ramène à quelques questions nettes.
Le parcours de l'agent est-il complexe, avec de l'état à conserver et des points de validation humaine ? LangGraph. Voulez-vous avant tout une sortie typée et du code qui s'intègre à une application Python existante ? PydanticAI. La tâche est-elle calculatoire — analyser, transformer, tracer ? smolagents.
Cherchez-vous à monter vite un prototype où plusieurs agents jouent des rôles métier ? CrewAI. Le problème se résout-il par un dialogue entre agents ? AutoGen. Travaillez-vous exclusivement dans l'écosystème OpenAI et voulez-vous démarrer en quelques minutes ? l'OpenAI Agents SDK.
Et une option trop vite écartée : pas de framework. Pour un agent simple, la boucle écrite à la main — celle du premier guide — reste la solution la plus lisible et la plus légère. Un framework se justifie quand il résout un problème que vous avez réellement : état, typage, multi-agents. Pas avant.
À retenir
Section intitulée « À retenir »- Le choix d'un framework s'évalue sur sept critères : licence, maturité, typage, multi-agents, MCP, observabilité, DX.
- LangGraph pour l'état et la production ; PydanticAI pour le typage ; smolagents pour les tâches-code.
- CrewAI pour le prototype multi-agents ; AutoGen pour les agents en dialogue ; OpenAI SDK pour l'écosystème OpenAI.
- Le support MCP est désormais généralisé — il ne départage plus les frameworks.
- Choisir, c'est benchmarker : même tâche, métriques objectives, coût et débogage compris.
- Pas de framework reste une option valable pour un agent simple.
Prochaines étapes
Section intitulée « Prochaines étapes »Pour aller plus loin
Section intitulée « Pour aller plus loin »- Documentation LangGraph — le framework du graphe d'états.
- Documentation PydanticAI — le framework typé de l'équipe Pydantic.
- Documentation smolagents — les agents-code de Hugging Face.