Aller au contenu
Documentation high

Documenter : créer une documentation qui survit

11 min de lecture

Imaginez : il est 2h du matin. Votre téléphone sonne. Alerte critique sur le service de paiement. Vous vous connectez, le cœur battant. Et là, la question fatidique : “Comment on redémarre ce truc, déjà ?”

Vous cherchez dans le wiki. Rien. Vous fouillez Slack. Des bribes d’info datant de 2022. Vous appelez Jean-Pierre, le seul qui sait. Il ne répond pas — il est en vacances.

Ce cauchemar a un nom : l’absence de documentation.

Ce n’est pas un problème de paresse. C’est un problème systémique. Les équipes qui documentent mal ne sont pas incompétentes — elles n’ont simplement pas la bonne méthode.

À la fin de ce parcours, vous saurez :

  1. Comprendre pourquoi la documentation est un outil de survie, pas une corvée
  2. Structurer votre documentation en 5 familles distinctes
  3. Créer les documents essentiels : Service Overviews, runbooks, postmortems
  4. Gouverner : définir qui maintient quoi, et à quelle fréquence
  5. Choisir les bons outils et évaluer votre maturité

Ce parcours est progressif. Chaque étape s’appuie sur la précédente.

Vous êtes au bon endroit si vous êtes :

  • SRE ou ops gérant des systèmes en production
  • Tech Lead voulant structurer la documentation de l’équipe
  • Développeur fatigué de chercher l’info pendant les incidents
  • Manager souhaitant réduire le “bus factor” de l’équipe

Prérequis :

  • Avoir un système en production (même petit)
  • Connaître les bases de Git (commits, branches)
  • Être prêt à investir du temps maintenant pour en gagner plus tard

Ce parcours suit une progression logique en 5 étapes :

Parcours documentation en 5 étapes : Pourquoi, Gouverner, Structurer, Créer, Choisir

Durée totale estimée : environ 3 heures de lecture active.


Étape 1 — Pourquoi documenter (et ce que ça change)

Section intitulée « Étape 1 — Pourquoi documenter (et ce que ça change) »

Avant de définir une organisation, comprenons pourquoi la documentation est un investissement, pas une perte de temps.

Personne n’aime payer une assurance incendie. C’est de l’argent “perdu” tant que tout va bien. Mais le jour où le feu se déclare, vous êtes content de l’avoir.

La documentation, c’est pareil.

SituationSans documentationAvec documentation
Incident à 3h du matin”J’appelle Jean-Pierre""Je suis le runbook”
Nouveau dans l’équipe3 semaines pour être autonome3 jours + questions ciblées
Départ d’un expertPanique, perte de savoirTransition sereine
Audit de sécurité”Euh… je crois que…""Voici notre documentation”

Le bus factor mesure combien de personnes peuvent disparaître avant que l’équipe soit bloquée.

  • Bus factor = 1 → une seule personne détient l’information = risque maximal
  • Bus factor = 3+ → l’information est partagée = équipe résiliente

Test rapide : pour chaque service critique, demandez-vous :

  • Qui sait le redémarrer ? (1 personne = danger)
  • Qui connaît l’architecture ? (1 personne = danger)
  • Qui peut déployer en production ? (1 personne = danger)

Une documentation sans gouvernance meurt en 6 mois. Avant même de créer vos premiers documents, définissez qui sera responsable de quoi.

RôleResponsabilité
OwnerMaintient le document à jour
ContributeursProposent des modifications
ReviewersValident les changements

Une fonctionnalité n’est pas terminée tant que la documentation n’est pas mise à jour.

Checklist PR :

  • Tests passent
  • Code review approuvée
  • Documentation mise à jour
  • CHANGELOG complété
TypeFréquenceDéclencheur
Runbooks critiquesTrimestrielle+ après chaque utilisation
Service OverviewsSemestrielle+ lors de changement majeur
ADRJamaisImmuables (nouvelle décision = nouvelle ADR)
PostmortemsJamaisArchive historique

Une documentation efficace n’est pas un wiki fourre-tout. Elle est structurée en familles, chacune répondant à un besoin différent.

FamilleQuestionExempleMise à jour
CartographieQu’est-ce qui existe ?Inventaire serveurs, servicesÀ chaque changement
ArchitectureComment ça fonctionne ?Diagrammes, flux de donnéesLors de refonte
ProcéduresComment agir ?Runbooks, checklistsAprès chaque incident
RéférentielQui contacter ?Annuaire, conventionsArrivées/départs
HistoriquePourquoi ce choix ?ADR, postmortemsImmuable
documentation/
├── services/ # Cartographie + Architecture par service
│ ├── auth-api/
│ │ ├── overview.md # Carte d'identité du service
│ │ ├── architecture.md # Diagrammes
│ │ └── runbooks/ # Procédures spécifiques
│ └── payment-service/
├── procedures/ # Procédures transverses
│ ├── deploiement.md
│ └── gestion-incidents.md
├── referentiel/ # Référentiel
│ ├── equipes.md
│ └── conventions.md
└── decisions/ # Historique
├── adr/
└── postmortems/

Maintenant que vous avez la gouvernance et la structure, passons à la création. Voici les 4 types de documents que toute équipe devrait avoir.

Chaque service critique doit avoir sa “carte d’identité” : ce qu’il fait, qui le maintient, comment il fonctionne.

Contenu minimum :

  • Nom, owner, criticité, SLA
  • Ce que fait le service (2-3 phrases)
  • Architecture simplifiée
  • Dépendances critiques
  • Contacts et escalade

Un runbook est une recette de cuisine pour résoudre un problème spécifique. Étapes numérotées, commandes exactes, validations.

Caractéristiques :

  • 1 runbook = 1 problème précis
  • Étapes numérotées avec commandes
  • Validation après chaque étape
  • Section “Si ça ne marche pas”

Un postmortem documente ce qui s’est passé, pourquoi, et comment éviter que ça se reproduise. Sans chercher de coupable.

Structure :

  • Timeline factuelle
  • Impact (durée, utilisateurs affectés)
  • Causes racines (5 Whys)
  • Actions correctives avec owners

Une checklist n’est pas un runbook. C’est une liste de points à vérifier pour ne rien oublier lors d’une opération.

Usages :

  • Pré-déploiement (10-15 points)
  • Post-incident (validation complète)
  • Onboarding (accès, outils, docs)

Étape 5 — Choisir les outils et évaluer sa maturité

Section intitulée « Étape 5 — Choisir les outils et évaluer sa maturité »

Dernière étape : choisir où stocker votre documentation et mesurer votre progression.

ApprocheAvantagesInconvénients
Docs-as-Code (Git + Markdown)Versionné, reviewable, proche du codeCourbe d’apprentissage
Wiki (Confluence, Notion)Accessible à tous, WYSIWYGPas de review, dérive facile

Recommandation : Docs-as-Code pour la doc technique, Wiki pour la doc organisationnelle.

OutilTypeMeilleur pour
MkDocsDocs-as-CodeDocumentation technique simple
StarlightDocs-as-CodeSites de documentation complets
DocusaurusDocs-as-CodeDocumentation produit
AntoraDocs-as-CodeDocumentation multi-projets
NotionWikiDocumentation légère, partagée
ConfluenceWikiDocumentation d’entreprise

Vous avez les bases et vous avez choisi votre outil. Voici comment démarrer selon votre situation :

Minimum vital pour survivre :

  1. Lister vos 3 services les plus critiques
  2. Pour chacun, créer un Service Overview minimal
  3. Documenter 1 runbook pour l’incident le plus fréquent

Résultat : vous pouvez gérer les incidents courants

Avant de passer aux guides détaillés, vérifiez votre compréhension :

  • Je sais expliquer pourquoi la documentation est un investissement
  • Je connais les 5 familles de documentation
  • Je peux distinguer runbook, checklist et playbook
  • Je comprends le concept d’ownership
  • Je sais quand faire une review de documentation
  • Je connais la différence entre Docs-as-Code et Wiki

Toutes les cases cochées ? Commencez par créer votre premier Service Overview ou faites l’auto-évaluation maturité pour identifier vos priorités.


Une fois les fondamentaux maîtrisés, choisissez votre outil :

Ce site vous est utile ?

Sachez que moins de 1% des lecteurs soutiennent ce site.

Je maintiens +700 guides gratuits, sans pub ni tracing. Aujourd'hui, ce site ne couvre même pas mes frais d'hébergement, d'électricité, de matériel, de logiciels, mais surtout de cafés.

Un soutien régulier, même symbolique, m'aide à garder ces ressources gratuites et à continuer de produire des guides de qualité. Merci pour votre appui.