Aller au contenu
Développement medium

Ollama : dépannage et configuration

8 min de lecture

logo ollama

Ollama est simple, mais quelques pièges reviennent souvent : il ne répond pas, un modèle sature la mémoire, ou l'on expose le serveur sans le vouloir. Ce guide regroupe les erreurs courantes et leurs correctifs, puis la configuration utile : emplacement de stockage, limites mémoire, le piège du contexte num_ctx, et surtout la sécurité du port 11434. Prérequis : Ollama déjà installé.

  • Diagnostiquer les erreurs courantes (connexion, modèle, lenteur)
  • Configurer le stockage et les limites mémoire d'Ollama
  • Éviter le piège du contexte (num_ctx) qui sature la VRAM
  • Sécuriser l'accès au port 11434

Même si Ollama est simple d'utilisation, vous pouvez rencontrer quelques difficultés. Voici les problèmes les plus fréquents et leurs solutions.

Le problème : Ollama ne répond pas quand vous tapez une commande.

Causes possibles et solutions :

  1. Le service Ollama n'est pas démarré

    Sur Linux :

    Fenêtre de terminal
    sudo systemctl start ollama
    sudo systemctl status ollama # Vérifier l'état

    Sur Windows : Vérifiez que l'icône Ollama est présente dans la zone de notification. Si non, relancez l'application Ollama.

    Sur macOS : Cliquez sur l'icône Ollama dans la barre de menu et vérifiez qu'il est "Running".

  2. Un pare-feu bloque le port 11434

    Ollama utilise le port 11434. Si vous avez un pare-feu strict, autorisez ce port en local.

Le problème : Vous essayez d'utiliser un modèle qui n'est pas installé.

Solution :

Fenêtre de terminal
# Vérifier les modèles installés
ollama list
# Télécharger le modèle manquant
ollama pull nom-du-modele

"Error: out of memory" ou performances très lentes

Section intitulée « "Error: out of memory" ou performances très lentes »

Le problème : Votre machine n'a pas assez de RAM pour le modèle choisi.

Solutions :

  1. Utilisez un modèle plus petit

    Fenêtre de terminal
    # Au lieu de mistral (7B), essayez phi (1.5B)
    ollama pull phi
    ollama run phi "Votre question"
  2. Fermez d'autres applications pour libérer de la RAM

  3. Vérifiez l'utilisation mémoire :

    Sur Linux/macOS :

    Fenêtre de terminal
    free -h # Voir la RAM disponible
    htop # Voir les processus gourmands

    Sur Windows : Ouvrez le Gestionnaire des tâches (Ctrl+Shift+Échap)

Causes possibles et solutions :

  1. Modèle trop grand pour votre machine → Passez à un modèle plus petit

  2. Première requête après le lancement : Le modèle doit être chargé en mémoire. C'est normal que la première réponse soit plus longue (10-30 secondes). Les suivantes seront rapides.

  3. Autres processus utilisent le CPU → Fermez les applications lourdes

  4. Vous n'utilisez pas le GPU alors qu'il est disponible :

    Fenêtre de terminal
    # Vérifier si Ollama utilise le GPU
    ollama run llama3.2 "Test"
    # Regardez l'utilisation GPU avec nvidia-smi (si NVIDIA)

Le problème : Les réponses sont confuses, hors-sujet, ou répétitives.

Solutions :

  1. Reformulez votre question de manière plus précise et structurée

  2. Essayez un autre modèle, certains sont meilleurs pour certaines tâches

  3. Commencez une nouvelle conversation, parfois le contexte précédent "pollue" les réponses :

    Fenêtre de terminal
    # Quitter et relancer
    >>> /bye
    ollama run llama3.2

Cette section est destinée aux utilisateurs avancés qui veulent personnaliser Ollama.

Par défaut, Ollama stocke les modèles dans :

  • Linux : ~/.ollama/models
  • Windows : C:\Users\<user>\.ollama\models
  • macOS : ~/.ollama/models

Pour changer cet emplacement (par exemple, vers un disque plus grand) :

Fenêtre de terminal
# Définir un nouvel emplacement avant de lancer Ollama
export OLLAMA_MODELS="/chemin/vers/nouveau/dossier"
# Puis lancer Ollama
ollama serve

Si Ollama consomme trop de RAM :

Fenêtre de terminal
# Limiter à un seul modèle chargé à la fois
export OLLAMA_MAX_LOADED_MODELS=1
# Limiter la file d'attente des requêtes
export OLLAMA_MAX_QUEUE=4

Par défaut, Ollama n'écoute que sur localhost (127.0.0.1). Pour y accéder depuis d'autres machines sur votre réseau :

Fenêtre de terminal
export OLLAMA_HOST="0.0.0.0:11434"
ollama serve
  • La plupart des blocages viennent d'un service non démarré ou d'un modèle absent : vérifiez ollama serve et ollama list.
  • Un petit modèle peut saturer la VRAM à cause du contexte : surveillez ollama ps et réduisez num_ctx si besoin.
  • Ollama n'a pas d'authentification : ne jamais exposer le port 11434 sur Internet, passez par un VPN ou un reverse proxy.
  • Gardez Ollama à jour : les correctifs de sécurité sont fréquents.

Ce site vous est utile ?

Sachez que moins de 1% des lecteurs soutiennent ce site.

Je maintiens +700 guides gratuits, sans pub ni tracking. Un soutien, même symbolique, m'aide à couvrir l'hébergement et à garder ces ressources gratuites. Merci pour votre appui.

Le formulaire ne s'affiche pas ? Ouvrir Ko-fi dans un onglet.

Abonnez-vous et suivez mon actualité DevSecOps sur LinkedIn