Install Ollama Local LLM Windows EliteIntel

LLM local - Configuration Windows (Ollama)

Exécuter un LLM local maintient toutes les données privées et hors ligne. Il n'y a pas de frais d'abonnement. Des coûts matériels et électriques s'appliquent.

Il nécessite Ollama et un GPU capable.

Configuration matérielle minimale

Pour exécuter Elite Dangerous et le LLM sur la même machine, un minimum de NVIDIA RTX 3060 avec 12 Go de VRAM est requis. La marge de performance est limitée à cette spécification.

Conseil : Elite Intel peut être dirigé vers une instance Ollama fonctionnant sur un PC séparé de votre réseau. Si une deuxième machine avec un GPU capable est disponible, le PC de jeu ne supporte aucune charge d'inférence dans cette configuration.

Modèle recommandé

Modèle	VRAM requise	Notes
`tulu-3.1-8b-supernova` Q4_K_M	~5 Go	✅ Recommandé pour V1.0
`google/gemma-4-e4b`	~6,3 Go	✅ Recommandé pour V1.1

Quel modèle ? tulu-3.1-8b-supernova est le modèle recommandé pour la V1.0. La V1.1 passe à google/gemma-4-e4b, qui prend en charge le function calling requis par la nouvelle fonction compagnon. Les commandes ci-dessous utilisent le modèle de la V1.1 — en V1.0, remplacez-le par tulu-3.1-8b-supernova.

Note : Pour l'inférence locale la plus rapide, envisagez LM Studio avec matrixportalx/tulu-3.1-8b-supernova. Dans nos tests, il est notablement plus rapide qu'Ollama sur le même matériel avec le même modèle.

Étape 1 - Installer Ollama

Rendez-vous sur https://ollama.com/download
Téléchargez et exécutez OllamaSetup.exe. Aucun droit administrateur requis.
Ollama s'installe et s'exécute dans la barre des tâches. Il démarre automatiquement à la connexion.

Étape 2 - Télécharger un modèle

Ouvrez l'Invite de commandes ou PowerShell et exécutez :

Pour la V1.1, téléchargez google/gemma-4-e4b :

ollama pull google/gemma-4-e4b

Pour la V1.0, téléchargez tulu-3.1-8b-supernova :

ollama pull tulu3:8b

Étape 3 - (Optionnel) Optimiser la configuration

Ollama fonctionne sans optimisation. La configuration suivante améliore la gestion de la VRAM lors de l'exécution en parallèle avec Elite Dangerous.

Sous Windows, Ollama lit la configuration depuis les variables d'environnement utilisateur.

Faites un clic droit sur l'icône Ollama dans la barre des tâches et sélectionnez Quitter.
Ouvrez les Paramètres et recherchez "variables d'environnement".
Cliquez sur "Modifier les variables d'environnement pour votre compte".
Ajoutez chaque variable ci-dessous en utilisant Nouveau :

Variable	Valeur	Notes
`OLLAMA_MAX_VRAM`	`14000000000`	Limite à 14 Go. Ajustez selon votre GPU et les besoins du jeu.
`OLLAMA_NUM_PARALLEL`	`3`	Couvre les schémas d'appels asynchrones d'Elite Intel sans sur-allocation.
`OLLAMA_MAX_LOADED_MODELS`	`1`	Un seul modèle en VRAM à la fois.
`OLLAMA_FLASH_ATTENTION`	`1`	Inférence plus rapide.
`OLLAMA_KEEP_ALIVE`	`-1`	Maintient le modèle chargé en permanence.

Cliquez sur OK. Relancez Ollama depuis le menu Démarrer.

Ce que font ces paramètres

OLLAMA_MAX_VRAM : Limite stricte de la VRAM qu'Ollama peut utiliser, en octets. Laisse le reste pour Elite Dangerous. Ajustez selon votre GPU et les besoins du jeu.

OLLAMA_NUM_PARALLEL : Nombre de requêtes qu'Ollama traite simultanément. Elite Intel effectue des appels asynchrones, donc régler cette valeur trop bas provoque des échecs. 3 couvre le chevauchement typique commandes/requêtes sans sur-allocation.

OLLAMA_MAX_LOADED_MODELS : Ne conserve qu'un seul modèle en VRAM à la fois.

OLLAMA_FLASH_ATTENTION : Active Flash Attention, qui réduit l'utilisation de la bande passante mémoire lors de l'inférence. Généralement plus rapide, surtout pour les requêtes répétées.

OLLAMA_KEEP_ALIVE=-1 : Maintient le modèle chargé en VRAM indéfiniment. Sans cela, Ollama peut décharger le modèle après une période d'inactivité, entraînant un délai de rechargement à la prochaine requête.

Étape 4 - Configurer Elite Intel

Ouvrez l'onglet Paramètres dans Elite Intel :

Laissez le champ Clé LLM vide (Ollama local n'en requiert pas).
Adresse LLM par défaut : http://localhost:11434/api/chat. Si Ollama est sur une autre machine, remplacez localhost par l'adresse IP de cette machine.
Modèle LLM : définissez sur google/gemma-4-e4b.
LLM de commande : définissez sur google/gemma-4-e4b.
LLM de requête : définissez sur google/gemma-4-e4b.
Cliquez sur Stop puis Start dans l'onglet IA pour appliquer les modifications.

Communauté 👉Matrix👈