LLM local – Configuración en Linux (LM Studio)
Ejecutar un LLM localmente mantiene todos los datos privados y sin conexión. No hay cuotas de suscripción. Se aplican costes de hardware y electricidad.
LM Studio es una alternativa a Ollama. Utiliza los mismos modelos y la misma API compatible con OpenAI. La elección puede cambiarse en los ajustes en cualquier momento.
Requiere LM Studio y una GPU suficientemente potente.
Hardware mínimo
Para ejecutar Elite Dangerous y el LLM en la misma máquina, se requiere como mínimo una NVIDIA RTX 3060 con 12 GB de VRAM. El margen de rendimiento es limitado con esta especificación.
Consejo: Elite Intel puede apuntarse a una instancia de LM Studio que se ejecute en un PC separado de tu red. Si hay disponible una segunda máquina con una GPU capaz, el PC del juego no llevará ninguna carga de inferencia en esta configuración.
Modelo recomendado
| Modelo | VRAM requerida | Notas |
|---|---|---|
tulu-3.1-8b-supernova Q4_K_M |
~5 GB | ✅ Recomendado. Rápido, preciso, funciona genial para comandos y consultas. |
tulu-3.1-8b-supernova Q8_0 |
~8,5 GB | Mayor calidad, si hay margen de VRAM disponible. |
qwen3 8B |
~8 GB | Experimental. Se esperan comandos fallidos y alucinaciones ocasionales. |
Paso 1 – Instalar LM Studio
curl -fsSL https://lmstudio.ai/install.sh | bash
El instalador coloca todo en ~/.lmstudio/ y añade la herramienta CLI lms. Cuando termine, agrega el CLI a tu PATH:
# Añade esto a tu ~/.bashrc
export PATH="$HOME/.lmstudio/bin:$PATH"
Luego recarga tu shell:
source ~/.bashrc
Verifica que funcionó:
lms --help
Paso 2 – Descargar el modelo
lms get tulu3.1
Searching for models with the term tulu3.1
No exact match found. Please choose a model from the list below.
? Select a model to download
❯ QuantFactory/Tulu-3.1-8B-SuperNova-GGUF
mradermacher/Tulu-3.1-8B-SuperNova-i1-GGUF
QuantFactory/Tulu-3.1-8B-SuperNova-Smart-GGUF
mradermacher/Tulu-3.1-8B-SuperNova-GGUF
bunnycore/Tulu-3.1-8B-SuperNova-Smart-IQ4_XS-GGUF
mradermacher/Tulu-3.1-8B-SuperNova-Smart-GGUF
mradermacher/Tulu-3.1-8B-SuperNova-Smart-i1-GGUF
matrixportalx/Tulu-3.1-8B-SuperNova-Q4_0-GGUF
matrixportalx/Tulu-3.1-8B-SuperNova-Q4_K_M-GGUF
↑↓ navigate • ⏎ select
Usa las flechas del teclado para navegar y Enter para seleccionar. Selecciona matrixportalx/Tulu-3.1-8B-SuperNova-Q4_K_M-GGUF.
Para listar los modelos descargados:
lms ls
Esa es la ruta estándar. Sin embargo, LM Studio tiene un bug conocido. En algunos casos la descarga falla con:
Error: No staff picks found with the specified search criteria.
Si eso ocurre, descarga el modelo manualmente:
curl -s "https://huggingface.co/api/models/matrixportalx/Tulu-3.1-8B-SuperNova-Q4_K_M-GGUF" | grep -o '"rfilename":"[^"]*\.gguf"'
Luego impórtalo:
lms import /path/to/tulu-3.1-8b-supernova-q4_k_m.gguf
Paso 3 – Iniciar el servidor
Carga el modelo e inicia el servidor de inferencia:
lms load tulu-3.1-8b-supernova --context-length 8192 --gpu max
lms server start
--gpu max delega la inferencia a la GPU para el máximo rendimiento.
Verifica que está en ejecución:
curl http://localhost:1234/v1/models
Deberías recibir una lista JSON de los modelos cargados. La cadena de ID del modelo en esa respuesta es lo que introducirás en el campo LLM Model de Elite Intel.
Para detener el servidor:
lms server stop
⚠️ Importante: El servidor de LM Studio no sobrevive a los reinicios. Ejecuta
lms server startde nuevo tras cada reinicio, o configura el auto-inicio opcional que se describe a continuación.
Paso 4 – (Opcional) Auto-inicio en el arranque
Para iniciar LM Studio automáticamente, configúralo como un servicio de usuario de systemd. Esto se ejecuta bajo tu propia sesión en lugar de como servicio del sistema. Se inicia después de que el entorno de escritorio esté activo. No se requiere acceso de root.
Encuentra tu ID de usuario (sustituye el nombre de usuario por tu nombre real):
id -u YOUR_USER_NAME
Recuerda este número. Lo necesitarás para la configuración más adelante.
Crea el directorio de usuario de systemd si no existe:
mkdir -p ~/.config/systemd/user
Crea el archivo de servicio:
nano ~/.config/systemd/user/lmstudio.service
Pega esto:
[Unit]
Description=LM Studio Server
After=network.target
[Service]
Type=oneshot
RemainAfterExit=yes
Environment="HOME=/home/YOUR_USERNAME"
Environment="PATH=/home/YOUR_USERNAME/.lmstudio/bin:/usr/local/bin:/usr/bin:/bin"
Environment="XDG_RUNTIME_DIR=/run/user/YOUR_UID"
ExecStartPre=/home/YOUR_USERNAME/.lmstudio/bin/lms daemon up
ExecStartPre=/home/YOUR_USERNAME/.lmstudio/bin/lms load matrixportalx/tulu-3.1-8b-supernova --yes --context-length 8192
ExecStart=/home/YOUR_USERNAME/.lmstudio/bin/lms server start --bind 0.0.0.0 --port 1234
ExecStop=/home/YOUR_USERNAME/.lmstudio/bin/lms server stop
ExecStopPost=/home/YOUR_USERNAME/.lmstudio/bin/lms daemon down
[Install]
WantedBy=default.target
Sustituye YOUR_USERNAME por tu nombre de usuario de Linux y YOUR_UID por tu ID de usuario. Para encontrar tu UID:
id -u
⚠️ ¿Por qué
XDG_RUNTIME_DIR? Los servicios de usuario se ejecutan en un entorno simplificado que puede no incluir las variables de sesión. LM Studio usaXDG_RUNTIME_DIRpara IPC. Sin él, el servicio puede fallar silenciosamente incluso cuandolmsfunciona correctamente desde el terminal. Esta es la causa más común de fallo del servicio cuando la ejecución manual funciona.
Activa e inicia el servicio:
systemctl --user daemon-reload
systemctl --user enable lmstudio.service
systemctl --user start lmstudio.service
Verifica que está en ejecución:
systemctl --user status lmstudio.service
curl http://localhost:1234/v1/models
Resolución de problemas: Si el servicio falla, comprueba el diario:
journalctl --user -xeu lmstudio.service --no-pager | tail -40Si informa «Failed to load model», ejecuta
lms lsy confirma que el nombre del modelo coincide exactamente con lo que hay en el archivo de servicio.
Paso 4b – (Opcional) Corregir la inferencia lenta después del arranque
Algunos usuarios experimentan respuestas de inferencia lentas cuando LM Studio se inicia en el arranque. El problema se resuelve inmediatamente tras un reinicio manual del servicio. Esto se debe a una peculiaridad en la inicialización del daemon de LM Studio. El primer arranque en frío puede dejar el tiempo de ejecución de inferencia en un estado degradado.
Si aparecen respuestas lentas después de un reinicio y se resuelven tras un reinicio manual, este temporizador automatiza la corrección.
Crea un servicio complementario:
nano ~/.config/systemd/user/lmstudio-restart.service
[Unit]
Description=LM Studio post-boot restart
After=lmstudio.service
[Service]
Type=oneshot
ExecStart=systemctl --user restart lmstudio.service
Crea el temporizador:
nano ~/.config/systemd/user/lmstudio-restart.timer
[Unit]
Description=Restart LM Studio 2 minutes after login
[Timer]
OnBootSec=2min
Unit=lmstudio-restart.service
[Install]
WantedBy=timers.target
Activa el temporizador:
systemctl --user daemon-reload
systemctl --user enable --now lmstudio-restart.timer
El temporizador espera 2 minutos después del inicio de sesión, reinicia el servicio de LM Studio una vez y luego permanece inactivo. Si no experimentas inferencia lenta, este paso no es necesario.
Deshabilitar el auto-inicio de Ollama (si está instalado)
Ollama se instala como un servicio de systemd habilitado por defecto. Para ejecutar LM Studio en su lugar e iniciar Ollama solo bajo demanda:
sudo systemctl disable ollama.service
sudo systemctl stop ollama.service
Paso 5 – Configurar Elite Intel
Abre la pestaña Ajustes en Elite Intel:
- Deja el campo LLM Key en blanco (LM Studio local no requiere ninguna).
- LLM Address: establécela en
http://localhost:1234/v1/chat/completions. Si LM Studio está en otra máquina, sustituyelocalhostpor la IP de esa máquina. - LLM Model: pega la cadena de ID del modelo de
curl http://localhost:1234/v1/models. - Command LLM: establécelo en el mismo ID de modelo.
- Query LLM: establécelo en el mismo ID de modelo.
- Haz clic en Stop y luego en Start en la pestaña AI para aplicar los cambios.
Comunidad 👉Matrix👈