Локальный LLM установка на Windows (Ollama)
Запуск локального LLM обеспечивает полную конфиденциальность данных и работу офлайн. Подписка не требуется. Учитываются затраты на оборудование и электроэнергию.
Требуется Ollama и мощный GPU.
Минимальные требования к оборудованию
Для запуска Elite Dangerous и LLM на одном компьютере требуется минимум NVIDIA RTX 3060 с 12 ГБ VRAM. На этой конфигурации производительность ограничена.
Подсказка: Elite Intel можно направить на экземпляр Ollama, работающий на отдельном компьютере в вашей сети. Если доступна вторая машина с мощным GPU, игровой ПК не несёт нагрузки инференса в этой конфигурации.
Рекомендуемая модель
| Модель | Требуется VRAM | Примечания |
|---|---|---|
tulu3:8b Q4_K_M |
~5 ГБ | ✅ Рекомендуется. Надёжная работа с командами и запросами. |
qwen3 8B |
~8 ГБ | Экспериментальная. Возможны пропущенные команды и галлюцинации. |
Примечание: Для наиболее быстрого локального инференса рассмотрите LM Studio с
matrixportalx/tulu-3.1-8b-supernova. По результатам тестирования, он заметно быстрее Ollama на том же оборудовании с той же моделью.
Шаг 1 Установка Ollama
- Перейдите на https://ollama.com/download
- Скачайте и запустите
OllamaSetup.exe. Права администратора не требуются. - Ollama устанавливается и запускается в системном трее. Автозапуск при входе в систему включён.
Шаг 2 Загрузка модели
Откройте командную строку или PowerShell и выполните:
ollama pull tulu3:8b
Или экспериментальные альтернативы:
ollama pull qwen3:8b
Шаг 3 (Необязательно) Тонкая настройка конфигурации
Ollama работает без настройки. Следующая конфигурация улучшает управление VRAM при совместном запуске с Elite Dangerous.
На Windows Ollama считывает конфигурацию из переменных среды пользователя.
- Щёлкните правой кнопкой по значку Ollama в трее и выберите Quit.
- Откройте Параметры и найдите «переменные среды».
- Нажмите «Изменить переменные среды для вашей учётной записи».
- Добавьте каждую переменную ниже кнопкой Создать:
| Переменная | Значение | Примечания |
|---|---|---|
OLLAMA_MAX_VRAM |
14000000000 |
Лимит 14 ГБ. Скорректируйте под свой GPU и требования игры. |
OLLAMA_NUM_PARALLEL |
3 |
Покрывает асинхронные паттерны вызовов Elite Intel без избытка. |
OLLAMA_MAX_LOADED_MODELS |
1 |
Одна модель в VRAM одновременно. |
OLLAMA_FLASH_ATTENTION |
1 |
Ускоренный инференс. |
OLLAMA_KEEP_ALIVE |
-1 |
Держит модель загруженной постоянно. |
- Нажмите OK. Перезапустите Ollama из меню «Пуск».
Что делают эти настройки
OLLAMA_MAX_VRAM: Жёсткий лимит VRAM, который может использовать Ollama, в байтах. Оставляет остаток для Elite Dangerous. Скорректируйте под свой GPU и требования игры.
OLLAMA_NUM_PARALLEL: Количество одновременно обрабатываемых запросов. Elite Intel выполняет асинхронные вызовы, поэтому слишком низкое значение вызовет сбои. 3 покрывает типичное перекрытие команд и запросов без избыточного выделения ресурсов.
OLLAMA_MAX_LOADED_MODELS: Держит в VRAM только одну модель одновременно.
OLLAMA_FLASH_ATTENTION: Включает Flash Attention, снижающее использование пропускной способности памяти при инференсе. Как правило, быстрее, особенно для повторяющихся запросов.
OLLAMA_KEEP_ALIVE=-1: Держит модель загруженной в VRAM бессрочно. Без этого Ollama может выгрузить модель после периода бездействия, что приведёт к задержке при повторной загрузке.
Шаг 4 Настройка Elite Intel
Откройте вкладку «Настройки» в Elite Intel:
- Оставьте поле LLM Key пустым (локальный Ollama ключ не требует).
- LLM Address по умолчанию:
http://localhost:11434/api/chat. Если Ollama работает на другом компьютере, заменитеlocalhostна IP этого компьютера. - LLM Model: задайте
tulu3:8b. - Command LLM: задайте
tulu3:8b. - Query LLM: задайте
tulu3:8b. - Нажмите Stop, затем Start на вкладке AI для применения изменений.
Сообщество 👉Matrix👈