Какие нейросети потянет ваш компьютер — проверяем за минуту
Короткий ответ: утилита llmfit сканирует ваш CPU, RAM и GPU, затем из базы в 157 моделей показывает, какие реально запустятся и с какой скоростью.
Зачем запускать нейросети локально
- Приватность — данные не уходят на сервера
- Бесплатно — никаких подписок и лимитов
- Офлайн — работает без интернета
- Скорость — нет задержек на API
Проблема: непонятно, какую модель выбрать под своё железо. 7B? 13B? 70B? Хватит ли памяти?
llmfit решает эту проблему
Одна команда — и видишь полную картину:
| |
Или через Homebrew:
| |
Как использовать
Просто запусти:
| |
Откроется интерактивное меню. Модели уже отсортированы по совместимости с твоим железом.
Управление:
↑/↓— навигация/— поиск моделиf— фильтр (Perfect / Good / Marginal)d— скачать через Ollamaq— выход
Что показывает
Для каждой модели — четыре параметра:
| Параметр | Что значит |
|---|---|
| Quality | Качество модели (репутация, бенчмарки) |
| Speed | Прогноз скорости (токенов/сек) |
| Fit | Насколько эффективно использует память |
| Context | Размер контекстного окна |
Плюс сразу видно:
- Сколько нужно RAM / VRAM
- Режим: GPU / CPU+GPU / только CPU
- Совместимость: Perfect / Good / Marginal / Too Tight
157 моделей от 30 провайдеров
В базе: Llama, Mistral, Qwen, Gemma, Phi, DeepSeek, Cohere и другие.
Категории:
- Общего назначения
- Код
- Рассуждения (reasoning)
- Чат
- Мультимодальные
Минимальные требования
| Параметры модели | RAM / VRAM |
|---|---|
| 7-8B (Q4) | 6-8 GB |
| 13B (Q4) | 10-12 GB |
| 30B (Q4) | 20-24 GB |
| 70B (Q4) | 40+ GB |
Q4 — это квантование до 4 бит. Сжимает модель в 4 раза с минимальной потерей качества.
Быстрый старт после llmfit
Если llmfit показал, что модель подходит — качай через Ollama:
| |
Или прямо из llmfit: нажми d на нужной модели.
Итог
Перед тем как качать 40 GB модель, которая не запустится — проверь через llmfit. Минута на установку, и сразу видно, что реально потянет твоё железо.
GitHub: github.com/AlexsJones/llmfit