Модель всегда подбирается под партнёра: железо, задача, бюджет. Рекомендуемая — Qwen3 8B.
| Модель | VRAM | Назначение |
|---|---|---|
| Qwen3 8B | 5–9 GB | Рекомендуемая для prod |
| Qwen3 14B | 9–12 GB | Верификатор, reasoning |
| Qwen3 32B | 18–22 GB | Комплаенс, документы, Critic |
| Qwen3 72B | 45–52 GB | Премиум, флагман |
| Qwen3-Coder 7B | 4–6 GB | Код, SQL, 1С |
| Qwen2.5-VL 7B | 5–7 GB | Vision: печати, сканы (лучше llava) |
| Qwen2.5 7B | 4–6 GB | M1 8GB, слабое железо |
| Phi-4 mini 3.8B | 3–4 GB | Сверхбыстрый, эскалация |
| Gemma-2 27B | 16–20 GB | Альтернатива без китайских (Apache 2.0) |
| Mistral Nemo 12B | 8–10 GB | Apache 2.0, быстрые задачи |
Пресет — готовый сценарий под вашу задачу: проверка документов, поддержка клиентов, согласования. Меняется поведение агентов и режимы (голосование, дебаты), схема графа остаётся той же. Выбираете пресет в дашборде или через API.
| Пресет | Модель | Для чего | Где применяется |
|---|---|---|---|
| Аудит перед ревизией | Комплаенс | Голосование + дебаты, жёсткие критерии | Проверка документов перед ревизией |
| Стандартная проверка | Комплаенс | Голосование + дебаты | Повседневная проверка договоров и накладных |
| Быстрая проверка | Комплаенс | Лёгкий режим | Экспресс-контроль без глубокого анализа |
| Мягкая с рекомендациями | Комплаенс | Мягкие критерии | Консультативный режим, рекомендации |
| Юр. превью | Комплаенс | Жёсткие критерии, голосование + дебаты | Юридическая проверка договоров |
| Служба поддержки | Обращения | Эмпатия, дебаты | Обращения в CRM, тикеты, поддержка |
| Нейтральные ответы | Обращения | Сбалансированный тон | Формальная переписка, FAQ |
| Быстрая эскалация | Обращения | Дебаты + голосование по эскалации | Негативные обращения, жалобы |
| Отработка возражений | Обращения | Цель — отработка возражений, дебаты | Продажи, возражения клиентов |
| Продающий ответ | Обращения | Цель — продажи, дебаты | Исходящие ответы, коммерческие предложения |
| Жёсткое согласование | Операционная | Голосование + дебаты | Согласования договоров, закупок |
| Рутинные операции | Операционная | Дебаты | Типовые заявки, маршрутизация |
| Срочные задачи | Операционная | Быстрый поток | Срочные согласования, эскалации |
Оцените контекстное окно под ваше железо → Калькулятор KV-cache
Планирование, декомпозиция задач, координация команды. Модель 70B для сложных решений.
Поиск информации, RAG-запросы к базе знаний, извлечение контекста из документов.
Извлечение сущностей, классификация, оценка рисков. Структурированный вывод в JSON.
Выполнение действий: создание задач, отправка уведомлений, вызов API внешних систем.
Контроль качества, верификация результатов. Может вернуть задачу на доработку (цикл).
Формирование отчётов, суммаризация результатов, генерация рекомендаций.
Линейная цепочка: Agent A → B → C → Result. Для простых процессов с чёткой последовательностью.
Orchestrator декомпозирует задачу и распределяет между агентами. Для сложных задач.
Critic проверяет результат и возвращает на доработку. Итеративное улучшение до достижения качества.
Два варианта ответа (например, мягкий и формальный), агент роли Judge выбирает лучший. Подходит для поддержки и эскалации жалоб — меньше ошибок и единый тон.
Несколько агентов оценивают риск или тон — итог по большинству. Нужно для аудита, юр. превью и жёсткого согласования — выше точность решений.
Распределение задач, согласования, Human-in-the-Loop. Для внутренних процессов компании.
Система ставит процесс на паузу, когда нужно решение человека. Продолжить можно с того же шага в любой момент.
Оценка контекста по мощностям и рекомендация модели по задаче, VRAM и желаемому окну. Модель всегда подбирается под партнёра.
Разверните всю архитектуру внутри вашего периметра за 1-2 месяца.
Заказать тест