Используемые языки программирования, фреймворки и программное обеспечение платформы Нексус-Тех.
Python, LangGraph (оркестрация агентов), FastAPI (API), асинхронная обработка.
Qwen 2.5, Llama 3.2 (модели). Ollama, vLLM (локальный инференс на сервере заказчика).
Qdrant, PgVector (векторные БД, RAG). Prometheus, Grafana (мониторинг).
1С (ERP, бухгалтерия), Bitrix24 (CRM), ЭДО (Диадок, СБИС), Честный Знак (маркировка).
Пресет — готовый сценарий под вашу задачу: проверка документов, поддержка клиентов, согласования. Меняется поведение агентов и режимы (голосование, дебаты), схема графа остаётся той же. Выбираете пресет в дашборде или через API.
| Пресет | Модель | Для чего | Где применяется |
|---|---|---|---|
| Аудит перед ревизией | Комплаенс | Голосование + дебаты, жёсткие критерии | Проверка документов перед ревизией |
| Стандартная проверка | Комплаенс | Голосование + дебаты | Повседневная проверка договоров и накладных |
| Быстрая проверка | Комплаенс | Лёгкий режим | Экспресс-контроль без глубокого анализа |
| Мягкая с рекомендациями | Комплаенс | Мягкие критерии | Консультативный режим, рекомендации |
| Юр. превью | Комплаенс | Жёсткие критерии, голосование + дебаты | Юридическая проверка договоров |
| Служба поддержки | Обращения | Эмпатия, дебаты | Обращения в CRM, тикеты, поддержка |
| Нейтральные ответы | Обращения | Сбалансированный тон | Формальная переписка, FAQ |
| Быстрая эскалация | Обращения | Дебаты + голосование по эскалации | Негативные обращения, жалобы |
| Отработка возражений | Обращения | Цель — отработка возражений, дебаты | Продажи, возражения клиентов |
| Продающий ответ | Обращения | Цель — продажи, дебаты | Исходящие ответы, коммерческие предложения |
| Жёсткое согласование | Операционная | Голосование + дебаты | Согласования договоров, закупок |
| Рутинные операции | Операционная | Дебаты | Типовые заявки, маршрутизация |
| Срочные задачи | Операционная | Быстрый поток | Срочные согласования, эскалации |
Оцените контекстное окно под ваше железо → Калькулятор KV-cache · Разбор новых моделей Qwen
Планирование, декомпозиция задач, координация команды. Модель 70B для сложных решений.
Поиск информации, RAG-запросы к базе знаний, извлечение контекста из документов.
Извлечение сущностей, классификация, оценка рисков. Структурированный вывод в JSON.
Выполнение действий: создание задач, отправка уведомлений, вызов API внешних систем.
Контроль качества, верификация результатов. Может вернуть задачу на доработку (цикл).
Формирование отчётов, суммаризация результатов, генерация рекомендаций.
Линейная цепочка: Agent A → B → C → Result. Для простых процессов с чёткой последовательностью.
Orchestrator декомпозирует задачу и распределяет между агентами. Для сложных задач.
Critic проверяет результат и возвращает на доработку. Итеративное улучшение до достижения качества.
Два варианта ответа (например, мягкий и формальный), агент роли Judge выбирает лучший. Подходит для поддержки и эскалации жалоб — меньше ошибок и единый тон.
Несколько агентов оценивают риск или тон — итог по большинству. Нужно для аудита, юр. превью и жёсткого согласования — выше точность решений.
Распределение задач, согласования, Human-in-the-Loop. Для внутренних процессов компании.
Система ставит процесс на паузу, когда нужно решение человека. Продолжить можно с того же шага в любой момент.
Оценка доступного контекста в зависимости от VRAM, модели и объёма RAG. Упрощённая формула для планирования пилота. Подбор моделей по задачам — в разборе новых Qwen. Ниже — ориентир по количеству одновременных потоков запросов (несколько сотрудников нагружают модель параллельно).
Использование модели несколькими сотрудниками создаёт параллельную нагрузку. Пропускная способность зависит от объёма входящих документов в неделю (комплаенс), количества запросов в поддержку/фидбек и объёма операций. Укажите ориентиры — в результате покажем примерную оценку потоков.
Запустим мультиагентную систему на вашей инфраструктуре за 1–2 месяца. Без передачи данных в облако.