Технологии

Полный контроль
над стеком. ИИ
on-premise

Open-source LLM на ваших серверах. LangGraph · vLLM · Qdrant · FastAPI. Полная прозрачность. Независимость от облачных провайдеров.
Стек

Технологический стек

Используемые языки программирования, фреймворки и программное обеспечение платформы Нексус-Тех.

Языки и фреймворки

Python, LangGraph (оркестрация агентов), FastAPI (API), асинхронная обработка.

LLM и инференс

Qwen 2.5, Llama 3.2 (модели). Ollama, vLLM (локальный инференс на сервере заказчика).

Данные и инфраструктура

Qdrant, PgVector (векторные БД, RAG). Prometheus, Grafana (мониторинг).

Интеграции

1С (ERP, бухгалтерия), Bitrix24 (CRM), ЭДО (Диадок, СБИС), Честный Знак (маркировка).

Периметр клиента
Документы
PDF / Скан / ЭДО
AI-агенты
LangGraph
Результат
Решение + действие
LLM
Qwen 2.5 / Llama 3.2
Vector DB
Qdrant / PgVector
Inference
Ollama / vLLM
API
FastAPI
ERP / Бухгалтерия
Bitrix24
CRM
ЭДО
Диадок / СБИС
Маркировка
Честный Знак
Monitoring
Prometheus + Grafana

Пресеты

Готовые шаблоны работы

Пресет — готовый сценарий под вашу задачу: проверка документов, поддержка клиентов, согласования. Меняется поведение агентов и режимы (голосование, дебаты), схема графа остаётся той же. Выбираете пресет в дашборде или через API.

ПресетМодельДля чегоГде применяется
Аудит перед ревизиейКомплаенсГолосование + дебаты, жёсткие критерииПроверка документов перед ревизией
Стандартная проверкаКомплаенсГолосование + дебатыПовседневная проверка договоров и накладных
Быстрая проверкаКомплаенсЛёгкий режимЭкспресс-контроль без глубокого анализа
Мягкая с рекомендациямиКомплаенсМягкие критерииКонсультативный режим, рекомендации
Юр. превьюКомплаенсЖёсткие критерии, голосование + дебатыЮридическая проверка договоров
Служба поддержкиОбращенияЭмпатия, дебатыОбращения в CRM, тикеты, поддержка
Нейтральные ответыОбращенияСбалансированный тонФормальная переписка, FAQ
Быстрая эскалацияОбращенияДебаты + голосование по эскалацииНегативные обращения, жалобы
Отработка возраженийОбращенияЦель — отработка возражений, дебатыПродажи, возражения клиентов
Продающий ответОбращенияЦель — продажи, дебатыИсходящие ответы, коммерческие предложения
Жёсткое согласованиеОперационнаяГолосование + дебатыСогласования договоров, закупок
Рутинные операцииОперационнаяДебатыТиповые заявки, маршрутизация
Срочные задачиОперационнаяБыстрый потокСрочные согласования, эскалации

Оцените контекстное окно под ваше железо → Калькулятор KV-cache · Разбор новых моделей Qwen

Команда агентов
6 специализированных ролей.
Каждый агент отвечает за свою задачу. Orchestrator координирует всю команду через LangGraph. Схемы и обоснование ролей

Orchestrator

Планирование, декомпозиция задач, координация команды. Модель 70B для сложных решений.

Researcher

Поиск информации, RAG-запросы к базе знаний, извлечение контекста из документов.

Analyst

Извлечение сущностей, классификация, оценка рисков. Структурированный вывод в JSON.

Executor

Выполнение действий: создание задач, отправка уведомлений, вызов API внешних систем.

Critic

Контроль качества, верификация результатов. Может вернуть задачу на доработку (цикл).

Reporter

Формирование отчётов, суммаризация результатов, генерация рекомендаций.

Паттерны
7 моделей взаимодействия.
От простого последовательного до циклических графов, голосования и дебатов. Режимы Voting и Debate включаются в пресетах под задачу (аудит, эскалация жалоб, аналитика).

Sequential

Линейная цепочка: Agent A → B → C → Result. Для простых процессов с чёткой последовательностью.

Hierarchical

Orchestrator декомпозирует задачу и распределяет между агентами. Для сложных задач.

Cyclic

Critic проверяет результат и возвращает на доработку. Итеративное улучшение до достижения качества.

Debate

Два варианта ответа (например, мягкий и формальный), агент роли Judge выбирает лучший. Подходит для поддержки и эскалации жалоб — меньше ошибок и единый тон.

Voting

Несколько агентов оценивают риск или тон — итог по большинству. Нужно для аудита, юр. превью и жёсткого согласования — выше точность решений.

Operations

Распределение задач, согласования, Human-in-the-Loop. Для внутренних процессов компании.

Human-in-the-Loop

Система ставит процесс на паузу, когда нужно решение человека. Продолжить можно с того же шага в любой момент.

Пример: Граф комплаенса (циклический)
ExtractorИзвлечение данных CheckerНормативы RiskОценка штрафов CriticВерификация ActionOK / Блок
Critic может вернуть задачу на Extractor (цикл до 3 итераций)

Подробнее о схемах работы агентов

Калькулятор

Контекстное окно и KV-cache под ваше железо

Оценка доступного контекста в зависимости от VRAM, модели и объёма RAG. Упрощённая формула для планирования пилота. Подбор моделей по задачам — в разборе новых Qwen. Ниже — ориентир по количеству одновременных потоков запросов (несколько сотрудников нагружают модель параллельно).

Нагрузка: сколько потоков запросов одновременно

Использование модели несколькими сотрудниками создаёт параллельную нагрузку. Пропускная способность зависит от объёма входящих документов в неделю (комплаенс), количества запросов в поддержку/фидбек и объёма операций. Укажите ориентиры — в результате покажем примерную оценку потоков.

[SYS] ЗАЯВКА

Заказать пилот

Запустим мультиагентную систему на вашей инфраструктуре за 1–2 месяца. Без передачи данных в облако.

[НЕКСУС-ТЕХ] Заявка на тестирование
поле /7