Технологии

Технологии мультиагентного ИИ:
полный контроль над стеком

Полная прозрачность. Независимость от облачных провайдеров.
Периметр клиента
Документы
PDF / Скан / ЭДО
AI-агенты
LangGraph
Результат
Решение + действие
LLM
Qwen3 / Qwen2.5 / Llama 3.2
Vector DB
Qdrant / PgVector
Inference
Ollama / vLLM
API
FastAPI
ERP / Бухгалтерия
Bitrix24
CRM
ЭДО
Диадок / СБИС
Маркировка
Честный Знак
Monitoring
Prometheus + Grafana

Модели LLM

Языковые модели, которые мы используем

Модель всегда подбирается под партнёра: железо, задача, бюджет. Рекомендуемая — Qwen3 8B.

МодельVRAMНазначение
Qwen3 8B5–9 GBРекомендуемая для prod
Qwen3 14B9–12 GBВерификатор, reasoning
Qwen3 32B18–22 GBКомплаенс, документы, Critic
Qwen3 72B45–52 GBПремиум, флагман
Qwen3-Coder 7B4–6 GBКод, SQL, 1С
Qwen2.5-VL 7B5–7 GBVision: печати, сканы (лучше llava)
Qwen2.5 7B4–6 GBM1 8GB, слабое железо
Phi-4 mini 3.8B3–4 GBСверхбыстрый, эскалация
Gemma-2 27B16–20 GBАльтернатива без китайских (Apache 2.0)
Mistral Nemo 12B8–10 GBApache 2.0, быстрые задачи
Пресеты

Готовые шаблоны работы

Пресет — готовый сценарий под вашу задачу: проверка документов, поддержка клиентов, согласования. Меняется поведение агентов и режимы (голосование, дебаты), схема графа остаётся той же. Выбираете пресет в дашборде или через API.

ПресетМодельДля чегоГде применяется
Аудит перед ревизиейКомплаенсГолосование + дебаты, жёсткие критерииПроверка документов перед ревизией
Стандартная проверкаКомплаенсГолосование + дебатыПовседневная проверка договоров и накладных
Быстрая проверкаКомплаенсЛёгкий режимЭкспресс-контроль без глубокого анализа
Мягкая с рекомендациямиКомплаенсМягкие критерииКонсультативный режим, рекомендации
Юр. превьюКомплаенсЖёсткие критерии, голосование + дебатыЮридическая проверка договоров
Служба поддержкиОбращенияЭмпатия, дебатыОбращения в CRM, тикеты, поддержка
Нейтральные ответыОбращенияСбалансированный тонФормальная переписка, FAQ
Быстрая эскалацияОбращенияДебаты + голосование по эскалацииНегативные обращения, жалобы
Отработка возраженийОбращенияЦель — отработка возражений, дебатыПродажи, возражения клиентов
Продающий ответОбращенияЦель — продажи, дебатыИсходящие ответы, коммерческие предложения
Жёсткое согласованиеОперационнаяГолосование + дебатыСогласования договоров, закупок
Рутинные операцииОперационнаяДебатыТиповые заявки, маршрутизация
Срочные задачиОперационнаяБыстрый потокСрочные согласования, эскалации

Оцените контекстное окно под ваше железо → Калькулятор KV-cache

Команда агентов
6 специализированных ролей.
Каждый агент отвечает за свою задачу. Orchestrator координирует всю команду через LangGraph. Схемы и обоснование ролей

Orchestrator

Планирование, декомпозиция задач, координация команды. Модель 70B для сложных решений.

Researcher

Поиск информации, RAG-запросы к базе знаний, извлечение контекста из документов.

Analyst

Извлечение сущностей, классификация, оценка рисков. Структурированный вывод в JSON.

Executor

Выполнение действий: создание задач, отправка уведомлений, вызов API внешних систем.

Critic

Контроль качества, верификация результатов. Может вернуть задачу на доработку (цикл).

Reporter

Формирование отчётов, суммаризация результатов, генерация рекомендаций.

Паттерны
7 моделей взаимодействия.
От простого последовательного до циклических графов, голосования и дебатов. Режимы Voting и Debate включаются в пресетах под задачу (аудит, эскалация жалоб, аналитика).

Sequential

Линейная цепочка: Agent A → B → C → Result. Для простых процессов с чёткой последовательностью.

Hierarchical

Orchestrator декомпозирует задачу и распределяет между агентами. Для сложных задач.

Cyclic

Critic проверяет результат и возвращает на доработку. Итеративное улучшение до достижения качества.

Debate

Два варианта ответа (например, мягкий и формальный), агент роли Judge выбирает лучший. Подходит для поддержки и эскалации жалоб — меньше ошибок и единый тон.

Voting

Несколько агентов оценивают риск или тон — итог по большинству. Нужно для аудита, юр. превью и жёсткого согласования — выше точность решений.

Operations

Распределение задач, согласования, Human-in-the-Loop. Для внутренних процессов компании.

Human-in-the-Loop

Система ставит процесс на паузу, когда нужно решение человека. Продолжить можно с того же шага в любой момент.

Пример: Граф комплаенса (циклический)
ExtractorИзвлечение данных CheckerНормативы RiskОценка штрафов CriticВерификация ActionOK / Блок
Critic может вернуть задачу на Extractor (цикл до 3 итераций)

Подробнее о схемах работы агентов

Калькуляторы

Контекстное окно и подбор модели под партнёра

Оценка контекста по мощностям и рекомендация модели по задаче, VRAM и желаемому окну. Модель всегда подбирается под партнёра.

Расчёт контекстного окна от мощностей

Рассчитать подходящую модель

Готовы к пилоту?

Разверните всю архитектуру внутри вашего периметра за 1-2 месяца.

Заказать тест