Модели агентов

Модели агентов: мультиагентная система
для комплаенса и автоматизации

Три бизнес-модели: Compliance — линейный поток, Feedback — анализ обращений, Operations — иерархия с оркестратором и декомпозицией задач.
Сравнение моделей
Три модели, три топологии.
Compliance — линейный поток с циклом критики. Feedback — анализ обращений. Operations — иерархия с оркестратором и декомпозицией.

Языковые модели (LLM): Qwen3 8B, Qwen2.5 (7B/14B/32B), Llama 3.2, Mistral Nemo, llava (vision). Админ выбирает модель в дашборде. Подробнее — Модели LLM.

МодельГрафОркестратор
ComplianceExtractor → Checker → Risk → Critic → ActionНет
FeedbackAnalyzer → Researcher → Responder → Critic → EscalationНет
OperationsOrchestrator → Resolver → Critic → Executor → NotifyДа
Compliance — проверка документов.
ExtractorИзвлечение данных CheckerНормативы RiskОценка штрафов CriticВерификация ActionOK / Блок
Critic может вернуть задачу на Extractor (цикл до 3 итераций)

Документ проходит фиксированную последовательность: извлечение сущностей, проверка на соответствие нормам, оценка рисков, верификация и финальное решение. Каждый шаг не требует разбиения на подзадачи — поток жёстко определён.

Extractor

Извлекает стороны договора, суммы, даты, коды маркировки, номера сертификатов. Отдельная роль — чтобы не смешивать OCR/парсинг с логикой проверки. Ошибка извлечения не должна влиять на интерпретацию норм.

Checker

Проверяет соответствие нормативам: 152-ФЗ, ФСТЭК (приказы 17/21/117), маркировка Честный Знак. Набор нормативов настраивается под клиента. Результат — структурированный список нарушений или подтверждение соответствия.

Risk

Оценивает финансовые последствия: штрафы за единицу без маркировки, за партию без сертификата. Отдельная роль — оценка риска требует иной prompt-логики, чем проверка формальных требований.

Critic

Верифицирует результат перед финальным действием. Может вернуть задачу на Extractor при недостаточной полноте извлечения. Цикл до 3 итераций снижает долю ложных срабатываний и пропусков.

Feedback — анализ обращений.
AnalyzerТональность, темы ResearcherRAG, контекст ResponderГенерация ответа CriticПроверка EscalationЭскалация
Линейный поток: анализ → поиск контекста → ответ → верификация → эскалация при необходимости

Обращение клиента проходит цепочку: анализ тональности и тем, поиск в базе знаний (RAG), генерация ответа, проверка качества и решение об эскалации. Поток жёстко определён, без оркестратора.

Analyzer

Определяет тональность (негатив, нейтрал, позитив), выделяет темы и срочность. Результат используется Responder и Escalation. Отдельная роль — не смешивать анализ с генерацией ответа.

Researcher

Ищет в базе знаний релевантный контекст: регламенты, прецеденты, FAQ. Ответ привязывается к вашим правилам и документам, а не только к общей модели.

Responder

Генерирует ответ клиенту на основе анализа и контекста из RAG. Настраивается по тону (эмпатия, формальность) и целям пресета.

Critic

Проверяет ответ на соответствие регламенту и тону. Может вернуть на доработку. Снижает риск некорректных или грубых ответов.

Escalation

Определяет, нужно ли передать обращение человеку (жалоба, негатив, сложный кейс). Флаг эскалации передаётся в CRM или тикет-систему.

Operations — согласования и процессы.
OrchestratorДекомпозиция, маршрутизация ResolverСогласующие CriticHITL ExecutorERP NotifyУведомления
Orchestrator классифицирует тип запроса и выбирает маршрут

Операционные процессы требуют декомпозиции: запрос на согласование договора, закупки или отпуска — разные типы с разными цепочками. Оркестратор определяет маршрут и подзадачи.

Orchestrator

Классифицирует тип запроса (договор, закупка, отпуск, IT-запрос), декомпозирует на подзадачи и выбирает цепочку согласующих. Маршрутизация зависит от суммы, срочности и регламентов. Модель 70B для сложных решений.

Resolver

Назначает конкретных согласующих по оргструктуре (LDAP/AD). Учитывает делегирование, отпуска, нагрузку. Формирует цепочку: юрист, финдир, ГД — в зависимости от типа и порога.

Critic

Пауза для решения человека. Может вернуть задачу к агенту роли Resolver при изменении маршрута или делегировании. Продолжение с любой точки графа.

Executor

Выполняет действие после одобрения: создание задачи в 1С, Bitrix24, отправка в ЭДО. Не принимает решений — только исполнение по результату Human-in-the-Loop.

Notify

Отправка уведомлений согласующим и инициатору. Интеграция с Email, Telegram, Bitrix24.

Надстройки
Дебаты и голосование.
В трёх моделях — Compliance, Обращения (Feedback), Operations — доступны опциональные режимы без смены основной схемы. Включаются в пресетах и задаются в дашборде или API флагами use_voting и use_debate.

Голосование (Voting)

Агент 1 — Независимо выдвигает свой вариант (уровень риска, одобрить/отклонить и т.д.); итог определяется по большинству.Агент 1Роль Агент 2 — Независимо выдвигает свой вариант (уровень риска, одобрить/отклонить и т.д.); итог определяется по большинству.Агент 2Роль Агент 3 — Независимо выдвигает свой вариант (уровень риска, одобрить/отклонить и т.д.); итог определяется по большинству.Агент 3Роль Агент 4 — Независимо выдвигает свой вариант (уровень риска, одобрить/отклонить и т.д.); итог определяется по большинству.Агент 4Роль Majority — Итог по большинству голосов агентов одной роли.MajorityИтог по большинству

Несколько агентов одной роли (например, 4 Risk или 4 Critic) независимо дают ответ; итог определяется по большинству — уровень риска, одобрить/отклонить, тональность обращения, нужна ли эскалация. Снижает влияние случайной ошибки одного агента. В логах и диалоге отображаются реплики вида «Risk Assessor (голосование)», «Critic (голосование)».

Дебаты (Debate)

Агент A — Выдвигает первый вариант для сравнения; Judge выбирает лучший по аргументам.Агент AВариант 1 Агент B — Выдвигает второй вариант для сравнения; Judge выбирает лучший по аргументам.Агент BВариант 2 Judge — Выбирает лучший вариант по аргументам двух агентов.JudgeВыбор по аргументам

Два агента дают разные варианты (например, «одобрить» vs «отклонить» или два варианта ответа клиенту), затем узел Judge выбирает лучший по аргументам. Используется там, где важно сравнить обоснования, а не усреднить. В диалоге видны «Critic (дебаты)», «Judge» и т.д. Точная схема отображается в дашборде в разделе «Диалог агентов».

Компьютерное зрение (Vision)

Изображения документа (PDF-страницы, скриншоты)ИзображенияPDF, скриншоты Vision Checker — анализ печатей, подписей, визуальных элементов через llavaVisionПечати, подписи Результат передаётся в Checker / CriticChecker / CriticКонтекст для проверок

Модуль компьютерного зрения встраивается в любую схему агентов, где это применимо. Vision-модель (llava) анализирует изображения: проверяет наличие печатей и подписей на документах, распознаёт скриншоты ошибок в обращениях клиентов, классифицирует фотографии товаров. Результат передаётся следующим агентам как дополнительный контекст. Включается флагом use_vision в конфиге или API. Примеры: Compliance — проверка печатей на договорах; Feedback — анализ скриншотов в обращении.

FAQ
Частые вопросы.

Почему мультиагенты лучше обычного одного агента?

Когда один агент и извлекает данные, и проверяет нормы, и решает — он чаще ошибается и «галлюцинирует». Мы разбиваем работу на роли: один извлекает, другой проверяет, третий оценивает риски, четвёртый может отправить на доработку. Каждый делает своё, следующий перепроверяет. В итоге меньше пропусков и ложных срабатываний, и всегда понятно, на каком шаге что произошло. Плюс под новый сценарий можно перенастроить цепочку, а не переписывать одну большую модель.

Как быстро можно внедрить мультиагентный ИИ у себя?

Пилотный контур обычно поднимаем за 1–2 месяца: развёртывание на ваших серверах, подключение к ключевым системам (1С, CRM, ЭДО — по необходимости), обучение команды. Дальше — масштабирование под ваши процессы. Срок зависит от объёма интеграций и сложности регламентов.

Подходит ли платформа для автоматической проверки документов на 152-ФЗ и маркировку?

Да. Одна из основных моделей — комплаенс: проверка договоров, актов, накладных на соответствие 152-ФЗ и маркировке Честный Знак. Цепочка агентов извлекает данные, сверяет с нормативами, оценивает риски и штрафы, верифицирует результат. Всё на вашем периметре, без отправки документов вовне.

Как вы защищаетесь от prompt injection?

То, что вводит пользователь, у нас не подмешивается к служебным инструкциям агентов — у ввода своё место, агенты работают уже с обработанными данными. По критичным решениям (например, «документ прошёл» или «заблокировать») всегда есть шаг с человеком: система предлагает, человек подтверждает. Всё крутится у вас на серверах, в облако ничего не уходит — значит, и подменить промпт извне по сути некуда, плюс вы видите все логи.

Где хранятся данные и как обеспечивается конфиденциальность?

Всё считается у вас: ставите модели на свои серверы или в своё облако — документы и обращения за пределы вашей инфраструктуры не уходят. В публичные API мы ничего не шлём. Смотреть данные и логи могут только ваши люди. Под 152-ФЗ и отраслевые требования закладываемся с самого начала, когда проектируем контур и настраиваем проверки.

Почему в одной модели есть Оркестратор, а в другой — нет?

Оркестратор нужен там, где есть декомпозиция запроса на подзадачи, маршрутизация по типу запроса или параллельное выполнение. В Compliance и Feedback поток линейный с одной точкой ветвления (Critic) — роли жёстко заданы, документ или обращение проходят один путь. В Operations один запрос порождает несколько подзадач, маршрут зависит от суммы и типа — без оркестратора граф стал бы неподдерживаемым.

Можно ли встроить ваших агентов в наши регламенты и базы знаний?

Да. Агенты работают с вашими нормативами, регламентами и прецедентами через RAG: база знаний настраивается под клиента, запросы к ней выполняют выделенные роли (например, Researcher в Feedback). Так ответы и проверки привязаны к внутренним правилам компании, а не к общим данным модели. Пресеты можно менять под сценарий без смены топологии графа.

Как я могу настраивать работу моделей?

Администраторы настраивают веса агентов (strictness, verbosity и др.) и общие задачи модели через конфигурацию. Пресеты задают профиль под сценарий: быстрая проверка, глубокая проверка, регрессия — с разными параметрами по ролям.

Можно ли поменять схему модели?

Схему менять не требуется. Гибкость достигается настройкой весов и параметров агентов под задачи клиента. Разные пресеты меняют поведение без изменения топологии графа.

Готовы к пилоту?

Выберите модель и разверните граф агентов внутри вашего периметра.

Заказать тест