← AURA.KIM · Исследования Статья 7
← К списку исследований

LLM + Agent + RAG + AURA: Четыре поколения AI-архитектур для бизнеса

Автор: Alexey Voronin, Aurum Estate LLC · Категория: Software Engineering · Дата: Июнь 2026
Ключевые слова: LLM, multi-agent, RAG, SML, self-learning, micro-model, privacy-preserving AI

О чём эта статья. Мы сравниваем три подхода к построению бизнес-консультанта на основе языковых моделей: от простого чата до полностью автономной архитектуры с собственной микро-моделью бизнеса. Все данные основаны на реальном эксперименте: 1302 документа из 4 агентств недвижимости → обучение микро-модели размером 793 KB → 0 сохранённого текста.

1. Постановка задачи

Любой бизнес накапливает документы: договоры, скрипты, регламенты, финансовые отчёты, клиентские кейсы. Задача бизнес-консультанта — отвечать на вопросы сотрудников на основе этих документов.

На первый взгляд, задача решается просто: дать ChatGPT документы и спросить. Но на практике каждый следующий слой архитектуры добавляет качественно новую способность, которой нет у предыдущего.

2. Уровень 1: LLM (Чат с языковой моделью)

Самая простая архитектура: пользователь пишет вопрос, LLM отвечает из своих весов.

Запрос: "какую комиссию ставить?" ↓ LLM → "Обычно 3-5%, зависит от рынка"

Плюсы

Минусы

Ограничение LLM без доступа к данным бизнеса — это калькулятор без цифр. Он знает математику, но не знает ваш баланс.

3. Уровень 2: LLM + Agent + RAG

Добавляем Agent (оркестратор) и RAG (Retrieval-Augmented Generation). Agent получает запрос, ищет релевантные документы в базе знаний, и LLM формулирует ответ на основе найденного.

Запрос: "какую комиссию ставить?" ↓ Agent → поиск по документам ↓ RAG → нашёл: договор №45.txt "комиссия 3%", кейс case-001 "клиент торговался", прайс-лист 2026 ↓ LLM → "В вашем агентстве стандартная комиссия 3%. Клиенты часто торгуются — вот скрипт отработки."

Плюсы

Минусы

Проблема RAG решает задачу точности, но создаёт проблему приватности. 650 MB текста с паспортными данными в открытой SQLite — это не security, это hope-ware.

4. Уровень 3: LLM + Agent + RAG + AURA

AURA добавляет поверх Agent+RAG три недостающих слоя:

  1. SML (Small Model Learner) — микро-модель, обученная на всех документах бизнеса, но хранящая только веса (793 KB, ноль текста)
  2. 5-уровневая память (Rules → Documents → Vectors → Internet → SML)
  3. Самообучение — каждый новый документ дообучает SML за ~3 секунды
Запрос: "какую комиссию ставить?" ↓ AURA (5 слоёв памяти): ├─ Rules: "комиссия 3% — стандарт агентства" ├─ Documents: договор №45.txt ├─ Vectors: похожие кейсы (cosine similarity) ├─ Internet: новости рынка (по необходимости) └─ SML: "запрос похож на тему 'комиссия' (p=24%), в бизнесе типичный ответ 3%, связанные темы: возражения, договоры" ↓ Agent → собирает всё + запускает процессы ↓ LLM → формулирует ответ + генерирует документ

Что даёт SML

ХарактеристикаLLM+Agent+RAG+AURA (SML)
Знает ваш бизнес✅ через чанки✅ через веса
Хранит ваши данные✅ 650 MB текста❌ 793 KB весов
Приватность❌ данные открыты✅ не восстановить
Самообучение❌ (нужен реиндекс)✅ 3 сек на документ
Размер базы0650 MB0.8 MB
Скорость поиска50–200 мс2 мс
Half-life демпфирование
Генерация документов

5. Экспериментальные результаты

Мы провели эксперимент на реальных документах 4 агентств недвижимости:

Методология

Результаты

МетрикаLLM+Agent+RAG+AURA (SML)
Точность ответа~20% (generic)~80% (по документам)~51% (классификация) + RAG
Приватность100%0% (текст в БД)100% (только веса)
Размер хранилища0650 MB0.79 MB
Stale suppression0% (не различает старые/новые)100% (half-life decay)
Время индексации0~5 мин (весь датасет)~3 сек на новый док
Данные в весах0 байт текста

Ключевое открытие: SML не заменяет RAG — он дополняет его. RAG отвечает на вопрос по конкретным документам. SML говорит Agent'у: "этот запрос похож на тему X, ищи в области Y, типичный ответ Z". RAG без SML — слепой поиск. SML без RAG — догадка без источника.

6. Безопасность данных

Главное преимущество SML перед RAG — приватность. Ни один документ не сохраняется в явном виде:

Проверка весов SML: ├── Размер: 793 KB (только float32) ├── Текст "паспорт" в весах: ❌ не найден ├── Текст "договор" в весах: ❌ не найден ├── Текст "Иван" в весах: ❌ не найден └── Вывод: ИЗ ВЕСОВ НЕЛЬЗЯ ВОССТАНОВИТЬ НИ ОДИН ИСХОДНЫЙ ДОКУМЕНТ

Это принципиальное отличие от RAG, где SELECT content FROM memory_entries возвращает полный текст каждого чанка.

7. Выводы

Каждый уровень архитектуры необходим

Формула идеального бизнес-консультанта

LLM + Agent + RAG + AURA(SML + 5-layer memory + self-learning)

= двигатель + оркестратор + библиотека + навигатор

Для бизнеса это значит


Ссылки

AURA: A Decoupled, State-Externalized Architecture — полная архитектурная статья (англ.)
github.com/alexenti-code/AURA — репозиторий проекта
SML: Small Model Learner — экспериментальные данные — метрики и графики


Эксперимент проведён в июне 2026. Датасет: АГЕНТСТВО1, АГЕНТСТВО2, АГЕНТСТВО7, AURA knowledge. Общий объём: 1302 документа. Микро-модель: 203 032 параметра, 793 KB, Apache 2.0.