Архитектура памяти AURA: как инженер увидел систему изнутри
«Перед нами описание архитектуры высокотехнологичной системы долгосрочной памяти (Long-Term Memory / Episodic Memory) для продвинутого ИИ-агента или целой экосистемы агентов под кодовым названием AURA.» — из разбора независимого инженера.
Коллега разобрал нашу архитектуру «на винтики» и точно описал четыре ключевых механизма: halfLife по scope, композитный скоринг, agentic классификацию и cross-role recall. В конце спросил: какие 6 ролей и вокруг какого бизнес-кейса это построено. Отвечаем.
HalfLife по scope: зачем и как
Проблема: все знания не могут жить вечно с одинаковым весом. Новость про рост ставок по ипотеке недельной давности должна весить меньше, чем закон 115-ФЗ, написанный год назад.
Решение: каждому scope присвоен свой период полураспада:
- /news, /market — 90 дней (быстро устаревает)
- /objections, /scripts — 730 дней (методики продаж)
- /regulations, /rules — 3650 дней (законы и этика)
- /precedents — 365 дней (прецеденты Mentor)
Дополнительно: recency floor 0.05 — даже через 10 лет recency не падает до нуля. Статью «почему в июне 2026 выросли цены» можно найти по прямому вопросу через семантику.
Композитный скоринг: α·semantic + β·recency + γ·importance
Когда стажёр задаёт вопрос, система не идёт в базу вслепую. Она вычисляет score для каждой записи:
score = α·semantic + β·recency + γ·importance
- α = 0.5 — вес смыслового сходства (косинус эмбеддингов)
- β = 0.3 — вес свежести (экспоненциальный спад через halfLife)
- γ = 0.2 — вес важности (0..1, назначается автоматически)
Коэффициенты настраиваются через регуляторы — их можно менять под конкретное агентство. Для одних важнее точность, для других — свежесть.
Agentic классификация: что искать под каждый запрос
Модель сама решает, какие источники ей нужны. Не pipeline, а классификатор:
- rules — всегда (этика, 115-ФЗ, комиссия 3%)
- documents — если запрос про договор, шаблон, инструкцию
- knowledge — если про цену, возражение, рынок, клиента
- mentor — если «как быть», «что делать», «были ли прецеденты»
- internet — если новости, тенденции, актуальные данные
Никакого линейного перебора всех слоёв. Только то, что нужно под конкретный запрос.
6 ролей: мультиагентная система
Коллега спросил — отвечаем. AURA — это не один чат-бот, а система из шести агентов, каждый со своей ответственностью:
🟦 Colleague
Отвечает стажёрам, ведёт диалог, подбирает знания под вопрос. Боевая production-система, основная рабочая лошадка.
🟩 Intern
Тестирует Colleague, оценивает качество ответов (score), создаёт proposals. Если ответ слабый — отправляет Mentor на улучшение.
🟪 Researcher
Ищет информацию в интернете, обновляет базу знаний (knowledge/). Работает с web-tools.
🟧 Teacher
Анализирует диалоги стажёров, определяет тип обучения (1 из 8 по OCEAN+Kolb), настраивает ручки (6 knobs) под каждого.
🔧 Executor
Вносит изменения в код по решению Mentor. Работает только с approved-задачами.
🟥 Mentor
Управляющий контур. Принимает решения об изменениях, оценивает риски, утверждает или отклоняет proposals.
Шесть ролей — шесть SQLite-баз, одна общая память через engine.js. Cross-role recall работает на всех уровнях: Mentor решил — Colleague знает. Teacher настроил ручки — Colleague применяет.
Бизнес-кейс: агентство недвижимости
Вся эта архитектура построена вокруг одной конкретной задачи: накопление и передача знаний агентства недвижимости.
Проблема: стажёр приходит, учится полгода, начинает продавать — и уходит. Его опыт теряется. Следующий начинает с нуля. Владелец агентства платит за обучение дважды: когда обучает и когда уходит обученный.
AURA решает это через внешнюю память бизнеса:
- Каждый диалог стажёра с Colleague → запись в colleague.sqlite
- Каждое решение Mentor → прецедент в mentor.sqlite
- Каждая найденная Researcher информация → знание в knowledge/
- Каждая оценка Teacher → профиль обучения в teacher.sqlite
Через год работы — это база знаний ~несколько десятков гигабайт. Весь опыт агентства, который не уходит с увольнением.
Выводы
- Инженерный анализ подтвердил: AURA спроектирована как система долговременной памяти для мультиагентной экосистемы, а не как «чат-бот с историей».
- Шесть ролей и cross-role recall — ключевое отличие от монолитных AI-ассистентов, включая Titans и Mem0.
- Бизнес-кейс (агентство недвижимости) — конкретная вертикаль, где проблема утечки знаний стоит острее всего. Но архитектура не привязана к вертикали — те же механизмы применимы к любому бизнесу, где есть текучка кадров и накопление экспертизы.
Все параметры системы — halfLife по scope, веса scoring (α, β, γ), пороги pipeline, ручки обучения (6 knobs), настройки Mentor — сведены в единый реестр регуляторов. 39 параметров, веб-интерфейс, пресеты (Кризис, Развитие, Много стажёров). Без перезапуска.