Не промпт-инженерия. Системная архитектура.
Пять принципов, которые определяют как я проектирую автономные системы. Каждый — результат реальных провалов и итераций.
Консенсус вместо доверия
Ни одна LLM не принимает решение в одиночку. Каждое критическое решение проходит через панель из 4 независимых провайдеров с кворумом ≥3/4. Разные архитектуры мышления (reasoning tokens, thinking blocks) компенсируют слабости друг друга.
Оценка встроена, а не добавлена
Каждый этап пайплайна проходит через оценщика. Judge-система с 26 пунктами проверки и 100-балльной шкалой. Критик с 5 критериями. Ревьюер с retry-циклом. Оценка — не финальный этап, а компонент каждого шага.
Отсечение дешевле доработки
Kill gates стоят перед каждым дорогим этапом. Если идея не прошла критика (< min_score), она не попадёт в кодогенерацию. Каждое отсечение записывается с kill_stage и kill_reason для аналитики воронки.
Агенты как компоненты
Каждый агент — это сервис с определённым контрактом: входы, выходы, промпт, модель, max_tokens. Агенты не знают друг о друге — оркестратор управляет потоком. Это позволяет заменять, масштабировать и тестировать каждого независимо.
Мета-уровень: агенты для агентов
Agent Manager мониторит все параллельные сессии. Buddy System автоматически восстанавливает контекст при переключении задач. Thinking Amplifier заставляет остановиться и проанализировать альтернативы перед принятием решения.
Технологии
Инструменты подбираются под задачу, а не наоборот.
Оркестрация
LLM-провайдеры
Агентный CLI
Данные
Фронтенд
Инфраструктура
Почему НЕ LangGraph, CrewAI, Fine-tuning
Каждый «гэп» — это осознанное архитектурное решение, а не незнание.
LangGraph не поддерживает 2-stage deliberation и kill gates в произвольных точках. Свой оркестратор даёт полный контроль над потоком, retry-логикой и observability.
Фреймворки абстрагируют то, что нужно контролировать: промпты, порядок вызовов, обработку ошибок. Свой код — прозрачный, тестируемый, без магии.
Модели — commodity, который обновляется каждые 3 месяца. Архитектура оркестрации — устойчивый moat. Инвестиции в системную инженерию дают большую отдачу.
Автоматическая оптимизация промптов хорошо работает для простых задач. Для сложных мульти-агентных пайплайнов нужен контроль над каждым шагом.
Универсальная observability, не привязанная к LLM-specific tooling. Те же метрики, трейсы и дашборды работают для всех компонентов системы — не только для LLM.
“Если агент может ошибиться — он ошибётся. Поэтому каждый результат проходит через независимую оценку, а не через надежду.”
Готовы обсудить?
Если вам нужен архитектор, который строит автономные AI-системы — напишите.
Сербия (Белград) · CET/CEST · рабочие часы совпадают с EU · Опыт международных контрактов