Перейти к содержимому
Философия

Не промпт-инженерия. Системная архитектура.

Пять принципов, которые определяют как я проектирую автономные системы. Каждый — результат реальных провалов и итераций.

01

Консенсус вместо доверия

Ни одна LLM не принимает решение в одиночку. Каждое критическое решение проходит через панель из 4 независимых провайдеров с кворумом ≥3/4. Разные архитектуры мышления (reasoning tokens, thinking blocks) компенсируют слабости друг друга.

02

Оценка встроена, а не добавлена

Каждый этап пайплайна проходит через оценщика. Judge-система с 26 пунктами проверки и 100-балльной шкалой. Критик с 5 критериями. Ревьюер с retry-циклом. Оценка — не финальный этап, а компонент каждого шага.

03

Отсечение дешевле доработки

Kill gates стоят перед каждым дорогим этапом. Если идея не прошла критика (< min_score), она не попадёт в кодогенерацию. Каждое отсечение записывается с kill_stage и kill_reason для аналитики воронки.

04

Агенты как компоненты

Каждый агент — это сервис с определённым контрактом: входы, выходы, промпт, модель, max_tokens. Агенты не знают друг о друге — оркестратор управляет потоком. Это позволяет заменять, масштабировать и тестировать каждого независимо.

05

Мета-уровень: агенты для агентов

Agent Manager мониторит все параллельные сессии. Buddy System автоматически восстанавливает контекст при переключении задач. Thinking Amplifier заставляет остановиться и проанализировать альтернативы перед принятием решения.

Стек

Технологии

Инструменты подбираются под задачу, а не наоборот.

Оркестрация

PythonasyncioFastAPIRedis Streams

LLM-провайдеры

OpenAIAnthropicGoogle GenAIDeepSeek

Агентный CLI

Claude Codeclaude --printMCP Protocol

Данные

PostgreSQLSQLAlchemy 2.xRedis

Фронтенд

Next.jsReactTypeScriptTailwind CSS

Инфраструктура

DockerNginxPM2SSH/paramiko
Осознанный выбор

Почему НЕ LangGraph, CrewAI, Fine-tuning

Каждый «гэп» — это осознанное архитектурное решение, а не незнание.

LangGraphСвой оркестратор с DAG + kill gates + multi-model consensus

LangGraph не поддерживает 2-stage deliberation и kill gates в произвольных точках. Свой оркестратор даёт полный контроль над потоком, retry-логикой и observability.

CrewAI / AutoGenСобственный фреймворк: контракты агентов, retry, observability

Фреймворки абстрагируют то, что нужно контролировать: промпты, порядок вызовов, обработку ошибок. Свой код — прозрачный, тестируемый, без магии.

Fine-tuning (LoRA/QLoRA)Фокус на системной инженерии: оркестрация > обучение моделей

Модели — commodity, который обновляется каждые 3 месяца. Архитектура оркестрации — устойчивый moat. Инвестиции в системную инженерию дают большую отдачу.

DSPyРучная оптимизация через A/B + critic loops

Автоматическая оптимизация промптов хорошо работает для простых задач. Для сложных мульти-агентных пайплайнов нужен контроль над каждым шагом.

LangFuseOpenTelemetry + Jaeger + Grafana

Универсальная observability, не привязанная к LLM-specific tooling. Те же метрики, трейсы и дашборды работают для всех компонентов системы — не только для LLM.

“Если агент может ошибиться — он ошибётся. Поэтому каждый результат проходит через независимую оценку, а не через надежду.”

Готовы обсудить?

Если вам нужен архитектор, который строит автономные AI-системы — напишите.

Сербия (Белград) · CET/CEST · рабочие часы совпадают с EU · Опыт международных контрактов