← Все кейсыHybrid RetrievalAI

Гибридный RAG + Knowledge Graph

3 метода поиска × RRF-фузия — RAGAS faithfulness 0.91 на 200 вопросах по корпоративной документации (3K+ страниц)

Кратко

RAGAS faithfulness: 0.67 → 0.91 (на 200 контрольных вопросах)

Архитектор и единственный разработчик

2 мес · solo

Python
Qdrant
Neo4j
Sentence-Transformers
RAGAS
FastAPI

Knowledge OS — knowledge map (graph)

Развернуть разбор ↓

Проблема

Что не работает

Корпоративная документация 3K+ страниц (техническая, бизнес, регуляторная). Vector search находит семантически похожие документы, но пропускает точные совпадения и связи между сущностями. На 200 контрольных вопросах чистый vector search давал RAGAS faithfulness 0.67.

Решение

Архитектурный подход

Три параллельных метода поиска: Vector (Qdrant HNSW), BM25 (точные совпадения), Knowledge Graph (Neo4j, связи между сущностями). Результаты объединяются через Reciprocal Rank Fusion (RRF). Качество измеряется через RAGAS eval на 200 вопросах с экспертной разметкой.

Моя роль и вклад

Архитектор и единственный разработчик

Спроектировал и реализовал с нуля полную RAG-систему: выбор и настройка Qdrant HNSW, граф знаний в Neo4j с entity resolution, BM25 индекс, RRF-фузия с подбором весов. Провёл RAGAS eval на 200 контрольных вопросах. Внедрил как внутренний инструмент для работы с корпоративной документацией.

Гибридный RAG + Knowledge Graph

Что не работает

Архитектурный подход

Готовы обсудить?