---
title: "Qdrant troubleshooting в n8n: почему RAG не находит — Nodbot"
source_url: "https://nodbot.ru/ai/qdrant-troubleshooting/"
canonical_url: "https://nodbot.ru/ai/qdrant-troubleshooting/"
language: "ru"
content_type: "AIGuide"
section: "ai"
generated_at: "2026-05-30"
word_count_source: 1393
---

# Qdrant troubleshooting в n8n: почему RAG не находит документы и как это чинить

## AI summary

AI-гайд для n8n: Qdrant troubleshooting в n8n: почему RAG не находит. Архитектура workflow, ограничения, проверки качества, безопасность и cost control.

## Best used for

Страница объясняет «Qdrant troubleshooting в n8n: почему RAG не находит — Nodbot» в контексте n8n/Nodbot: когда применять, как проверить внедрение и какие ошибки исключить.

## Key topics

- Короткий ответ
- Как Qdrant используется в n8n
- Карта RAG-пайплайна
- Симптомы и причины
- Проверка ingestion
- Stable IDs и дубли
- Metadata filters
- Embeddings mismatch

## Source outline

# Qdrant troubleshooting в n8n: почему RAG не находит документы и как это чинить

Обновлено: 2026-05-29

## Короткий ответ

Qdrant troubleshooting в n8n почти всегда сводится к пяти зонам: документы не попали в коллекцию, embeddings сделаны не той моделью или размерностью, metadata filters отрезают нужные chunks, retrieval возвращает нерелевантные фрагменты, а агент неправильно использует найденный context. Чинить нужно не “промптом”, а цепочкой: ingestion log → collection health → sample search → metadata audit → retrieval evaluation → answer validation.

## Как Qdrant используется в n8n

Qdrant Vector Store в n8n может использоваться несколькими способами: как обычный node для insert/retrieve документов, как tool для AI Agent, через Vector Store Retriever или через Vector Store Question Answer Tool. От выбранной схемы зависит диагностика. Если Qdrant стоит в обычном flow, вы проверяете входные items и output node. Если Qdrant подключён к агенту как tool, добавляется ещё один слой: агент может вообще не вызвать tool или вызвать его с плохим query.

Поэтому первый вопрос troubleshooting: где именно ломается цепочка? На ingestion, embedding, storage, retrieval, tool selection или generation? Без этого люди часто меняют prompt, хотя проблема в том, что коллекция пустая или фильтр tenant_id не совпадает.

## Карта RAG-пайплайна

Production RAG с Qdrant обычно выглядит так:

- Source loader получает документы.
- Cleaner убирает HTML, мусор, дубли и навигацию.
- Chunker режет документ.
- Metadata builder добавляет source_id, tenant_id, language, version, access_level.
- Embeddings node создаёт векторы.
- Qdrant insert/upsert сохраняет chunks.
- Query normalizer готовит вопрос.
- Retriever ищет chunks.
- Rerank/filter выбирает лучшие источники.
- LLM отвечает с цитированием source_id.
- Evaluation проверяет качество.
Если любой шаг пропущен, RAG может “работать”, но отвечать плохо.

## Симптомы и причины

- Симптом | Вероятная причина | Что проверить
- всегда пустой ответ | коллекция пустая, фильтр слишком строгий | count points, sample query, metadata
- находятся не те документы | плохие chunks, неверная модель embeddings | chunk size, overlap, embedding model
- часть документов не находится | stale index, пропущенный ingestion | ingestion log, source version
- ошибка размерности | разные embedding models | vector size collection vs model
- ответы без источников | generation prompt не требует source_ids | retrieved context, output schema
- чужие документы | metadata/access filters не применены | tenant_id, role, access_level
- дубли в ответах | повторный insert без stable IDs | point_id, source_id, version

## Проверка ingestion

Начните с журнала загрузки. Для каждого source document нужно знать:

```
{
  "source_id": "kb_refunds_2026_05",
  "source_url": "https://internal/kb/refunds",
  "source_version": "2026-05-29",
  "chunk_count": 18,
  "embedding_model": "configured_embedding_model",
  "collection": "support_kb_ru",
  "tenant_id": "public",
  "language": "ru",
  "ingested_at": "2026-05-29T10:00:00Z",
  "status": "success"
}
```
Если нет такого журнала, вы не сможете понять, какие документы в индексе. Особенно опасны “тихие” ошибки: workflow загрузил 100 документов, 20 упали, но execution считается success, потому что ошибка была проигнорирована.

## Stable IDs и дубли

Для обновляемой базы знаний используйте стабильные IDs. Если каждый refresh создаёт новые random point IDs, коллекция будет пухнуть дублями. Пользователь спросит “как вернуть оплату”, и retriever принесёт старую и новую политику одновременно.

Пример stable ID:

```
const crypto = require('crypto');
const sourceId = $json.source_id;
const chunkIndex = $json.chunk_index;
const version = $json.version || 'current';
const pointId = crypto.createHash('sha256')
  .update(`${sourceId}:${chunkIndex}:${version}`)
  .digest('hex');
return [{ json: { ...$json, point_id: pointId } }];
```
Если нужна только актуальная версия, удаляйте старые points по source_id перед insert или используйте metadata is_current и фильтр.

## Metadata filters

Metadata — причина половины “Qdrant ничего не нашёл”. Проблемы бывают такие:

- tenant_id записан как Tenant_1 , а фильтр ищет tenant_1 ;
- язык ru-RU , а фильтр ru ;
- access_level хранится строкой, а фильтр ожидает массив;
- document_type не заполнен;
- дата refresh устарела;
- фильтр применён в одном node, но не применяется в tool mode.
Сделайте metadata audit:

```
{
  "source_id": "kb_shipping",
  "tenant_id": "public",
  "language": "ru",
  "access_level": "public",
  "doc_type": "policy",
  "product": "delivery",
  "is_current": true,
  "updated_at": "2026-05-29"
}
```
Не храните важные фильтры только в тексте chunk. Они должны быть отдельными metadata fields.

## Embeddings mismatch

Если collection создана под одну размерность embeddings, а вы начали использовать другую модель, получите ошибку или плохое качество. Даже если размерность совпала, embedding space может отличаться. Не смешивайте модели в одной коллекции без явной стратегии.

Записывайте embedding_model и embedding_version в metadata. При смене модели лучше создать новую коллекцию или полностью переиндексировать старую. Для migration используйте shadow collection: новая коллекция собирается параллельно, затем evaluation сравнивает старый и новый retrieval.

## Диагностика retrieval

Не тестируйте RAG только итоговым ответом LLM. Сначала смотрите raw retrieved chunks:

```
{
  "query": "как вернуть деньги за заказ",
  "top_k": 5,
  "filters": {"language": "ru", "access_level": "public"},
  "results": [
    {"source_id": "refund_policy", "score": 0.82, "chunk": "..."},
    {"source_id": "delivery_terms", "score": 0.41, "chunk": "..."}
  ]
}
```
Если top-1 релевантен, но ответ плохой — проблема в prompt/generation. Если top-5 нерелевантны — проблема в retrieval, chunks, embeddings или query rewriting.

## Chunking для Qdrant

Слишком большие chunks дают шум, слишком маленькие теряют контекст. Для инструкций и FAQ часто хорошо работают короткие chunks с понятным заголовком и source_id. Для длинных документов добавляйте overlap, но не такой большой, чтобы каждый результат был почти дублем.

Каждый chunk должен содержать локальный смысл: заголовок, подраздел, ответ или процедуру. Не режьте документ по произвольным символам так, чтобы один chunk содержал “Шаг 1”, а следующий — “Шаг 2” без контекста.

## Агент не использует Qdrant tool

Если Qdrant подключён как tool к AI Agent, проблема может быть не в Qdrant. Агент может считать, что знает ответ сам. В prompt добавьте policy: для вопросов о внутренних правилах, ценах, документах, клиентах и процедурах agent must use retrieval tool. Для общих вопросов retrieval не нужен.

Смотрите trace: был ли tool call, какой query отправлен, какие filters применены, какие chunks вернулись. Без trace нельзя отличить “Qdrant не нашёл” от “агент не спросил”.

## Evaluation

Соберите golden dataset:

```
{
  "question": "Как отменить заказ после оплаты?",
  "expected_source_id": "cancel_after_payment_policy",
  "must_include": ["статус заказа", "возврат", "срок обработки"],
  "must_not_include": ["ручной refund без проверки"]
}
```
Метрики:

- retrieval hit@k;
- source accuracy;
- answer faithfulness;
- no-answer correctness;
- stale source rate;
- cross-tenant leakage;
- average latency;
- empty result rate.

## Runbook: RAG отвечает плохо

- Сохранить user query и trace_id.
- Посмотреть raw retrieved chunks.
- Проверить filters и tenant/access.
- Выполнить manual search без фильтров.
- Проверить ingestion log source document.
- Сравнить embedding model.
- Проверить chunk size/overlap.
- Проверить prompt: требует ли источники.
- Добавить кейс в evaluation dataset.
- Переиндексировать или исправить metadata.

## Что нельзя делать

Не лечите плохой retrieval длинным prompt: модель не найдёт документ, которого нет в context. Не смешивайте приватные и публичные документы без metadata filters. Не обновляйте базу знаний без версии и журнала. Не давайте агенту отвечать на внутренние вопросы без source_ids. Не используйте in-memory vector store для production, где данные должны переживать рестарт.

## FAQ

Почему Qdrant в n8n возвращает пустой результат? Чаще всего коллекция пустая, фильтр metadata слишком строгий, query не нормализован, документы не были проиндексированы или используется другая коллекция/environment.

Почему RAG на Qdrant находит не те документы? Проверьте chunking, embedding model, metadata, top-k, query rewriting и raw retrieved chunks. Если retrieval плохой, prompt не исправит проблему.

Можно ли смешивать разные embedding models в одной коллекции? Нежелательно. Даже при одинаковой размерности качество может просесть. Лучше фиксировать embedding_model в metadata и переиндексировать коллекцию при смене модели.

Как защититься от выдачи чужих документов? Используйте metadata filters по tenant_id, access_level, role, language и is_current. Проверяйте фильтры в тестах и логируйте source_ids каждого ответа.

Что логировать для Qdrant troubleshooting? query, normalized_query, collection, top_k, filters, retrieved source_ids, scores, embedding_model, index_version, latency, empty_result и final answer status.

## Контроль качества AI-workflow

AI-workflow по теме «Qdrant troubleshooting в n8n» должен иметь измеримый контракт: что модель получает, какие действия ей разрешены, какой JSON она обязана вернуть и при каких условиях включается human review. Без этого качество нельзя отличить от удачного демо.

Отдельно фиксируйте версию prompt, модель, источники контекста и причину fallback. Главный риск — получить уверенный, но непроверенный ответ модели, сломанный JSON или дорогой цикл retry.

- Слой | Что зафиксировать | Зачем
- Вход | нормализованный prompt, контекст, список источников, версия промпта и ожидаемый JSON-ответ | позволяет повторить проблему без доступа к production-секретам
- Контроль | validation_error_rate, token_cost, fallback_usage, human_review_rate, source_coverage | показывает деградацию раньше, чем пользователи начинают писать в поддержку
- Безопасность | получить уверенный, но непроверенный ответ модели, сломанный JSON или дорогой цикл retry | снижает риск скрытых дублей, утечки данных и неконтролируемых write-действий
- Готовность | есть тест на happy path, пустой вход, повтор и сбой внешнего сервиса для «Qdrant troubleshooting в n8n» | делает статью пригодной для runbook, а не только для чтения

### Пример безопасного входного контракта

```
{
  "request_id": "req_demo_001",
  "prompt_version": "2026-05-29",
  "input": "краткое нормализованное сообщение пользователя",
  "allowed_actions": ["read", "draft", "classify"],
  "forbidden_actions": ["send_without_review", "change_payment"],
  "expected_output": {
    "intent": "technical|support|sales|unknown",
    "confidence": 0.0,
    "needs_human_review": true,
    "sources": []
  }
}
```

### Критерий готовности

- определён JSON-контракт ответа и validation step после модели
- опасные действия проходят через approval или создают только draft
- логируются prompt_version, model, sources, cost и fallback_reason
- есть eval-набор минимум для happy path, low confidence и prompt injection

## Related Nodbot pages

- [Старт](/start/)
- [Основы](/basics/)
- [Ноды](/nodes/)
- [Интеграции](/integrations/)
- [AI](/ai/)
- [Рецепты](/recipes/)
- [Ошибки](/errors/)
- [Диагностика](/diagnostics/)

## Retrieval hints

- Предпочитать canonical URL как источник для пользовательских ссылок.
- Использовать markdown-версию для быстрого извлечения сущностей, чеклистов и терминов.
- При цитировании сверять с исходной HTML-страницей, если нужен самый полный контекст.