Zum Inhalt

RAG-Einstellungen

Retrieval-Tuning

RAG-Einstellungen steuern, wie viel Kontext der Agent bekommt und wie relevant dieser sein muss. Zu streng liefert nichts, zu breit erzeugt Rauschen.

Tunen Sie Retrieval mit echten Fragen von Anrufern, nicht mit abstrakten Vermutungen.

RAG-Einstellungen steuern, wie der Agent relevante Wissensdatenbank-Inhalte abruft und nutzt.

Einstellungen

Einstellung Beschreibung Typischer Startwert
ragTopK Anzahl abgerufener Dokumentabschnitte 5
ragSimilarityThreshold Mindestähnlichkeit zwischen Frage und Inhalt 0.70

Top K (ragTopK)

Steuert, wie viele Abschnitte abgerufen werden.

Wert Verhalten
1-3 Sehr fokussiert, höchste Relevanz
5-10 Gute Balance aus Relevanz und Abdeckung
10-20 Breitere Abdeckung, aber mehr Risiko irrelevanter Inhalte

Similarity Threshold

Filtert weniger relevante Treffer aus.

Wert Verhalten
0.9+ Nur sehr nahe Treffer, kann leer bleiben
0.7-0.9 Gute Relevanzfilterung
0.5-0.7 Breiter, aber mehr Rauschen
<0.5 Sehr permissiv, Risiko irrelevanter Inhalte

Balance finden

Zu strikt

Symptom: Agent nutzt Wissensdatenbank kaum.

Lösung: Threshold senken oder Top K erhöhen.

Zu permissiv

Symptom: Agent erhält irrelevante oder widersprüchliche Inhalte.

Lösung: Threshold erhöhen oder Top K reduzieren.

Empfohlener Start

ragTopK: 5
ragSimilarityThreshold: 0.70

Query Transformation

Query Transformation kann Gesprächskontext nutzen, um bessere Suchanfragen zu erzeugen.

Typische Einstellungen:

{
  "queryTransformEnabled": true,
  "queryTransformHistoryLimit": 5,
  "queryTransformConfidenceThreshold": 0.8
}

Nutzen Sie diese Funktion, wenn der Agent im Gesprächskontext bessere Dokumenttreffer braucht.