RAG-Einstellungen¶
Retrieval-Tuning
RAG-Einstellungen steuern, wie viel Kontext der Agent bekommt und wie relevant dieser sein muss. Zu streng liefert nichts, zu breit erzeugt Rauschen.
Tunen Sie Retrieval mit echten Fragen von Anrufern, nicht mit abstrakten Vermutungen.
RAG-Einstellungen steuern, wie der Agent relevante Wissensdatenbank-Inhalte abruft und nutzt.
Einstellungen¶
| Einstellung | Beschreibung | Typischer Startwert |
|---|---|---|
ragTopK |
Anzahl abgerufener Dokumentabschnitte | 5 |
ragSimilarityThreshold |
Mindestähnlichkeit zwischen Frage und Inhalt | 0.70 |
Top K (ragTopK)¶
Steuert, wie viele Abschnitte abgerufen werden.
| Wert | Verhalten |
|---|---|
| 1-3 | Sehr fokussiert, höchste Relevanz |
| 5-10 | Gute Balance aus Relevanz und Abdeckung |
| 10-20 | Breitere Abdeckung, aber mehr Risiko irrelevanter Inhalte |
Similarity Threshold¶
Filtert weniger relevante Treffer aus.
| Wert | Verhalten |
|---|---|
| 0.9+ | Nur sehr nahe Treffer, kann leer bleiben |
| 0.7-0.9 | Gute Relevanzfilterung |
| 0.5-0.7 | Breiter, aber mehr Rauschen |
| <0.5 | Sehr permissiv, Risiko irrelevanter Inhalte |
Balance finden¶
Zu strikt¶
Symptom: Agent nutzt Wissensdatenbank kaum.
Lösung: Threshold senken oder Top K erhöhen.
Zu permissiv¶
Symptom: Agent erhält irrelevante oder widersprüchliche Inhalte.
Lösung: Threshold erhöhen oder Top K reduzieren.
Empfohlener Start¶
Query Transformation¶
Query Transformation kann Gesprächskontext nutzen, um bessere Suchanfragen zu erzeugen.
Typische Einstellungen:
{
"queryTransformEnabled": true,
"queryTransformHistoryLimit": 5,
"queryTransformConfidenceThreshold": 0.8
}
Nutzen Sie diese Funktion, wenn der Agent im Gesprächskontext bessere Dokumenttreffer braucht.