Was sich wirklich deflectieren lässt (% pro Anfragentyp)
Ehrliche Deflection ist nicht „60% der Tickets verschwinden magisch". Sie ist die Summe von drei verschiedenen Raten, jede mit ihrer eigenen realistischen Obergrenze:
| Anfragentyp | % gut designt deflectierbar | Kommentar |
|---|---|---|
| Operative FAQs (Öffnungszeiten, Policies, Versand) | 70-90% | Das einfachste Terrain |
| Produktanfragen (Info, Vergleiche) | 50-70% | Hängt an der Qualität deiner KB |
| Lösung technischer Probleme | 30-50% | Nur wenn das System sauber eskaliert |
| Beschwerden und Reklamationen | <15% | Lieber immer an Menschen eskalieren |
| Rückgaben und Erstattungen | 20-40% | Rechtsrisiko — Supervision ist Pflicht |
Die 3 Fehler, die den ROI versenken
- Schwache Wissensbasis. Wenn deine KB klein, veraltet oder inkohärent ist, antwortet der Agent schlecht und das Kundenvertrauen sinkt schnell. Die KB ist die erste Arbeit, nicht die letzte.
- Schlecht designte menschliche Eskalation. Wenn der Agent nicht weiß, muss er MIT vollem Kontext an einen Menschen übergeben. Wer „der Kunde will was" ohne mehr weitergibt, dessen Support-Team hasst das System in einer Woche.
- Kein CSAT-Tracking. Ohne Zufriedenheit vorher und nachher zu messen, weißt du nicht, ob du Stunden gespart oder die Experience zerstört hast. Ein verlorener Kunde kostet mehr als zehn gesparte Tickets.
Architektur: Wissensbasis + RAG + Agent + menschliches Routing
Ein ernsthaftes KI-Supportsystem besteht aus vier Schichten, nicht aus einer. Der Fehler ist, „den Agenten" zu verkaufen, als wäre er ein einzelnes Teil.
- Strukturierte Wissensbasis (KB). Nicht „das FAQ-PDF hochladen"; sauberer, versionierter Content mit Metadaten.
- RAG (Retrieval-Augmented Generation). Das System, das in deiner KB das Relevante zu jeder Anfrage sucht und es dem Agenten als Kontext gibt.
- Conversational Agent. Das LLM, das antwortet, mit System Prompt zu Ton, Grenzen und Eskalationsregeln.
- Menschliche Routing-Schicht. Das System, das entscheidet, wann an einen Menschen übergeben wird, und ihm den zusammengefassten Kontext mitgibt, damit der Kunde nichts wiederholen muss.
Empfohlener Stack nach Unternehmensgröße
| Größe | Stack | Monatskosten ca. |
|---|---|---|
| KMU / Startup | Implementa KI-Support (79-149 €/Monat) oder Intercom Fin | 80-300 €/Monat |
| Mid-Market | Zendesk + KI-Agent + RAG über deine KB | 1.500-5.000 €/Monat |
| Enterprise | Eigene Plattform oder Salesforce + RAG über Historie | 8.000-25.000 €/Monat |
Wie du CSAT und Deflection misst, ohne dich zu belügen
Vier kritische Metriken, die ab Tag eins im Dashboard stehen müssen:
- Echte Deflection-Rate — % der Tickets ohne menschliches Eingreifen gelöst. Falle: zähl Tickets, die der Kunde aus Schweigen geschlossen hat, nicht als „deflectiert".
- CSAT vorher und nachher — Net Promoter Score oder Äquivalent, idealerweise pro Anfragentyp.
- Mittlere Lösungszeit — vorher vs. nach dem Agenten, getrennt nach Kanal.
- Saubere Eskalationsrate — % Tickets MIT Kontext an Menschen weitergegeben vs. ohne Kontext. Wenn Letzteres nicht null ist, gibt es Design-Schulden.
Realistische Timeline und Kosten
| Phase | Dauer | Kosten |
|---|---|---|
| Self-Serve KMU | 24-48h Setup | 79-149 €/Monat |
| KMU mit Custom (große KB) | 2-4 Wochen | 3.000-8.000 € Setup + 200-500 €/Monat |
| Mid-Market integriert (Zendesk/Intercom) | 4-8 Wochen | 8.000-25.000 € Setup + 1.500-5.000 €/Monat |
| Enterprise mit Historie | 8-16 Wochen | Ab 25.000 € |