Die zwei Arten, ChatGPT im Support zu nutzen (Copilot vs. Frontend)
Es gibt zwei Arten, KI in den Support zu stecken, und sie sind radikal unterschiedlich. Sie zu verwechseln — oder die eine als die andere zu verkaufen — ist die Hauptquelle von Beschwerden und einbrechendem CSAT.
| Modus | Was er tut | Risiko |
|---|---|---|
| Copilot des menschlichen Agenten | Schlägt dem Menschen Antworten vor, der entscheidet | Niedrig — Mensch filtert |
| Frontend (sichtbare Seite) | Antwortet direkt dem Kunden | Hoch — sichtbarer Fehler |
Wann es WIRKLICH Frontend sein darf (strenge Kriterien)
Frontend nur, wenn du die 4 Bedingungen erfüllst — nicht 3 von 4:
- Solide, aktuelle, für RAG strukturierte KB.
- Funktionierende menschliche Eskalation mit mitreisendem Kontext.
- Volumen, das die Investition rechtfertigt (>500 wiederkehrende Tickets/Monat).
- Du akzeptierst, dass im ersten Monat der CSAT 5-10 Punkte fällt, während du justierst.
Prompts und Templates für den Copilot
Für den Copilot des Agenten die rentabelsten Prompts:
- Zusammenfassung der Kundenhistorie. „Hier ist die Historie. Gib mir: 1) was vorher passiert ist, 2) welche Punkte ungelöst sind, 3) welcher Ton zu nutzen ist."
- Antwortentwurf. „Kunde fragt [X]. Geltende Policy: [Y]. Generiere Antwort: empathisch, klar, max. 3 Absätze."
- Tonvorschlag. „Frustrierter Kunde [Kontext]. Schlag 3 alternative Eröffnungen vor, die die Frustration anerkennen, bevor die Lösung erklärt wird."
- Technische Übersetzung. „Das sagt der Kunde. Das meint er wahrscheinlich. Hier kommt die Antwort kundenfreundlich."
Wann der Sprung zu dediziertem 24/7-KI-Support sich lohnt
- Support-Team braucht länger, um den Vorschlag zu prüfen, als ihn selbst zu schreiben.
- Mehr als 30% der Tickets sind wiederkehrend und eskalieren weiter zum Team.
- Volumen wächst schneller als das Team, und du kannst nicht im Takt einstellen.
- Du brauchst 24/7-Abdeckung und es ist mit Menschen nicht machbar.
In jedem der vier Fälle: rüber zu einem dedizierten KI-Support-System — kein direktes ChatGPT.
CSAT vorher und nachher messen
Ohne vorherige Baseline kannst du keine Verbesserung beweisen. Vernünftige Messung:
- Wöchentlicher CSAT segmentiert nach Kanal und Ticket-Kategorie — vor dem Rollout, mindestens 4 Wochen lang.
- Gleiche Messung über 8 Wochen nach dem Rollout.
- Vergleich mit statistischem Test (einfacher t-Test reicht).
- Qualitative Analyse der Tickets mit niedrigem CSAT: welches Muster gibt es?