Zum Inhalt springen
Implementa.

Einen KI-Agent bauen · Guide 3 von 6

Wie du einen KI-Chatbot baust, der kein „Chatbot mit Hut" ist

Einen KI-Chatbot 2026 zu bauen ist nicht mehr, eine Frage-Antwort-Box aufzusetzen. Es ist, zu entscheiden, ob du einen „Marketing"-Chatbot (antwortet, was du geschrieben hast), einen „Support"-Chatbot (RAG über deine Wissensbasis) oder einen „Agenten" (entscheidet und führt Aktionen aus) willst. Die drei Optionen haben unterschiedliche Architektur und Preise.

Die 3 Chatbot-Typen und welchen du brauchst

TypWas er machtWann nutzen
Marketing / FAQAntwortet mit Antworten, die du vorher geschrieben hastKleine Webseite, stabile FAQs, niedriges Budget
Support (RAG)Holt Info aus deiner KB und antwortet mit KontextSupport mit solider KB, >500 repetitive Tickets/Monat
AgentEntscheidet und führt Aktionen aus (antwortet nicht nur)Komplexe Prozesse, Integration mit Systemen

RAG-Architektur Schritt für Schritt

  1. Strukturiere deine KB. Kurze Blöcke (200-400 Wörter), in sich geschlossen, mit Metadaten.
  2. Generiere Embeddings. Konvertiere jeden Block in einen Vektor mit einem Modell (Ada von OpenAI oder Äquivalent).
  3. Speichere in Vektordatenbank. Pinecone, Weaviate, pgvector je nach Skala und Budget.
  4. Konfiguriere Retrieval. Für jede Anfrage: die k ähnlichsten Blöcke holen, re-ranken, nach Metadaten filtern wenn anwendbar.
  5. Übergib Kontext an das LLM. Das LLM erhält den abgerufenen Kontext + Prompt des Users + System-Prompt.
  6. Gib Antwort zurück mit Quellenangabe (optional, aber empfohlen).

Wann der Chatbot an einen Menschen übergeben muss (Kriterien)

  • Niedrige Modell-Konfidenz (Wahrscheinlichkeit der Antwort unter Schwellenwert).
  • Als sensibel erkannte Fälle (Beschwerden, Reklamationen, Rabattanfragen).
  • Explizite Anfrage des Users („ich will mit einer Person sprechen").
  • Anzahl Turns ohne Lösung — nach 5-6 Nachrichten ohne Fortschritt eskalieren.
  • Frustrationserkennung — Keywords wie „das funktioniert nicht", „ich hab die Nase voll".

CSAT und Deflection messen, ohne dich selbst zu betrügen

Wie im Support: Aufgeblähte Deflection ist die Falle. Miss:

  • Ohne Eskalation gelöste Tickets mit Bestätigung der Lösung.
  • CSAT post-Interaktion (>4/5 gesund).
  • Rate sauberer Eskalation (jede Eskalation muss Kontext mitbringen).
  • CSAT-Vergleich vor vs. nach dem Chatbot.

Empfohlene Stacks (self-serve, mid, enterprise)

GrößeStackMonatliche Kosten
Self-serveImplementa KI-Support, Intercom Fin, Chatbase79-300 €/Monat
Mid-MarketZendesk + Custom-RAG + Integration1.500-5.000 €/Monat
EnterpriseEigene Plattform oder Salesforce + Custom-Agent5.000-25.000 €/Monat

Häufig gestellte Fragen

Wenn du unter 100 Besuche/Tag bekommst, lohnt sich der Setup-Aufwand wahrscheinlich nicht (du brauchst länger zur Konfiguration, als er dir spart). Ab 500-1.000 Besuche/Tag mit qualifiziertem Traffic, ja — und viel. Die ehrliche Metrik ist nicht „Traffic", sondern „repetitive Anfragen/Monat": mehr als 50, dann zahlt es sich aus.

Self-Serve: 0€ zusätzlich zum Abo (79-149€/Monat bei Implementa). Self-Hosted mit deiner KB: 0€ Lizenz, ~20-50€/Monat LLM-Tokens bei vernünftigem Volumen. Der echte Kampf ist die Inhaltsaktualisierung — das nimmt einem Menschen 2-4 Stunden/Monat, damit nichts veraltet. Das sind versteckte Kosten.

Ja, moderne LLMs machen Multi-Language ohne zusätzlichen Aufwand. Achtung: Deine KB muss in mindestens einer gut geschriebenen Sprache sein (Englisch oder neutrales Deutsch am besten). Wenn dein Quellinhalt mies ist, replizieren sich die Probleme in allen Sprachen — er verstärkt sie, behebt sie nicht.

Lesen oder direkt produktiv stellen?

Der Guide deckt das Was und das Warum ab. Die Produktivstellung — dafür nehmen wir Geld.

Wie du einen KI-Chatbot baust, der kein „Chatbot mit Hut" ist · Implementa