Einen KI-Agent bauen · Guide 3 von 6

Wie du einen KI-Chatbot baust, der kein „Chatbot mit Hut" ist

Einen KI-Chatbot 2026 zu bauen ist nicht mehr, eine Frage-Antwort-Box aufzusetzen. Es ist, zu entscheiden, ob du einen „Marketing"-Chatbot (antwortet, was du geschrieben hast), einen „Support"-Chatbot (RAG über deine Wissensbasis) oder einen „Agenten" (entscheidet und führt Aktionen aus) willst. Die drei Optionen haben unterschiedliche Architektur und Preise.

In Produktion sehen → KI-Support 24/7 Zurück zum Pillar

Die 3 Chatbot-Typen und welchen du brauchst

Typ	Was er macht	Wann nutzen
Marketing / FAQ	Antwortet mit Antworten, die du vorher geschrieben hast	Kleine Webseite, stabile FAQs, niedriges Budget
Support (RAG)	Holt Info aus deiner KB und antwortet mit Kontext	Support mit solider KB, >500 repetitive Tickets/Monat
Agent	Entscheidet und führt Aktionen aus (antwortet nicht nur)	Komplexe Prozesse, Integration mit Systemen

RAG-Architektur Schritt für Schritt

Strukturiere deine KB. Kurze Blöcke (200-400 Wörter), in sich geschlossen, mit Metadaten.
Generiere Embeddings. Konvertiere jeden Block in einen Vektor mit einem Modell (Ada von OpenAI oder Äquivalent).
Speichere in Vektordatenbank. Pinecone, Weaviate, pgvector je nach Skala und Budget.
Konfiguriere Retrieval. Für jede Anfrage: die k ähnlichsten Blöcke holen, re-ranken, nach Metadaten filtern wenn anwendbar.
Übergib Kontext an das LLM. Das LLM erhält den abgerufenen Kontext + Prompt des Users + System-Prompt.
Gib Antwort zurück mit Quellenangabe (optional, aber empfohlen).

Wann der Chatbot an einen Menschen übergeben muss (Kriterien)

Niedrige Modell-Konfidenz (Wahrscheinlichkeit der Antwort unter Schwellenwert).
Als sensibel erkannte Fälle (Beschwerden, Reklamationen, Rabattanfragen).
Explizite Anfrage des Users („ich will mit einer Person sprechen").
Anzahl Turns ohne Lösung — nach 5-6 Nachrichten ohne Fortschritt eskalieren.
Frustrationserkennung — Keywords wie „das funktioniert nicht", „ich hab die Nase voll".

CSAT und Deflection messen, ohne dich selbst zu betrügen

Wie im Support: Aufgeblähte Deflection ist die Falle. Miss:

Ohne Eskalation gelöste Tickets mit Bestätigung der Lösung.
CSAT post-Interaktion (>4/5 gesund).
Rate sauberer Eskalation (jede Eskalation muss Kontext mitbringen).
CSAT-Vergleich vor vs. nach dem Chatbot.

Empfohlene Stacks (self-serve, mid, enterprise)

Größe	Stack	Monatliche Kosten
Self-serve	Implementa KI-Support, Intercom Fin, Chatbase	79-300 €/Monat
Mid-Market	Zendesk + Custom-RAG + Integration	1.500-5.000 €/Monat
Enterprise	Eigene Plattform oder Salesforce + Custom-Agent	5.000-25.000 €/Monat

Häufig gestellte Fragen

Wenn du unter 100 Besuche/Tag bekommst, lohnt sich der Setup-Aufwand wahrscheinlich nicht (du brauchst länger zur Konfiguration, als er dir spart). Ab 500-1.000 Besuche/Tag mit qualifiziertem Traffic, ja — und viel. Die ehrliche Metrik ist nicht „Traffic", sondern „repetitive Anfragen/Monat": mehr als 50, dann zahlt es sich aus.

Self-Serve: 0€ zusätzlich zum Abo (79-149€/Monat bei Implementa). Self-Hosted mit deiner KB: 0€ Lizenz, ~20-50€/Monat LLM-Tokens bei vernünftigem Volumen. Der echte Kampf ist die Inhaltsaktualisierung — das nimmt einem Menschen 2-4 Stunden/Monat, damit nichts veraltet. Das sind versteckte Kosten.

Ja, moderne LLMs machen Multi-Language ohne zusätzlichen Aufwand. Achtung: Deine KB muss in mindestens einer gut geschriebenen Sprache sein (Englisch oder neutrales Deutsch am besten). Wenn dein Quellinhalt mies ist, replizieren sich die Probleme in allen Sprachen — er verstärkt sie, behebt sie nicht.

KI-Impact-Plan · kostenlos

Der Guide ist generisch. Dein Plan nicht.

Erzähl uns von deinem Unternehmen und du bekommst eine Diagnose mit Prioritäten, Zahlen und dem, was zuerst gebaut wird. Ohne Sales-Termin, ohne einen Euro zu zahlen.

Lies hier weiter

KI-Agent bauen: der Leitfaden, den du vor dem ersten Prototyp hättest lesen müssen Wie du einen KI-Agenten für den Vertrieb baust (einen echten AI SDR)Wie du einen AI SDR baust: vollständige Architektur des automatisierten Outbounds