Wie du KI-Agenten für Unternehmen baust (echte Workforce, keine Demo)

Q: Ersetzt es Menschen?

Nicht ganz. Es ersetzt Stunden von Menschen bei repetitiven Aufgaben — die Menschen machen weiter die Urteils-Arbeit. Was passiert: Wenn ein Agent 60-80% einer Junior-Rolle abdeckt, ist es schwerer zu rechtfertigen, einen weiteren Junior einzustellen, nicht den vorhandenen zu kündigen. Es ist eher gebremste Expansion als Stellenabbau, zumindest in den ersten 18 Monaten.

Q: Wie viele Agenten gleichzeitig?

Fang mit einem an. Einem einzigen. Roll ihn aus, miss, justiere für 6-8 Wochen. Ab dem zweiten Quartal, füge jeden Monat einen weiteren hinzu, wenn die vorherigen solide laufen. Das Unternehmen, das mit 5 Agenten gleichzeitig startet, endet mit 5 Demos, die niemand nutzt, und einem ausgebrannten Team.

Q: Und die EU-Regulierung (AI Act)?

Wichtig vor allem, wenn der Agent Entscheidungen trifft, die Personen betreffen (HR, Kredit-Scoring, Medizin). Für interne operative Nutzung (Dokumente verarbeiten, Entwürfe schreiben, Termine planen) ist das regulatorische Risiko niedrig. Gute Nachricht: Wenn du Governance ab Tag eins richtig machst (Logs, Transparenz, HITL), ist AI-Act-Compliance Dokumentationsarbeit, kein Redesign.

Wie du KI-Agenten für Unternehmen baust (echte Workforce, keine Demo)

KI-Agenten für Unternehmen zu bauen ist das, was die meisten „AI Workforce" nennen und fast niemand in Produktion hat. Der Grund ist nicht technisch: er ist organisatorisch. Ein Agent ohne menschlichen Owner, ohne SLA und ohne Kosten-pro-Task-Metriken ist ein Experiment, kein Mitarbeiter. Deshalb scheitern sie.

Was einen Agenten zu Workforce macht (und nicht zu einer Demo)

Ein KI-Agent ist „Workforce", wenn er drei operative Bedingungen erfüllt: Er hat einen identifizierten menschlichen Owner (nicht „die Geschäftsleitung"), er hat ein messbares SLA (Antwortzeit, erwartete Qualität) und er hat Kosten-pro-Aufgabe-Metriken dokumentiert. Ohne die drei ist er ein Experiment — mit den drei ist er ein digitaler Mitarbeiter. Die Unterscheidung ist nicht akademisch: Sie ändert, wie budgetiert, wie gemessen und wie gewartet wird.

Die 4 Rollen, die im Unternehmen am besten funktionieren

Recherche-Assistent. Strukturierte Suchen, Executive Summaries, Wettbewerbsmonitoring.
Operator administrativer Prozesse. Rechnungen, Verträge, Formulare, Validierungen verarbeiten.
Junior-Vertriebs-Assistent (NICHT Senior). Initiale Qualifizierung, Meetings vereinbaren, operative Follow-ups.
L1-Support-Agent. Lösung repetitiver Tickets mit Eskalation an Menschen für L2/L3.

Wie ein Human-in-the-Loop zugewiesen wird

Der Human-in-the-Loop ist nicht „jemand, der die ganze Arbeit des Agenten überprüft" — es ist jemand, der an konkreten Checkpoints eingreift. Die korrekte Zuweisung:

Operativer Agent-Owner. 1 Person, 5-20% ihrer Zeit gewidmet je nach Agent-Volumen.
Automatische Checkpoints. Hoch-Impact-Entscheidungen, die menschliche Bestätigung vor Ausführung erfordern.
Wöchentliches Stichproben-Review. Der Owner sieht sich 30-50 zufällige Fälle an und markiert Treffer/Fehler.
Monatliche Iteration. 30-Minuten-Meeting mit dem technischen Partner, um Prompts und Konfiguration auf Basis der Funde anzupassen.

Governance, Eskalation und QA

Ohne Governance ist der Agent technische Schuld als Produktivität getarnt. Die 4 obligatorischen Stücke:

Klare Nutzungspolitik — was der Agent darf, was nicht, welche Entscheidungen einen Menschen erfordern.
Auditierbare Logs jeder Entscheidung und jeder Aktion mit Kontext.
Rollback-Mechanismus — wenn das Ergebnis abweicht, kehrt das System in den vorherigen Zustand zurück.
Periodisches Review mit automatisierter Eval + menschlichem Stichproben-Review.

Echte Kosten pro Aufgabe

Die korrekte Rechnung umfasst die fünf Komponenten — nicht nur „LLM-Tokens":

LLM-Kosten (Tokens) pro Ausführung.
Infrastruktur-Kosten (Compute, Storage, Vektordatenbank) anteilig.
Werkzeug-Kosten (CRM-API usw.).
Kosten menschlicher Supervision (% der Zeit des operativen Owners).
Amortisierte Setup-Kosten (geteilt durch erwartete Nutzungsmonate).

Wann es sich NICHT lohnt

Volumen <50 Ausführungen/Woche des Agenten — das Setup rechnet sich nicht.
Prozess, der bald eliminiert oder transformiert wird.
Kein operativer Owner verfügbar oder zugewiesen.
Fälle, in denen die Fehlerkosten den erwarteten Nutzen weit übersteigen.
Teams ohne minimale monatliche Iterationskapazität.

Häufig gestellte Fragen

Nicht ganz. Es ersetzt Stunden von Menschen bei repetitiven Aufgaben — die Menschen machen weiter die Urteils-Arbeit. Was passiert: Wenn ein Agent 60-80% einer Junior-Rolle abdeckt, ist es schwerer zu rechtfertigen, einen weiteren Junior einzustellen, nicht den vorhandenen zu kündigen. Es ist eher gebremste Expansion als Stellenabbau, zumindest in den ersten 18 Monaten.

Fang mit einem an. Einem einzigen. Roll ihn aus, miss, justiere für 6-8 Wochen. Ab dem zweiten Quartal, füge jeden Monat einen weiteren hinzu, wenn die vorherigen solide laufen. Das Unternehmen, das mit 5 Agenten gleichzeitig startet, endet mit 5 Demos, die niemand nutzt, und einem ausgebrannten Team.

Wichtig vor allem, wenn der Agent Entscheidungen trifft, die Personen betreffen (HR, Kredit-Scoring, Medizin). Für interne operative Nutzung (Dokumente verarbeiten, Entwürfe schreiben, Termine planen) ist das regulatorische Risiko niedrig. Gute Nachricht: Wenn du Governance ab Tag eins richtig machst (Logs, Transparenz, HITL), ist AI-Act-Compliance Dokumentationsarbeit, kein Redesign.

Wie du KI-Agenten für Unternehmen baust (echte Workforce, keine Demo)

Was einen Agenten zu Workforce macht (und nicht zu einer Demo)

Die 4 Rollen, die im Unternehmen am besten funktionieren

Wie ein Human-in-the-Loop zugewiesen wird

Governance, Eskalation und QA

Echte Kosten pro Aufgabe

Wann es sich NICHT lohnt

Häufig gestellte Fragen

Der Guide ist generisch. Dein Plan nicht.