Was einen Agenten zu Workforce macht (und nicht zu einer Demo)
Ein KI-Agent ist „Workforce", wenn er drei operative Bedingungen erfüllt: Er hat einen identifizierten menschlichen Owner (nicht „die Geschäftsleitung"), er hat ein messbares SLA (Antwortzeit, erwartete Qualität) und er hat Kosten-pro-Aufgabe-Metriken dokumentiert. Ohne die drei ist er ein Experiment — mit den drei ist er ein digitaler Mitarbeiter. Die Unterscheidung ist nicht akademisch: Sie ändert, wie budgetiert, wie gemessen und wie gewartet wird.
Die 4 Rollen, die im Unternehmen am besten funktionieren
- Recherche-Assistent. Strukturierte Suchen, Executive Summaries, Wettbewerbsmonitoring.
- Operator administrativer Prozesse. Rechnungen, Verträge, Formulare, Validierungen verarbeiten.
- Junior-Vertriebs-Assistent (NICHT Senior). Initiale Qualifizierung, Meetings vereinbaren, operative Follow-ups.
- L1-Support-Agent. Lösung repetitiver Tickets mit Eskalation an Menschen für L2/L3.
Wie ein Human-in-the-Loop zugewiesen wird
Der Human-in-the-Loop ist nicht „jemand, der die ganze Arbeit des Agenten überprüft" — es ist jemand, der an konkreten Checkpoints eingreift. Die korrekte Zuweisung:
- Operativer Agent-Owner. 1 Person, 5-20% ihrer Zeit gewidmet je nach Agent-Volumen.
- Automatische Checkpoints. Hoch-Impact-Entscheidungen, die menschliche Bestätigung vor Ausführung erfordern.
- Wöchentliches Stichproben-Review. Der Owner sieht sich 30-50 zufällige Fälle an und markiert Treffer/Fehler.
- Monatliche Iteration. 30-Minuten-Meeting mit dem technischen Partner, um Prompts und Konfiguration auf Basis der Funde anzupassen.
Governance, Eskalation und QA
Ohne Governance ist der Agent technische Schuld als Produktivität getarnt. Die 4 obligatorischen Stücke:
- Klare Nutzungspolitik — was der Agent darf, was nicht, welche Entscheidungen einen Menschen erfordern.
- Auditierbare Logs jeder Entscheidung und jeder Aktion mit Kontext.
- Rollback-Mechanismus — wenn das Ergebnis abweicht, kehrt das System in den vorherigen Zustand zurück.
- Periodisches Review mit automatisierter Eval + menschlichem Stichproben-Review.
Echte Kosten pro Aufgabe
Die korrekte Rechnung umfasst die fünf Komponenten — nicht nur „LLM-Tokens":
- LLM-Kosten (Tokens) pro Ausführung.
- Infrastruktur-Kosten (Compute, Storage, Vektordatenbank) anteilig.
- Werkzeug-Kosten (CRM-API usw.).
- Kosten menschlicher Supervision (% der Zeit des operativen Owners).
- Amortisierte Setup-Kosten (geteilt durch erwartete Nutzungsmonate).
Wann es sich NICHT lohnt
- Volumen <50 Ausführungen/Woche des Agenten — das Setup rechnet sich nicht.
- Prozess, der bald eliminiert oder transformiert wird.
- Kein operativer Owner verfügbar oder zugewiesen.
- Fälle, in denen die Fehlerkosten den erwarteten Nutzen weit übersteigen.
- Teams ohne minimale monatliche Iterationskapazität.