Cos'è davvero un agente IA (e cos'è un "chatbot col cappello")
Un agente IA, in senso tecnico stretto, è un sistema che combina un modello linguistico con tre capacità in più: capacità di decidere quale strumento usare in base al contesto, memoria persistente tra interazioni e meccanismi di misurazione del proprio lavoro (evals). Qualsiasi sistema che non abbia tutte e tre non è un agente — è un chatbot. La distinzione non è semantica, è operativa: i chatbot rispondono, gli agenti eseguono.
Il motivo per cui il mercato è pieno di "agenti" che sono chatbot col cappello è commerciale: la parola "agente" vende meglio. Ma la differenza si nota subito in produzione — un chatbot ben costruito è utile; un agente mal costruito è una bomba. Conoscere la differenza prima di pagare è il miglior investimento che puoi fare in questo momento.
I tre tipi di agente che contano in azienda
Non tutti gli agenti sono uguali — tre categorie coprono il 95% dei casi utili in azienda. Confonderle porta a comprare quello che non ti serve.
Agente commerciale (AI SDR, lead routing)
Progettato per compiti commerciali: prospecting automatizzato, qualifica dei lead, routing delle opportunità. Il più misurabile (ROI in riunioni generate), il più adottato da aziende con cicli di vendita lunghi. Stack tipico: domini + warmup + scoring + sequenze + integrazione CRM.
Agente operativo (workforce, assistente interno)
Progettato per compiti interni ripetitivi: classificazione di incoming, generazione di bozze, gestione documentale. Misura il suo successo in ore risparmiate/mese. Richiede integrazione profonda con i sistemi interni (ERP, ITSM, ecc.).
Agente customer-facing (supporto, commerciale light)
Progettato per interazione diretta col cliente: supporto, FAQ, fissare riunioni. Il più visibile e, per questo, quello con maggior rischio reputazionale. Richiede supervisione rigorosa, escalation umana solida e metriche di CSAT dal giorno uno.
L'architettura minima: LLM, memoria, strumenti, evals
Un agente serio si compone di quattro strati. Se il tuo fornitore non sa disegnarli su un tovagliolo, non sta costruendo un agente — ti sta vendendo un'etichetta.
- LLM base — GPT-4 / Claude / Llama, in base a privacy, latenza e costo.
- Memoria — base vettoriale (Pinecone, Weaviate, pgvector) per mantenere il contesto tra interazioni + memoria a breve termine nella conversazione corrente.
- Strumenti (tools) — API, funzioni, ricerca web, connessione ai tuoi sistemi. L'agente decide quale usare.
- Evals — set di input rappresentativi con output attesi che girano automaticamente dopo ogni modifica.
Come si "addestra" un agente (no, non è caricare un PDF)
Il termine "addestramento" è diventato confuso. Nel 2026, "addestrare un agente" raramente significa fare fine-tuning del modello — significa costruire un buon sistema RAG (retrieval-augmented generation), scrivere un system prompt solido e configurare correttamente gli strumenti.
- Prompt engineering serio. Il system prompt definisce chi è l'agente, cosa può fare, cosa no, che tono usa e quando esce. È il pezzo più sottovalutato e con il miglior rapporto impatto/costo.
- RAG sulla tua knowledge base. Strutturare la KB in blocchi corti, generare embedding, configurare retrieval con re-ranking.
- Configurare gli strumenti. Per ogni tool, definire quando usarlo, quali parametri accettare, come gestire gli errori.
- Fine-tuning (solo se necessario). Quasi mai lo è. Solo quando ti serve un tono o uno stile molto specifico irraggiungibile col prompt, o quando ci sono vincoli di costo/latenza che giustificano un modello più piccolo specializzato.
Human-in-the-loop: perché non è opzionale
Human-in-the-loop (HITL) significa che un umano interviene in checkpoint concreti del ciclo dell'agente. NON è "umano che supervisiona tutto sempre" — è umano nei punti in cui il costo dell'errore supera il costo della pausa. Senza HITL in quei punti, l'agente è un esperimento; con HITL, è un sistema.
- Decisioni ad alto impatto (azioni irreversibili, vincolanti, con conseguenze economiche o legali).
- Casi a bassa confidenza del modello (quando la probabilità della risposta scende sotto la soglia).
- Eccezioni rilevate (input fuori dai pattern attesi).
- Revisione a campione periodica del lavoro "di routine" per rilevare drift sistemico.
Quanto costa davvero costruire e far girare un agente
| Costo | PMI | Mid-market | Enterprise |
|---|---|---|---|
| Setup tecnico | 3.000-15.000 € | 15.000-75.000 € | 75.000-250.000 €+ |
| Operatività mensile (LLM + infra) | 50-500 € | 500-2.500 € | 2.500-15.000 € |
| Supervisione umana (tempo persona) | 5-15 h/mese | 20-50 h/mese | 50-200 h/mese |
| Iterazione mensile | Inclusa nel retainer 200-500 €/mese | 1.500-5.000 €/mese | 5.000-25.000 €/mese |
Quando SÌ e quando NO creare un agente
| SÌ creare un agente | NO creare un agente |
|---|---|
| Volume alto e ripetitivo | Volume basso o erratico |
| Input variabile, decisione semplice | Input semplice, decisione complessa |
| Costo di errore basso o reversibile | Costo di errore alto e irreversibile |
| C'è un umano disponibile a supervisionare | Non c'è chi possiede il sistema |
| Processo stabile a 12+ mesi | Processo in cambiamento |
Materiale gratuito · PDF
Checklist di governance per agenti IA in produzione
I 4 livelli obbligatori (HITL, log, rollback, evals) spiegati passo passo. Senza questo, un agente non è un sistema — è una bomba.
Cosa ricevi
- Checklist dei 4 pezzi critici
- Template di policy d'uso per tipo di agente
- Metriche di qualità per attività (con soglie)