Guida pillar · Creare un agente IA

Creare un agente IA: la guida che avresti dovuto leggere prima del primo prototipo

La maggior parte di quello che si vende come "agente IA" è un chatbot col cappello. Un agente vero fa tre cose che un chatbot non fa: decide quale strumento usare, mantiene memoria tra le interazioni e misura il proprio lavoro. Questa guida serve perché tu sappia la differenza prima di pagare il primo prototipo.

Vedi servizio: AI Workforce Vai al contenuto

Cos'è davvero un agente IA (e cos'è un "chatbot col cappello")

Un agente IA, in senso tecnico stretto, è un sistema che combina un modello linguistico con tre capacità in più: capacità di decidere quale strumento usare in base al contesto, memoria persistente tra interazioni e meccanismi di misurazione del proprio lavoro (evals). Qualsiasi sistema che non abbia tutte e tre non è un agente — è un chatbot. La distinzione non è semantica, è operativa: i chatbot rispondono, gli agenti eseguono.

Il motivo per cui il mercato è pieno di "agenti" che sono chatbot col cappello è commerciale: la parola "agente" vende meglio. Ma la differenza si nota subito in produzione — un chatbot ben costruito è utile; un agente mal costruito è una bomba. Conoscere la differenza prima di pagare è il miglior investimento che puoi fare in questo momento.

I tre tipi di agente che contano in azienda

Non tutti gli agenti sono uguali — tre categorie coprono il 95% dei casi utili in azienda. Confonderle porta a comprare quello che non ti serve.

Agente commerciale (AI SDR, lead routing)

Progettato per compiti commerciali: prospecting automatizzato, qualifica dei lead, routing delle opportunità. Il più misurabile (ROI in riunioni generate), il più adottato da aziende con cicli di vendita lunghi. Stack tipico: domini + warmup + scoring + sequenze + integrazione CRM.

Agente operativo (workforce, assistente interno)

Progettato per compiti interni ripetitivi: classificazione di incoming, generazione di bozze, gestione documentale. Misura il suo successo in ore risparmiate/mese. Richiede integrazione profonda con i sistemi interni (ERP, ITSM, ecc.).

Agente customer-facing (supporto, commerciale light)

Progettato per interazione diretta col cliente: supporto, FAQ, fissare riunioni. Il più visibile e, per questo, quello con maggior rischio reputazionale. Richiede supervisione rigorosa, escalation umana solida e metriche di CSAT dal giorno uno.

L'architettura minima: LLM, memoria, strumenti, evals

Un agente serio si compone di quattro strati. Se il tuo fornitore non sa disegnarli su un tovagliolo, non sta costruendo un agente — ti sta vendendo un'etichetta.

LLM base — GPT-4 / Claude / Llama, in base a privacy, latenza e costo.
Memoria — base vettoriale (Pinecone, Weaviate, pgvector) per mantenere il contesto tra interazioni + memoria a breve termine nella conversazione corrente.
Strumenti (tools) — API, funzioni, ricerca web, connessione ai tuoi sistemi. L'agente decide quale usare.
Evals — set di input rappresentativi con output attesi che girano automaticamente dopo ogni modifica.

Come si "addestra" un agente (no, non è caricare un PDF)

Il termine "addestramento" è diventato confuso. Nel 2026, "addestrare un agente" raramente significa fare fine-tuning del modello — significa costruire un buon sistema RAG (retrieval-augmented generation), scrivere un system prompt solido e configurare correttamente gli strumenti.

Prompt engineering serio. Il system prompt definisce chi è l'agente, cosa può fare, cosa no, che tono usa e quando esce. È il pezzo più sottovalutato e con il miglior rapporto impatto/costo.
RAG sulla tua knowledge base. Strutturare la KB in blocchi corti, generare embedding, configurare retrieval con re-ranking.
Configurare gli strumenti. Per ogni tool, definire quando usarlo, quali parametri accettare, come gestire gli errori.
Fine-tuning (solo se necessario). Quasi mai lo è. Solo quando ti serve un tono o uno stile molto specifico irraggiungibile col prompt, o quando ci sono vincoli di costo/latenza che giustificano un modello più piccolo specializzato.

Human-in-the-loop: perché non è opzionale

Human-in-the-loop (HITL) significa che un umano interviene in checkpoint concreti del ciclo dell'agente. NON è "umano che supervisiona tutto sempre" — è umano nei punti in cui il costo dell'errore supera il costo della pausa. Senza HITL in quei punti, l'agente è un esperimento; con HITL, è un sistema.

Decisioni ad alto impatto (azioni irreversibili, vincolanti, con conseguenze economiche o legali).
Casi a bassa confidenza del modello (quando la probabilità della risposta scende sotto la soglia).
Eccezioni rilevate (input fuori dai pattern attesi).
Revisione a campione periodica del lavoro "di routine" per rilevare drift sistemico.

Quanto costa davvero costruire e far girare un agente

Costo	PMI	Mid-market	Enterprise
Setup tecnico	3.000-15.000 €	15.000-75.000 €	75.000-250.000 €+
Operatività mensile (LLM + infra)	50-500 €	500-2.500 €	2.500-15.000 €
Supervisione umana (tempo persona)	5-15 h/mese	20-50 h/mese	50-200 h/mese
Iterazione mensile	Inclusa nel retainer 200-500 €/mese	1.500-5.000 €/mese	5.000-25.000 €/mese

Quando SÌ e quando NO creare un agente

SÌ creare un agente	NO creare un agente
Volume alto e ripetitivo	Volume basso o erratico
Input variabile, decisione semplice	Input semplice, decisione complessa
Costo di errore basso o reversibile	Costo di errore alto e irreversibile
C'è un umano disponibile a supervisionare	Non c'è chi possiede il sistema
Processo stabile a 12+ mesi	Processo in cambiamento

Materiale gratuito · PDF

Checklist di governance per agenti IA in produzione

I 4 livelli obbligatori (HITL, log, rollback, evals) spiegati passo passo. Senza questo, un agente non è un sistema — è una bomba.

Cosa ricevi

Checklist dei 4 pezzi critici
Template di policy d'uso per tipo di agente
Metriche di qualità per attività (con soglie)

Materiale gratuito · PDF

Checklist di governance per agenti IA in produzione

I 4 livelli obbligatori (HITL, log, rollback, evals) spiegati passo passo. Senza questo, un agente non è un sistema — è una bomba.

Cosa ricevi

Checklist dei 4 pezzi critici
Template di policy d'uso per tipo di agente
Metriche di qualità per attività (con soglie)

Servizio associato

AI Workforce

Agenti specializzati (SDR, assistente, operatore, ricercatore) con orchestrazione e human-in-the-loop.

Vedi servizio

Continua a leggere · 6 guide

Domande frequenti

Per uno base no. Piattaforme come n8n, Make AI, Voiceflow o gli Assistants di OpenAI ti permettono di montare agenti funzionanti senza codice. Per agenti seri — quelli che si integrano coi tuoi sistemi reali, gestiscono errori e si monitorano — sì serve qualcuno tecnico, anche non tu. La linea tra "agente carino in demo" e "agente che lavora" si attraversa col codice.

Un agente base (un assistente sulla tua KB, un chatbot di supporto semplice) può essere in una settimana. Un agente serio — con integrazioni CRM, strumenti, escalation umana ed eval — tra 6 e 12 settimane. Qualsiasi fornitore che ti prometta "agente enterprise in 3 giorni" ti sta vendendo una demo in giacca e cravatta.

Per prototipare: OpenAI Assistants (veloce, semplice). Per produzione no-code/low-code: n8n o Make AI. Per sistemi complessi con orchestrazione seria: LangChain o LangGraph (serve un dev). La scelta dipende meno dalla piattaforma e più da chi opererà l'agente nel giorno per giorno. Inizia col più semplice che copra il tuo caso — puoi sempre salire di layer.

Quattro pezzi: (1) policy d'uso chiara — cosa può e cosa non può fare; (2) log auditabili di ogni decisione e azione; (3) human-in-the-loop per decisioni critiche; (4) review periodica del comportamento (eval automatiche + review umana). Senza queste quattro, l'agente è un esperimento, non un sistema in produzione.

Dipende dal sistema attorno. Ben progettato: l'agente rileva l'incertezza, scala a un umano e la situazione si risolve con poco attrito. Mal progettato: l'agente esegue l'azione sbagliata con piena fiducia e te ne accorgi quando un cliente si lamenta. La qualità di un agente non si misura quando ci prende — si misura quando dubita.

I servizi che implementano quello che la guida spiega

La parte difficile — implementare quanto sopra — è il nostro lavoro.

Piano d'Impatto IA · gratis

La guida è generica. Il tuo piano no.

Raccontaci la tua azienda e ti restituiamo una diagnosi con priorità, numeri e cosa implementare per primo. Senza call commerciale e senza pagare un euro.

Continua con queste

Come creare un agente IA per le vendite (un AI SDR vero)Come creare un AI SDR: architettura completa dell'outbound automatizzato Come creare un chatbot IA che non sia "un chatbot col cappello"