Vai al contenuto
Implementa.

Guida pillar · Creare un agente IA

Creare un agente IA: la guida che avresti dovuto leggere prima del primo prototipo

La maggior parte di quello che si vende come "agente IA" è un chatbot col cappello. Un agente vero fa tre cose che un chatbot non fa: decide quale strumento usare, mantiene memoria tra le interazioni e misura il proprio lavoro. Questa guida serve perché tu sappia la differenza prima di pagare il primo prototipo.

Cos'è davvero un agente IA (e cos'è un "chatbot col cappello")

Un agente IA, in senso tecnico stretto, è un sistema che combina un modello linguistico con tre capacità in più: capacità di decidere quale strumento usare in base al contesto, memoria persistente tra interazioni e meccanismi di misurazione del proprio lavoro (evals). Qualsiasi sistema che non abbia tutte e tre non è un agente — è un chatbot. La distinzione non è semantica, è operativa: i chatbot rispondono, gli agenti eseguono.

Il motivo per cui il mercato è pieno di "agenti" che sono chatbot col cappello è commerciale: la parola "agente" vende meglio. Ma la differenza si nota subito in produzione — un chatbot ben costruito è utile; un agente mal costruito è una bomba. Conoscere la differenza prima di pagare è il miglior investimento che puoi fare in questo momento.

I tre tipi di agente che contano in azienda

Non tutti gli agenti sono uguali — tre categorie coprono il 95% dei casi utili in azienda. Confonderle porta a comprare quello che non ti serve.

Agente commerciale (AI SDR, lead routing)

Progettato per compiti commerciali: prospecting automatizzato, qualifica dei lead, routing delle opportunità. Il più misurabile (ROI in riunioni generate), il più adottato da aziende con cicli di vendita lunghi. Stack tipico: domini + warmup + scoring + sequenze + integrazione CRM.

Agente operativo (workforce, assistente interno)

Progettato per compiti interni ripetitivi: classificazione di incoming, generazione di bozze, gestione documentale. Misura il suo successo in ore risparmiate/mese. Richiede integrazione profonda con i sistemi interni (ERP, ITSM, ecc.).

Agente customer-facing (supporto, commerciale light)

Progettato per interazione diretta col cliente: supporto, FAQ, fissare riunioni. Il più visibile e, per questo, quello con maggior rischio reputazionale. Richiede supervisione rigorosa, escalation umana solida e metriche di CSAT dal giorno uno.

L'architettura minima: LLM, memoria, strumenti, evals

Un agente serio si compone di quattro strati. Se il tuo fornitore non sa disegnarli su un tovagliolo, non sta costruendo un agente — ti sta vendendo un'etichetta.

  1. LLM base — GPT-4 / Claude / Llama, in base a privacy, latenza e costo.
  2. Memoria — base vettoriale (Pinecone, Weaviate, pgvector) per mantenere il contesto tra interazioni + memoria a breve termine nella conversazione corrente.
  3. Strumenti (tools) — API, funzioni, ricerca web, connessione ai tuoi sistemi. L'agente decide quale usare.
  4. Evals — set di input rappresentativi con output attesi che girano automaticamente dopo ogni modifica.

Come si "addestra" un agente (no, non è caricare un PDF)

Il termine "addestramento" è diventato confuso. Nel 2026, "addestrare un agente" raramente significa fare fine-tuning del modello — significa costruire un buon sistema RAG (retrieval-augmented generation), scrivere un system prompt solido e configurare correttamente gli strumenti.

  1. Prompt engineering serio. Il system prompt definisce chi è l'agente, cosa può fare, cosa no, che tono usa e quando esce. È il pezzo più sottovalutato e con il miglior rapporto impatto/costo.
  2. RAG sulla tua knowledge base. Strutturare la KB in blocchi corti, generare embedding, configurare retrieval con re-ranking.
  3. Configurare gli strumenti. Per ogni tool, definire quando usarlo, quali parametri accettare, come gestire gli errori.
  4. Fine-tuning (solo se necessario). Quasi mai lo è. Solo quando ti serve un tono o uno stile molto specifico irraggiungibile col prompt, o quando ci sono vincoli di costo/latenza che giustificano un modello più piccolo specializzato.

Human-in-the-loop: perché non è opzionale

Human-in-the-loop (HITL) significa che un umano interviene in checkpoint concreti del ciclo dell'agente. NON è "umano che supervisiona tutto sempre" — è umano nei punti in cui il costo dell'errore supera il costo della pausa. Senza HITL in quei punti, l'agente è un esperimento; con HITL, è un sistema.

  • Decisioni ad alto impatto (azioni irreversibili, vincolanti, con conseguenze economiche o legali).
  • Casi a bassa confidenza del modello (quando la probabilità della risposta scende sotto la soglia).
  • Eccezioni rilevate (input fuori dai pattern attesi).
  • Revisione a campione periodica del lavoro "di routine" per rilevare drift sistemico.

Quanto costa davvero costruire e far girare un agente

CostoPMIMid-marketEnterprise
Setup tecnico3.000-15.000 €15.000-75.000 €75.000-250.000 €+
Operatività mensile (LLM + infra)50-500 €500-2.500 €2.500-15.000 €
Supervisione umana (tempo persona)5-15 h/mese20-50 h/mese50-200 h/mese
Iterazione mensileInclusa nel retainer 200-500 €/mese1.500-5.000 €/mese5.000-25.000 €/mese

Quando SÌ e quando NO creare un agente

SÌ creare un agenteNO creare un agente
Volume alto e ripetitivoVolume basso o erratico
Input variabile, decisione sempliceInput semplice, decisione complessa
Costo di errore basso o reversibileCosto di errore alto e irreversibile
C'è un umano disponibile a supervisionareNon c'è chi possiede il sistema
Processo stabile a 12+ mesiProcesso in cambiamento

Materiale gratuito · PDF

Checklist di governance per agenti IA in produzione

I 4 livelli obbligatori (HITL, log, rollback, evals) spiegati passo passo. Senza questo, un agente non è un sistema — è una bomba.

Cosa ricevi

  • Checklist dei 4 pezzi critici
  • Template di policy d'uso per tipo di agente
  • Metriche di qualità per attività (con soglie)

Domande frequenti

Per uno base no. Piattaforme come n8n, Make AI, Voiceflow o gli Assistants di OpenAI ti permettono di montare agenti funzionanti senza codice. Per agenti seri — quelli che si integrano coi tuoi sistemi reali, gestiscono errori e si monitorano — sì serve qualcuno tecnico, anche non tu. La linea tra "agente carino in demo" e "agente che lavora" si attraversa col codice.

Un agente base (un assistente sulla tua KB, un chatbot di supporto semplice) può essere in una settimana. Un agente serio — con integrazioni CRM, strumenti, escalation umana ed eval — tra 6 e 12 settimane. Qualsiasi fornitore che ti prometta "agente enterprise in 3 giorni" ti sta vendendo una demo in giacca e cravatta.

Per prototipare: OpenAI Assistants (veloce, semplice). Per produzione no-code/low-code: n8n o Make AI. Per sistemi complessi con orchestrazione seria: LangChain o LangGraph (serve un dev). La scelta dipende meno dalla piattaforma e più da chi opererà l'agente nel giorno per giorno. Inizia col più semplice che copra il tuo caso — puoi sempre salire di layer.

Quattro pezzi: (1) policy d'uso chiara — cosa può e cosa non può fare; (2) log auditabili di ogni decisione e azione; (3) human-in-the-loop per decisioni critiche; (4) review periodica del comportamento (eval automatiche + review umana). Senza queste quattro, l'agente è un esperimento, non un sistema in produzione.

Dipende dal sistema attorno. Ben progettato: l'agente rileva l'incertezza, scala a un umano e la situazione si risolve con poco attrito. Mal progettato: l'agente esegue l'azione sbagliata con piena fiducia e te ne accorgi quando un cliente si lamenta. La qualità di un agente non si misura quando ci prende — si misura quando dubita.

Lo leggi, o te lo mettiamo in produzione?

Questa guida copre la parte del pensare. Implementarla — e renderla misurabile — è quello per cui ci paghi.

Creare un agente IA: la guida che avresti dovuto leggere prima del primo prototipo · Implementa