Creare un agente IA · Guida 5 di 6

Come addestrare un agente IA: dati, eval, governance

Addestrare un agente IA non è "caricare un PDF" né "fine-tunare il modello". Nel 2026, quasi sempre è costruire un buon sistema RAG, scrivere le eval che misurano se risponde bene, e progettare il ciclo che migliora sulla base di dati reali. Il resto è vocabolario che confonde — e che costa soldi.

Conversazione tecnica → Infrastruttura IA enterprise Torna al pillar

I 4 livelli di "addestramento": prompt, RAG, fine-tune, agent training

Livello	Cos'è	Quando
Prompt engineering	Scrivere buone istruzioni (system prompt)	Sempre — base di tutto
RAG	Connettere il modello alla tua knowledge base	Quando l'agente deve usare info specifiche tue
Fine-tuning	Aggiustare il modello con i tuoi esempi	Raramente — solo casi molto specifici
Agent training	Iterare sull'agente completo con eval	Sempre — ciclo continuo

Quale ti tocca in base al tuo caso

90% dei casi: prompt + RAG + agent training. Senza fine-tuning.
Ti serve un tono o stile molto specifico irraggiungibile col prompt: considera fine-tuning su un modello piccolo.
Vincoli di latenza/costo: fine-tuning su Llama o modello simile per girare più veloce e più economico.
Dati altamente specializzati (medicina, legale): combinazione di RAG potente + fine-tuning selettivo.

Come si costruiscono le eval (la parte che quasi nessuno fa)

Le eval sono il pezzo che separa un agente serio da una demo carina. E quasi nessuno le fa. Il processo:

Raccogli 50-200 input rappresentativi dei casi reali che l'agente gestirà.
Definisci l'output atteso per ognuno — o il range di output accettabili.
Definisci criteri di valutazione automatica — metriche misurabili (correttezza fattuale, formato, assenza di allucinazioni).
Esegui dopo ogni modifica dell'agente (prompt, RAG config, modello). Se il punteggio cala, non si rilascia.
Iterazione del set — aggiungi casi limite che individui in produzione.

Il loop di miglioramento continuo

La produzione cattura interazioni reali con feedback (CSAT, errori rilevati).
Revisione settimanale da parte di un umano: identificazione di pattern di errore.
Aggiornamento di KB / prompt / config in base a quello che hai trovato.
Esecuzione delle eval per validare che non ci siano regressioni.
Rilascio del cambiamento.
Ritorno al passo 1.

Governance e dati sensibili

API in piano business. OpenAI API e Anthropic API in piano business non si addestrano sui tuoi dati. Conferma nel tuo DPA.
Anonimizzazione quando possibile. I pattern aggiungono valore al modello; i nomi no.
Log cifrati. Se conservi conversazioni, cifra almeno quelle che contengono dati personali.
Retention minima. Non conservare quello che non ti serve. Policy chiara di cancellazione.
Audit regolare di quali dati entrano nel modello e da dove.

Domande frequenti

Nel 2026, quasi mai. I modelli base sono così buoni e il RAG così flessibile che il 90% dei casi si risolve con prompt + RAG fatti bene. Il fine-tuning serve quando: (1) ti serve un tono o stile molto specifico che non ottieni col prompt, (2) hai vincoli di latenza/costo che giustificano un modello più piccolo specializzato. Se ti propongono fine-tuning come prima opzione, chiedi perché non RAG.

Con eval: un set di input rappresentativi + output attesi + criteri di valutazione automatica. Le eval girano a ogni cambio dell'agente e danno un punteggio. Se il tuo agente "funziona" ma non hai eval, non lo sai — hai un'intuizione. La differenza tra un agente serio e una bella demo è quasi sempre se ci sono eval o no.

Per iniziare: Promptfoo o LangSmith. Per produzione seria: Braintrust o Galileo. Team molto tecnico e vuoi open-source: DeepEval. La scelta conta meno dell'abitudine — il problema non è quale tool, è che la maggior parte dei team non fa eval per niente.

Piano d'Impatto IA · gratis

La guida è generica. Il tuo piano no.

Raccontaci la tua azienda e ti restituiamo una diagnosi con priorità, numeri e cosa implementare per primo. Senza call commerciale e senza pagare un euro.

Continua con queste

Creare un agente IA: la guida che avresti dovuto leggere prima del primo prototipo Come creare un agente IA per le vendite (un AI SDR vero)Come creare un AI SDR: architettura completa dell'outbound automatizzato