Come automatizzare il supporto con IA: deflection reale, non demo

Automatizzare il supporto con IA non è mettere su un chatbot e sperare. È decidere quanti ticket puoi ragionevolmente deflettere, costruire il sistema che li deflette e progettare il ponte umano per il resto. Il successo si misura in deflection reale, non in clic.

Deflection reale vs. deflection gonfiata (come ti ingannano i numeri)

Quando qualcuno ti dice "deflettiamo il 70% dei ticket", la domanda giusta non è "che bello", è "come lo misurate". La deflection gonfiata è la trappola più comune del settore — e si rileva facilmente se sai cosa cercare:

Deflection gonfiata	Deflection reale
Conversazioni iniziate dal bot	Ticket che si sarebbero escalati e non lo hanno fatto
Clienti che hanno chiuso per silenzio	Clienti che hanno confermato la risoluzione
% su tutte le interazioni	% sui ticket che richiedevano risposta sostanziale
Senza CSAT post-interazione	Con CSAT post-interazione (>4/5)

I 4 componenti: KB, agente, routing, supervisione

Base di conoscenza (KB). Strutturata, versionata, con metadati. Senza KB solida, tutto il resto fallisce.
Agente. L'LLM che risponde, con system prompt chiaro su perimetro, tono e limiti.
Routing. Il sistema che decide quando escalare a umano e gli passa il contesto riassunto.
Supervisione. Revisione umana settimanale dei casi limite + iterazione continua di KB e agente.

Come si addestra l'agente (non è "carichi un PDF")

Addestrare l'agente non è caricare un PDF — è costruire un buon sistema di RAG (Retrieval-Augmented Generation) che recupera l'informazione rilevante dalla tua KB e la passa al modello perché la usi. L'"addestramento" in senso classico (fine-tuning) quasi mai aggiunge più di un buon prompt + buon RAG.

Struttura la tua KB in blocchi corti e autocontenuti con metadati (tema, data, fonte).
Crea embedding di quei blocchi con un modello appropriato (OpenAI ada o equivalente open-source).
Configura il retrieval: quanti blocchi recuperare per richiesta, soglia di similarità, re-ranking.
Scrivi il system prompt con istruzioni chiare su come usare il contesto recuperato.
Configura l'escalation: in quali casi NON deve rispondere e deve passare a umano.

Il loop di miglioramento continuo

Il supporto IA non è "lo metti su e vediamo cosa succede". È un loop settimanale di miglioramento con quattro passi:

Revisione settimanale dei casi limite. L'umano supervisore analizza 30-50 conversazioni casuali e marca successi/errori.
Aggiornamento della KB. Le domande nuove o mal risposte vengono documentate correttamente.
Aggiustamento dell'agente. Gli errori sistemici si correggono toccando il prompt o il routing.
Eval automatiche. Un set di input rappresentativi viene eseguito dopo ogni cambio per individuare regressioni.

Costi, SLA e quando non vale la pena

Dimensione	Costo setup	Costo mensile	Volume minimo ragionevole
PMI self-serve	Incluso	79-149 €/mese	200+ ticket/mese ripetitivi
PMI custom	3.000-8.000 €	200-500 €/mese	500+ ticket/mese
Mid-market	8.000-25.000 €	1.500-5.000 €/mese	2.000+ ticket/mese
Enterprise	Da 25.000 €	5.000+ €/mese	10.000+ ticket/mese

Domande frequenti

Self-serve, con la tua FAQ e KB: 24-48h per avere qualcosa che risponde. Versione seria, integrata con Zendesk/Intercom e addestrata sullo storico ticket: 3-6 settimane fino alla produzione. Qualunque fornitore che ti prometta "agente addestrato per il tuo business in un'ora" ti vende demo, non prodotto.

L'agente IA NON tratta. Punto. Ogni tentativo di chiedere sconto, condizioni speciali o reclamo si scala automaticamente a un umano con tutto il contesto riassunto. È la regola principale: l'agente gestisce il prevedibile; quello che richiede criterio commerciale passa a una persona. Senza quella regola, finisci in guai legali e commerciali veri.

Sì, meglio di quanto sembri. Gli LLM moderni gestiscono il multilingua nativamente: l'agente rileva la lingua del cliente e risponde nella stessa, senza che tu mantenga due KB separate. Eccezione: lingue con poca presenza nei dati di training — lì la qualità scende.