Deflection reale vs. deflection gonfiata (come ti ingannano i numeri)
Quando qualcuno ti dice "deflettiamo il 70% dei ticket", la domanda giusta non è "che bello", è "come lo misurate". La deflection gonfiata è la trappola più comune del settore — e si rileva facilmente se sai cosa cercare:
| Deflection gonfiata | Deflection reale |
|---|---|
| Conversazioni iniziate dal bot | Ticket che si sarebbero escalati e non lo hanno fatto |
| Clienti che hanno chiuso per silenzio | Clienti che hanno confermato la risoluzione |
| % su tutte le interazioni | % sui ticket che richiedevano risposta sostanziale |
| Senza CSAT post-interazione | Con CSAT post-interazione (>4/5) |
I 4 componenti: KB, agente, routing, supervisione
- Base di conoscenza (KB). Strutturata, versionata, con metadati. Senza KB solida, tutto il resto fallisce.
- Agente. L'LLM che risponde, con system prompt chiaro su perimetro, tono e limiti.
- Routing. Il sistema che decide quando escalare a umano e gli passa il contesto riassunto.
- Supervisione. Revisione umana settimanale dei casi limite + iterazione continua di KB e agente.
Come si addestra l'agente (non è "carichi un PDF")
Addestrare l'agente non è caricare un PDF — è costruire un buon sistema di RAG (Retrieval-Augmented Generation) che recupera l'informazione rilevante dalla tua KB e la passa al modello perché la usi. L'"addestramento" in senso classico (fine-tuning) quasi mai aggiunge più di un buon prompt + buon RAG.
- Struttura la tua KB in blocchi corti e autocontenuti con metadati (tema, data, fonte).
- Crea embedding di quei blocchi con un modello appropriato (OpenAI ada o equivalente open-source).
- Configura il retrieval: quanti blocchi recuperare per richiesta, soglia di similarità, re-ranking.
- Scrivi il system prompt con istruzioni chiare su come usare il contesto recuperato.
- Configura l'escalation: in quali casi NON deve rispondere e deve passare a umano.
Il loop di miglioramento continuo
Il supporto IA non è "lo metti su e vediamo cosa succede". È un loop settimanale di miglioramento con quattro passi:
- Revisione settimanale dei casi limite. L'umano supervisore analizza 30-50 conversazioni casuali e marca successi/errori.
- Aggiornamento della KB. Le domande nuove o mal risposte vengono documentate correttamente.
- Aggiustamento dell'agente. Gli errori sistemici si correggono toccando il prompt o il routing.
- Eval automatiche. Un set di input rappresentativi viene eseguito dopo ogni cambio per individuare regressioni.
Costi, SLA e quando non vale la pena
| Dimensione | Costo setup | Costo mensile | Volume minimo ragionevole |
|---|---|---|---|
| PMI self-serve | Incluso | 79-149 €/mese | 200+ ticket/mese ripetitivi |
| PMI custom | 3.000-8.000 € | 200-500 €/mese | 500+ ticket/mese |
| Mid-market | 8.000-25.000 € | 1.500-5.000 €/mese | 2.000+ ticket/mese |
| Enterprise | Da 25.000 € | 5.000+ €/mese | 10.000+ ticket/mese |