Deflexión real vs. deflexión inflada (cómo te engañan los números)
Cuando alguien te dice "deflectamos el 70% de tickets", la pregunta correcta no es "qué bien", es "cómo lo miden". La deflexión inflada es la trampa más común del sector — y es trivial de detectar si sabes qué buscar:
| Deflexión inflada | Deflexión real |
|---|---|
| Conversaciones que el bot inició | Tickets que se habrían escalado y no lo hicieron |
| Clientes que cerraron por silencio | Clientes que confirmaron resolución |
| % sobre todas las interacciones | % sobre tickets que requerían respuesta sustantiva |
| Sin CSAT post-interacción | Con CSAT post-interacción (>4/5) |
Los 4 componentes: KB, agente, routing, supervisión
- Base de conocimiento (KB). Estructurada, versionada, con metadatos. Sin KB sólida, todo lo demás falla.
- Agente. El LLM que responde, con system prompt claro sobre alcance, tono y límites.
- Routing. El sistema que decide cuándo escalar a humano y le pasa el contexto resumido.
- Supervisión. Revisión humana semanal de casos límite + iteración continua del KB y del agente.
Cómo se entrena el agente (no es "subes un PDF")
Entrenar el agente no es subir un PDF — es construir un buen sistema de RAG (Retrieval-Augmented Generation) que recupere la información relevante de tu KB y se la pase al modelo para que la use. El "entrenamiento" en el sentido clásico (fine-tuning) casi nunca aporta más que un buen prompt + buen RAG.
- Estructura tu KB en bloques cortos y autocontenidos con metadatos (tema, fecha, fuente).
- Crea embeddings de esos bloques con un modelo apropiado (OpenAI ada o equivalente open-source).
- Configura el retrieval: cuántos bloques recuperar por consulta, umbral de similaridad, re-ranking.
- Escribe el system prompt con instrucciones claras sobre cómo usar el contexto recuperado.
- Configura el escalado: en qué casos NO debe responder y debe pasar a humano.
El bucle de mejora continua
El soporte IA no es "lo dejas montado y a ver qué pasa". Es un bucle semanal de mejora con cuatro pasos:
- Revisión semanal de casos límite. El humano supervisor analiza 30-50 conversaciones aleatorias y marca aciertos/errores.
- Actualización del KB. Las preguntas nuevas o mal respondidas se documentan correctamente.
- Ajuste del agente. Los errores sistémicos se corrigen tocando el prompt o el routing.
- Evals automáticas. Un set de inputs representativos se ejecuta tras cada cambio para detectar regresiones.
Costes, SLAs y cuándo no merece la pena
| Tamaño | Coste setup | Coste mensual | Volumen mínimo razonable |
|---|---|---|---|
| Pyme self-serve | Incluido | 79-149 €/mes | 200+ tickets/mes repetitivos |
| Pyme custom | 3.000-8.000 € | 200-500 €/mes | 500+ tickets/mes |
| Mid-market | 8.000-25.000 € | 1.500-5.000 €/mes | 2.000+ tickets/mes |
| Enterprise | Desde 25.000 € | 5.000+ €/mes | 10.000+ tickets/mes |