Cómo automatizar el soporte con IA: deflexión real, no demo

Automatizar el soporte con IA no es montar un chatbot y rezar. Es decidir cuántos tickets puedes razonablemente deflectar, montar el sistema que los deflecte y construir un puente humano para el resto. El éxito se mide en deflexión real, no en clics.

Deflexión real vs. deflexión inflada (cómo te engañan los números)

Cuando alguien te dice "deflectamos el 70% de tickets", la pregunta correcta no es "qué bien", es "cómo lo miden". La deflexión inflada es la trampa más común del sector — y es trivial de detectar si sabes qué buscar:

Deflexión inflada	Deflexión real
Conversaciones que el bot inició	Tickets que se habrían escalado y no lo hicieron
Clientes que cerraron por silencio	Clientes que confirmaron resolución
% sobre todas las interacciones	% sobre tickets que requerían respuesta sustantiva
Sin CSAT post-interacción	Con CSAT post-interacción (>4/5)

Los 4 componentes: KB, agente, routing, supervisión

Base de conocimiento (KB). Estructurada, versionada, con metadatos. Sin KB sólida, todo lo demás falla.
Agente. El LLM que responde, con system prompt claro sobre alcance, tono y límites.
Routing. El sistema que decide cuándo escalar a humano y le pasa el contexto resumido.
Supervisión. Revisión humana semanal de casos límite + iteración continua del KB y del agente.

Cómo se entrena el agente (no es "subes un PDF")

Entrenar el agente no es subir un PDF — es construir un buen sistema de RAG (Retrieval-Augmented Generation) que recupere la información relevante de tu KB y se la pase al modelo para que la use. El "entrenamiento" en el sentido clásico (fine-tuning) casi nunca aporta más que un buen prompt + buen RAG.

Estructura tu KB en bloques cortos y autocontenidos con metadatos (tema, fecha, fuente).
Crea embeddings de esos bloques con un modelo apropiado (OpenAI ada o equivalente open-source).
Configura el retrieval: cuántos bloques recuperar por consulta, umbral de similaridad, re-ranking.
Escribe el system prompt con instrucciones claras sobre cómo usar el contexto recuperado.
Configura el escalado: en qué casos NO debe responder y debe pasar a humano.

El bucle de mejora continua

El soporte IA no es "lo dejas montado y a ver qué pasa". Es un bucle semanal de mejora con cuatro pasos:

Revisión semanal de casos límite. El humano supervisor analiza 30-50 conversaciones aleatorias y marca aciertos/errores.
Actualización del KB. Las preguntas nuevas o mal respondidas se documentan correctamente.
Ajuste del agente. Los errores sistémicos se corrigen tocando el prompt o el routing.
Evals automáticas. Un set de inputs representativos se ejecuta tras cada cambio para detectar regresiones.

Costes, SLAs y cuándo no merece la pena

Tamaño	Coste setup	Coste mensual	Volumen mínimo razonable
Pyme self-serve	Incluido	79-149 €/mes	200+ tickets/mes repetitivos
Pyme custom	3.000-8.000 €	200-500 €/mes	500+ tickets/mes
Mid-market	8.000-25.000 €	1.500-5.000 €/mes	2.000+ tickets/mes
Enterprise	Desde 25.000 €	5.000+ €/mes	10.000+ tickets/mes

Preguntas frecuentes

Self-serve, con tu FAQ y tu KB: 24-48h para tener algo respondiendo. Versión seria, integrada con Zendesk/Intercom y entrenada sobre histórico de tickets: 3-6 semanas hasta producción. Cualquier proveedor que te prometa "agente entrenado para tu negocio en una hora" está vendiendo demo, no producto.

El agente IA NO negocia. Punto. Cualquier intento de pedir descuento, condiciones especiales o reclamación se escala automáticamente a humano con todo el contexto resumido. Es la regla principal: el agente gestiona lo predecible; lo que requiere criterio comercial pasa a una persona. Sin esa regla, te metes en líos legales y comerciales reales.

Sí, mejor de lo que parece. Los LLMs modernos manejan multi-idioma de forma nativa: el agente detecta el idioma del cliente y responde en el mismo, sin que tengas que mantener dos KBs separadas. La excepción son idiomas con poca presencia en datos de entrenamiento — ahí baja la calidad de las respuestas.