Qué es realmente un agente IA (y qué es un "chatbot con sombrero")
Un agente IA, en sentido técnico estricto, es un sistema que combina un modelo de lenguaje con tres capacidades adicionales: capacidad de decidir qué herramienta usar en función del contexto, memoria persistente entre interacciones, y mecanismos de medición de su propio trabajo (evals). Cualquier sistema que carezca de las tres no es un agente — es un chatbot. La distinción no es semántica, es operativa: los chatbots responden, los agentes ejecutan.
La razón por la que el mercado está lleno de "agentes" que son chatbots con sombrero es comercial: el término "agente" vende mejor. Pero la diferencia se nota inmediatamente en producción — un chatbot bien construido es útil; un agente mal construido es una bomba. Conocer la diferencia antes de pagar es la mejor inversión que puedes hacer en este momento.
Los tres tipos de agentes que importan en empresa
No todos los agentes son iguales — tres categorías abarcan el 95% de los casos útiles en empresa. Confundirlas lleva a contratar lo que no toca.
Agente comercial (AI SDR, lead routing)
Diseñado para tareas comerciales: prospección automatizada, calificación de leads, routing de oportunidades. El más medible (ROI en reuniones generadas), el más adoptado por empresas con ciclos de venta largos. Stack típico: dominios + warmup + scoring + secuencias + integración CRM.
Agente operativo (workforce, asistente interno)
Diseñado para tareas internas repetitivas: clasificación de incoming, generación de borradores, procesamiento documental. Mide su éxito en horas ahorradas/mes. Requiere integración profunda con los sistemas internos (ERP, ITSM, etc.).
Agente de cara al cliente (soporte, comercial light)
Diseñado para interacción directa con el cliente: soporte, FAQs, agendar reuniones. El más visible y, por eso, el de mayor riesgo reputacional. Requiere supervisión rigurosa, escalado humano sólido y métricas de CSAT desde el día uno.
La arquitectura mínima: LLM, memoria, herramientas, evals
Un agente serio se compone de cuatro capas. Si tu proveedor no las puede dibujar en una servilleta, no está construyendo un agente — está vendiéndote una etiqueta.
- LLM base — GPT-4 / Claude / Llama, según privacidad, latencia y coste.
- Memoria — base vectorial (Pinecone, Weaviate, pgvector) para mantener contexto entre interacciones + memoria a corto plazo en la conversación actual.
- Herramientas (tools) — APIs, funciones, búsqueda web, conexión a tus sistemas. El agente decide cuál usar.
- Evals — set de inputs representativos con outputs esperados que se ejecutan automáticamente tras cada cambio.
Cómo se "entrena" un agente (no, no es subir un PDF)
El término "entrenamiento" se ha vuelto confuso. En 2026, "entrenar un agente" rara vez significa fine-tunear el modelo — significa construir un buen sistema de RAG (retrieval-augmented generation), escribir un system prompt sólido y configurar las herramientas correctamente.
- Prompt engineering serio. El system prompt define quién es el agente, qué puede hacer, qué no, qué tono usa y cuándo escala. Es la pieza más infravalorada y con mejor ratio impacto/coste.
- RAG sobre tu base de conocimiento. Estructurar tu KB en bloques cortos, generar embeddings, configurar retrieval con re-ranking.
- Configurar herramientas. Para cada tool, definir cuándo usarla, qué parámetros aceptar, cómo manejar errores.
- Fine-tuning (solo si es necesario). Casi nunca lo es. Solo cuando necesitas tono o estilo muy específico que el prompt no logra, o cuando hay restricciones de coste/latencia que justifican un modelo más pequeño especializado.
Human-in-the-loop: por qué no es opcional
Human-in-the-loop (HITL) significa que un humano interviene en checkpoints concretos del ciclo del agente. NO es "humano supervisando todo todo el tiempo" — es humano en los puntos donde el coste de error supera al coste de la pausa. Sin HITL en esos puntos, el agente es un experimento; con HITL, es un sistema.
- Decisiones de alto impacto (acciones irreversibles, vinculantes, con consecuencias económicas o legales).
- Casos de baja confianza del modelo (cuando la probabilidad de la respuesta cae bajo umbral).
- Excepciones detectadas (input fuera de los patrones esperados).
- Revisión muestreada periódica del trabajo "rutinario" para detectar drift sistémico.
Cuánto cuesta de verdad construir y operar un agente
| Coste | Pyme | Mid-market | Enterprise |
|---|---|---|---|
| Setup técnico | 3.000-15.000 € | 15.000-75.000 € | 75.000-250.000 €+ |
| Operación mensual (LLM + infra) | 50-500 € | 500-2.500 € | 2.500-15.000 € |
| Supervisión humana (tiempo persona) | 5-15 h/mes | 20-50 h/mes | 50-200 h/mes |
| Iteración mensual | Incluido en retainer 200-500 €/mes | 1.500-5.000 €/mes | 5.000-25.000 €/mes |
Cuándo SÍ y cuándo NO crear un agente
| SÍ crear agente | NO crear agente |
|---|---|
| Volumen alto y repetitivo | Volumen bajo o errático |
| Input variable, decisión simple | Input simple, decisión compleja |
| Coste de error bajo o reversible | Coste de error alto e irreversible |
| Hay humano disponible para supervisar | No hay quien dueñe el sistema |
| Proceso estable a 12+ meses | Proceso que está cambiando |
Material gratuito · PDF
Checklist de governance para agentes IA en producción
Las 4 capas obligatorias (HITL, logs, rollback, evals) explicadas paso a paso. Sin esto, un agente no es un sistema — es una bomba.
Qué te llevas
- Checklist de las 4 piezas críticas
- Plantilla de política de uso por tipo de agente
- Métricas de calidad por tarea (con umbrales)