Saltar al contenido principal
StudioMeyer.

Integración LLM · Agentic AI

LLMs que realmente trabajan. No solo hablan.

Function calling y tool use con Claude y GPT. Tu agente IA reserva citas, envía mails, escribe facturas, consulta tu base de datos, llama APIs externas. Con guardrails, flujos de aprobación para acciones sensibles y audit trail completo. Esto es lo que nos diferencia de una tienda de chatbots.

Qué obtienes

Seis bloques para un agente LLM listo para producción

Un agente en demo es fácil. Un agente que funcione correctamente durante meses y no envíe facturas equivocadas de repente es ingeniería. Construimos todo el stack incluyendo red de seguridad.

Inventario de tools con mapa de permisos
Repasamos qué acciones puede tomar el agente. Leer suele estar bien, escribir con aprobación, borrar nunca sin humano. Por tool definimos scope, inputs, rate-limits y comportamiento sandbox.
Function schemas (OpenAI más Anthropic)
Esquemas JSON limpios para cada tool. Descripciones claras para que el agente escoja la tool correcta en el momento correcto. Tests de schema previenen alucinaciones en parámetros.
Guardrails y flujos de aprobación
Qué hace el agente solo, qué necesita aprobación. Ejemplo: reserva de cita sin preguntar, envío de factura con aprobación de un click, transferencia de dinero nunca sin sign-off humano. Configurable por tool.
Orquestación multi-tool
Tareas complejas requieren varias tools en secuencia. Construimos la lógica de orquestación más error handling, si tool 3 falla, el agente sabe deshacer tools 1 y 2.
Audit trail y logging
Cada acción del agente queda loggeada con timestamp, input, output, confianza. Puedes rastrear por qué el agente tomó acción Y en situación X. Importante para compliance.
Fallback a humano
Cuando el agente duda, llega a complejidad o se encuentra con una constelación inusual, escala a ti o a un empleado definido. Con todos los datos y su razonamiento hasta ahora.

Para qué se usa

Cinco setups concretos de agentic AI

Agencia de viajes con reservas multi-paso

Agente reserva vuelo más hotel más coche más transfer, envía confirmación al cliente, crea la reserva en el CRM, programa la llamada de follow-up. Todo en una conversación con el cliente, humano interviene solo en casos especiales.

Bufete con onboarding de clientes

Agente registra nuevo cliente en el sistema contable, crea contrato de tratamiento inicial desde plantilla, envía documento para firma, programa la reunión de kick-off. Acciones sensibles (factura) necesitan aprobación del abogado responsable.

Tienda online con cancelación de pedidos

Cliente dice cancela mi pedido. Agente cancela en la tienda, inicia reembolso vía Stripe o Klarna, notifica al almacén, escribe mail de confirmación. Todo en 30 segundos, sin humano.

Software de consulta médica con pipeline de citas

Agente registra nuevo paciente, verifica estado del seguro vía API del seguro, reserva slot apropiado en el calendario, envía recordatorio SMS 24h antes. Escala a recepción para pacientes privados.

Oficio con pedidos de material

Jefe de obra dice pide material X para obra Y. Agente verifica stock, busca la pieza en tres proveedores, compara precio y plazo, hace el pedido, agenda entrega en la planificación. Aprobación del dueño para pedidos sobre 1.000 EUR.

Cómo funciona

Cuatro fases del inventario de acciones a producción

  1. 01

    Inventario de acciones con evaluación de riesgo

    Una semana. Repasamos todas las acciones que el agente podría tomar contigo y uno o dos empleados clave. Por acción: valor si correcto, daño si erróneo, reversibilidad. De ahí derivamos la lógica de aprobación.

  2. 02

    Function schemas y guardrails

    Construimos los function schemas para todas las acciones aprobadas. Cada schema recibe tests contra mis-calls típicos (parámetros erróneos, campos faltantes, alucinaciones). La configuración de guardrails define qué es solo vs con aprobación vs nunca.

  3. 03

    Test sandbox con datos reales

    Corremos el agente en sandbox con datos de prueba. Nos das 20-50 escenarios (incluyendo edge cases), testeamos cada uno. Criterio de éxito: 90%+ acciones correctas, 0% acciones dañinas sin aprobación.

  4. 04

    Rollout a producción con audit trail

    Agente entra en vivo. Audit trail corre desde el primer día. Primeros 14 días estamos cerca (revisión diaria de logs), luego pasamos a monitoreo semanal. Si hay drift o anomalías, ajustamos guardrails.

FAQ

Preguntas frecuentes sobre agentic AI

¿Cuál es la diferencia con un chatbot normal?

Un chatbot responde con texto. Un agente ejecuta acciones. El chatbot te dice las horas de oficina, el agente realmente te reserva la cita. Function calling es la base técnica, el LLM recibe esquemas de tools y puede llamarlas en vez de solo generar texto. Los modelos más actuales de Anthropic (Claude) y OpenAI (GPT) lo hacen bien.

¿Qué modelos hacen function calling limpio?

Para producción recomendamos los modelos top-tier más actuales de Anthropic (Claude) y OpenAI (GPT). Entregan orquestación multi-tool fiable. Los modelos locales pueden manejar workflows de agente simples pero con tasa de alucinación más alta en setups multi-tool complejos. Elegimos según sensibilidad de datos y complejidad.

¿Qué pasa si el agente hace una acción equivocada?

Tres capas de seguridad: 1) Guardrails determinan qué acciones están permitidas 2) Flujos de aprobación piden sign-off humano para acciones sensibles 3) Audit trail documenta cada acción para rastreo y posible reversión. Además: construimos operaciones reversibles cuando es posible (p.ej. soft-delete en vez de hard-delete).

¿Cómo funciona el flujo de aprobación concretamente?

Ejemplo: agente quiere enviar factura a cliente. En vez de enviar directamente, manda Slack o Telegram o mail al empleado responsable con los detalles. Este responde *sí* o *no* o *cambia X*. Solo entonces el agente ejecuta. Latencia de aprobación: segundos a minutos según setup.

¿Quién responde si el agente hace algo mal?

Desde perspectiva RGPD y responsabilidad, el agente es una herramienta, tú eres el responsable. Por eso guardrails más flujos de aprobación son importantes, muestran que tomaste medidas razonables. Documentamos el setup auditable. Para sectores específicos (fiscal, médico, legal) traemos abogado especialista antes de producción, eso es parte del paquete.

¿RGPD con llamadas a tools externas?

Cuando el agente llama a OpenAI o Anthropic, aplican sus contratos de tratamiento más opciones de hosting UE. Para llamadas API a tus propios sistemas, los datos quedan en tu infraestructura. Para APIs de terceros (p.ej. sistema externo de reservas) los datos van allí, hacemos mapeo RGPD por tool antes de producción y exponemos los contratos.

Siguiente paso

Llamada inicial 30 minutos gratis.

Miramos qué workflows quieres automatizar, qué acciones son sensibles y si agentic AI es la palanca correcta para tu caso. Evaluación honesta en vez de pitch comercial.