Saltar al contenido principal
StudioMeyer

Integración LLM · Agentic AI

LLMs que realmente trabajan. No solo hablan.

Function calling y tool use con Claude y GPT. Tu agente IA reserva citas, envía mails, escribe facturas, consulta tu base de datos, llama APIs externas. Con guardrails, flujos de aprobación para acciones sensibles y audit trail completo. Esto es lo que nos diferencia de una tienda de chatbots.

Qué obtienes

Seis bloques para un agente LLM listo para producción

Un agente en demo es fácil. Un agente que funcione correctamente durante meses y no envíe facturas equivocadas de repente es ingeniería. Construimos todo el stack incluyendo red de seguridad.

Inventario de tools con mapa de permisos
Repasamos qué acciones puede tomar el agente. Leer suele estar bien, escribir con aprobación, borrar nunca sin humano. Por tool definimos scope, inputs, rate-limits y comportamiento sandbox.
Function schemas (OpenAI más Anthropic)
Esquemas JSON limpios para cada tool. Descripciones claras para que el agente escoja la tool correcta en el momento correcto. Tests de schema previenen alucinaciones en parámetros.
Guardrails y flujos de aprobación
Qué hace el agente solo, qué necesita aprobación. Ejemplo: reserva de cita sin preguntar, envío de factura con aprobación de un click, transferencia de dinero nunca sin sign-off humano. Configurable por tool.
Orquestación multi-tool
Tareas complejas requieren varias tools en secuencia. Construimos la lógica de orquestación más error handling — si tool 3 falla, el agente sabe deshacer tools 1 y 2.
Audit trail y logging
Cada acción del agente queda loggeada con timestamp, input, output, confianza. Puedes rastrear por qué el agente tomó acción Y en situación X. Importante para compliance.
Fallback a humano
Cuando el agente duda, llega a complejidad o se encuentra con una constelación inusual, escala a ti o a un empleado definido. Con todos los datos y su razonamiento hasta ahora.

Para qué se usa

Cinco setups concretos de agentic AI

Agencia de viajes con reservas multi-paso

Agente reserva vuelo más hotel más coche más transfer, envía confirmación al cliente, crea la reserva en el CRM, programa la llamada de follow-up. Todo en una conversación con el cliente, humano interviene solo en casos especiales.

Bufete con onboarding de clientes

Agente registra nuevo cliente en el sistema contable, crea contrato de tratamiento inicial desde plantilla, envía documento para firma, programa la reunión de kick-off. Acciones sensibles (factura) necesitan aprobación del abogado responsable.

Tienda online con cancelación de pedidos

Cliente dice cancela mi pedido. Agente cancela en la tienda, inicia reembolso vía Stripe o Klarna, notifica al almacén, escribe mail de confirmación. Todo en 30 segundos, sin humano.

Software de consulta médica con pipeline de citas

Agente registra nuevo paciente, verifica estado del seguro vía API del seguro, reserva slot apropiado en el calendario, envía recordatorio SMS 24h antes. Escala a recepción para pacientes privados.

Oficio con pedidos de material

Jefe de obra dice pide material X para obra Y. Agente verifica stock, busca la pieza en tres proveedores, compara precio y plazo, hace el pedido, agenda entrega en la planificación. Aprobación del dueño para pedidos sobre 1.000 EUR.

Cómo funciona

Cuatro fases del inventario de acciones a producción

  1. 01

    Inventario de acciones con evaluación de riesgo

    Una semana. Repasamos todas las acciones que el agente podría tomar contigo y uno o dos empleados clave. Por acción: valor si correcto, daño si erróneo, reversibilidad. De ahí derivamos la lógica de aprobación.

  2. 02

    Function schemas y guardrails

    Construimos los function schemas para todas las acciones aprobadas. Cada schema recibe tests contra mis-calls típicos (parámetros erróneos, campos faltantes, alucinaciones). La configuración de guardrails define qué es solo vs con aprobación vs nunca.

  3. 03

    Test sandbox con datos reales

    Corremos el agente en sandbox con datos de prueba. Nos das 20-50 escenarios (incluyendo edge cases), testeamos cada uno. Criterio de éxito: 90%+ acciones correctas, 0% acciones dañinas sin aprobación.

  4. 04

    Rollout a producción con audit trail

    Agente entra en vivo. Audit trail corre desde el primer día. Primeros 14 días estamos cerca (revisión diaria de logs), luego pasamos a monitoreo semanal. Si hay drift o anomalías, ajustamos guardrails.

Precio

Desde 2.500 EUR setup por caso de uso más 199-499 EUR/mes hosting

Setups simples (dos a cuatro tools, un workflow claro): desde 2.500 EUR único más 199 EUR/mes hosting. Agentes multi-tool más complejos (cinco a diez tools, varios workflows, jerarquía de aprobación): desde 4.500 EUR setup más 299-499 EUR/mes. Costes LLM corren separados en tu cuenta OpenAI o Anthropic. Damos proyección antes.

Ver precios y paquetes

FAQ

Preguntas frecuentes sobre agentic AI

¿Cuál es la diferencia con un chatbot normal?

Un chatbot responde con texto. Un agente ejecuta acciones. El chatbot te dice las horas de oficina, el agente realmente te reserva la cita. Function calling es la base técnica — el LLM recibe esquemas de tools y puede llamarlas en vez de solo generar texto. Claude y GPT-4 lo hacen bien, GPT-3.5 solo limitado.

¿Qué modelos hacen function calling limpio?

Top tier: Claude Sonnet 4.6 y GPT-4 Turbo más GPT-4o. Ambos muy fiables con tools simples y buenos en orquestación multi-tool. Mid tier: Claude Haiku 4.5 y GPT-4o-mini (bien para workflows simples, menos fiables con complejidad). Local: Llama 3.3 70B o Mistral Large pueden hacerlo, pero con tasa de alucinación significativamente más alta. Para producción recomendamos Claude o GPT-4.

¿Qué pasa si el agente hace una acción equivocada?

Tres capas de seguridad: 1) Guardrails determinan qué acciones están permitidas 2) Flujos de aprobación piden sign-off humano para acciones sensibles 3) Audit trail documenta cada acción para rastreo y posible reversión. Además: construimos operaciones reversibles cuando es posible (p.ej. soft-delete en vez de hard-delete).

¿Cómo funciona el flujo de aprobación concretamente?

Ejemplo: agente quiere enviar factura a cliente. En vez de enviar directamente, manda Slack o Telegram o mail al empleado responsable con los detalles. Este responde *sí* o *no* o *cambia X*. Solo entonces el agente ejecuta. Latencia de aprobación: segundos a minutos según setup.

¿Quién responde si el agente hace algo mal?

Desde perspectiva RGPD y responsabilidad, el agente es una herramienta, tú eres el responsable. Por eso guardrails más flujos de aprobación son importantes — muestran que tomaste medidas razonables. Documentamos el setup auditable. Para sectores específicos (fiscal, médico, legal) traemos abogado especialista antes de producción, eso es parte del paquete.

¿RGPD con llamadas a tools externas?

Cuando el agente llama a OpenAI o Anthropic, aplican sus contratos de tratamiento más opciones de hosting UE. Para llamadas API a tus propios sistemas, los datos quedan en tu infraestructura. Para APIs de terceros (p.ej. sistema externo de reservas) los datos van allí — hacemos mapeo RGPD por tool antes de producción y exponemos los contratos.

Siguiente paso

Llamada inicial 30 minutos gratis.

Miramos qué workflows quieres automatizar, qué acciones son sensibles y si agentic AI es la palanca correcta para tu caso. Evaluación honesta en vez de pitch comercial.

Agentic AI y Tool Use: agentes LLM que realmente trabajan | StudioMeyer | StudioMeyer