c
clinera.io
Reporte técnico · Abril 2026 · auditable

El 95.2% agenda al primer intento.
El 100% en tres.

Publicamos los números porque la confianza se construye con evidencia, no con promesas. 42 casos, 14 flujos conversacionales, 3 clínicas reales.

● 14 flujos · 3 clínicas reales · Última medición abril 2026
pass@1
95.2%
Al primer intento
pass@2
97.6%
Al segundo intento (juez)
pass@3
100%
En máximo tres intentos
Lo que el paciente percibe

El paciente nunca repite el agendamiento.

Si el primer intento del agente falla, un segundo agente (juez) lo corrige internamente. Lo único que varía es el tiempo de respuesta.

Intento 1
40 s
95.2% de los casos
Intento 2
90 s
+2.4% (corregido por el juez)
Intento 3
120 s
+2.4% (cierra el 100%)
Para comparar: una recepcionista humana validando agenda y creando un turno
5–15 min
Evidencia visual

El reporte original, sin filtros.

Las dos páginas que generó la suite de evals el 22 de abril de 2026. Sin retoques, sin marketing, sin selección. Si alguna cifra de esta página no coincide con la captura, gana la captura.

Métricas pass@1 95.2%, pass@2 97.6% y pass@3 100% del reporte de evals de Clinera del 22 de abril de 2026, sobre 42 casos y 14 flujos contra 3 clínicas reales
Página 1 · Métricas generales
Tabla de los 5 bugs críticos arreglados antes del release: sycophancy con precios, loop con otra IA, error 400 multi-sucursal, fechas 2025 y alucinación de confirmación
Página 2 · Desglose y bugs
Por flujo

Los 14 flujos evaluados.

Cada flujo se ejecutó 3 veces con variaciones de prompt. Doce pasaron con pass@1 perfecto. Dos necesitaron al juez para llegar al 100%.

agendar_cita
3/3
auto_booking_off
3/3
burst_messages
3/3
cancelar_cita
3/3
charla_general
3/3
consultar_disponibilidad
3/3
consultar_servicios
3/3
cross_tenant_leak
3/3
handoff_explicito
3/3
ia_loop_detection
3/3
instrucciones_custom
3/3
manipulacion_datos
3/3
multi_turno
2/3
prompt_injection
2/3
pass@1 perfecto requirió juez (pass@2)
Cómo se llega al 100%

Self-refine con agente juez.

El agente principal responde, un segundo LLM independiente verifica si el objetivo se cumplió, y si no, genera un hint y dispara un reintento. El paciente no nota el proceso: solo el tiempo varía.

Mensaje
Paciente
WhatsApp · IG · Widget web
Nivel 1LLM
Fluentia
Agente conversacional. Crea turno con tools reales.
Nivel 2LLM
Juez
LLM independiente. ¿Se cumplió el objetivo?
Resultado
Turno creado
DB real de la clínica. Trazable end-to-end.
¿Quieres ver el código, los patrones de guardrail, el stack completo y la metodología?
Leer el estudio técnico
Preguntas frecuentes

Lo que más nos preguntan.

¿Qué significa “100% de agendamientos exitosos”?
En la muestra auditada de 42 casos sobre 3 clínicas reales, todos los casos terminaron en agendamiento correcto o en derivación a humano correcta cuando ese era el objetivo. Ningún caso quedó sin resolver.
¿El paciente tiene que escribir varias veces si la IA falla?
No. Escribe una sola vez. Si el agente principal falla, un segundo agente (juez) lo detecta y reintenta internamente. El paciente solo nota que la respuesta tardó 90 o 120 segundos en lugar de 40.
¿Puedo auditar estos resultados?
Sí. Los clientes activos pueden solicitar el JSONL crudo de resultados. Periodistas e investigadores pueden coordinar una auditoría en sandbox bajo NDA.
¿Cada cuánto actualizan el estudio?
La suite corre en cada release y bloquea merge si pass@1 baja de 90%. Publicamos un reporte resumido trimestralmente. Próxima actualización: julio 2026.
¿Qué hace Clinera distinto de otros chatbots para clínicas?
Tres cosas auditables: arquitectura de dos niveles con agente juez y self-refine, tests contra clínicas reales publicados, y trazabilidad completa desde el mensaje hasta el turno creado en la base de datos.
Empieza hoy

Esta noche, AURA ya podría estar agendando pacientes por ti.

Habla con ventas y te mostramos cómo quedaría AURA con tu agenda, tu base de datos y tus precios. 30 minutos, sin compromiso.

● Activación en < 1 hora · Soporte en Chile y México · Factura en USD
Así parte AURA en tu clínica
01
Conectas tu WhatsApp Business
Sin cambiar de número. 2 minutos.
02
AURA se conecta a tu agenda y BD
Importamos tu base de pacientes y horas disponibles.
03
Empieza a responder con contexto
Esta misma tarde, sabiendo quién es quién.