Estudio Clinera 2026: los pacientes confían más en una IA que responde como humano

Q: ¿Es este un estudio científico o revisado por pares?

No. Es un estudio interno de Clinera basado en datos operacionales reales de 89 clínicas y más de 57.000 interacciones. No es un paper académico ni ha sido revisado externamente. Publicamos los resultados por transparencia.

Q: ¿Qué significa exactamente 'interacción completada'?

Una interacción se considera completada cuando el paciente llegó hasta el paso final del flujo conversacional: confirmar un agendamiento, obtener la información solicitada, o ser derivado a un agente humano correctamente.

Q: ¿Por qué los pacientes completarían más cuando la IA es más lenta?

La hipótesis más sólida es de confianza contextual: en salud, una respuesta instantánea puede parecer un bot genérico. Una respuesta con un pequeño retraso activa la percepción de que hay atención real detrás.

Q: ¿Cuánto tiempo de delay usó el Grupo B?

Entre 20 y 90 segundos, distribuidos según la complejidad percibida del mensaje. El objetivo era simular el tiempo que tomaría leer y redactar una respuesta humana real.

Q: ¿Cómo aplico esto en mi clínica hoy?

Si usas Clinera, el modo de respuesta con timing humano puede activarse desde el panel de configuración de tu agente. Si aún no usas Clinera, agenda una demo en clinera.io/hablar-con-ventas.

Este es un estudio interno de Clinera. No es un paper académico ni ha sido revisado por pares. Sí es evidencia operacional de 89 clínicas reales durante 9 semanas y más de 57.000 interacciones humano-IA analizadas. Publicamos los números porque creemos que la transparencia es la base de la confianza, especialmente cuando hablamos de IA en salud.

Cuando construimos el agente de Clinera, el supuesto inicial fue el mismo que en casi todo el software: más rápido es mejor. Menos de 5 segundos para responder. Cero fricción. Atención instantánea.

Después de meses en producción, empezamos a notar algo que no encajaba con esa lógica: algunas clínicas reportaban tasas de abandono inusualmente altas, sin que existiera un problema técnico de por medio. Los mensajes llegaban, las respuestas salían, pero los pacientes no terminaban el flujo. Ese patrón nos llevó a hacernos una pregunta incómoda: ¿y si el problema no es la precisión de la IA, sino cómo se siente?

Para responderla, diseñamos un experimento A/B controlado entre el 2 de febrero y el 6 de abril de 2026. Esto es lo que encontramos.

TL;DR — Lo que necesitas saber en 30 segundos

89 clínicas participaron en el estudio (61 de Chile; el resto de Perú, Ecuador, México, Paraguay y España).
Se analizaron más de 57.000 interacciones humano-IA en WhatsApp e Instagram DM.
Grupo A — IA con respuesta en menos de 5 segundos: 79% de interacciones completadas.
Grupo B — IA con delay de 20 a 90 segundos (timing humano): 91% de interacciones completadas.
Diferencia: +12 puntos porcentuales a favor del timing humano.
Conclusión: en contextos de salud y estética, la velocidad importa, pero la confianza percibida importa más.

Por qué estudiamos el timing de respuesta

La premisa de que "más rápido = mejor" viene del mundo del e-commerce, donde la fricción es el enemigo. Menos tiempo de carga, menos pasos, respuesta inmediata. Esa lógica tiene sentido cuando el usuario está comprando zapatillas.

La salud funciona diferente. Una paciente que escribe "quiero agendar una consulta de nutrición" no solo está haciendo una transacción: está confiando en alguien con algo personal. Y la confianza, a diferencia de la velocidad, no se construye en milisegundos.

Investigaciones en interacción humano-computadora y sistemas conversacionales han observado que los usuarios pueden interpretar respuestas anormalmente rápidas como señal de que "nadie leyó mi mensaje de verdad". Esto es especialmente relevante en contextos de alta implicación personal, como la salud, la estética o la psicología — áreas donde opera la mayoría de los clientes de Clinera.

El timing de una respuesta no es solo un dato técnico. Es una señal social. Y los pacientes la leen, aunque no lo sepan conscientemente.

Diseño del experimento

Período y muestra

Parámetro	Valor
Período	2 de febrero — 6 de abril de 2026 (9 semanas)
Total de clínicas	89
Chile	61 clínicas
Otros países	28 clínicas (Perú, Ecuador, México, Paraguay, España)
Total de interacciones analizadas	+57.000
Canal principal	WhatsApp Business API + Instagram DM
Tipo de interacción	Agendamiento, consulta de disponibilidad, información de servicios

Grupos del experimento

	Grupo A	Grupo B
Condición	Respuesta en < 5 segundos	Delay de 20–90 segundos
Lógica	Respuesta técnicamente óptima	Simula tiempo de lectura + escritura humana
Delay calculado por	—	Longitud y complejidad del mensaje recibido
Clínicas asignadas	44	45
Asignación	Aleatoria por clínica, fija durante todo el período	Aleatoria por clínica, fija durante todo el período

La asignación fue fija por clínica durante todo el período para evitar efectos de confusión entre grupos dentro de la misma base de pacientes. La IA, el prompt, las instrucciones y los servicios disponibles eran idénticos en ambos grupos. La única variable era el tiempo de respuesta.

Definición de "interacción completada": el paciente llegó al paso final del flujo — agendamiento confirmado, información entregada, o derivación a humano ejecutada — sin abandonar la conversación antes de ese punto.

Los resultados

Tabla de resultados generales

Métrica	Grupo A (< 5 s)	Grupo B (20–90 s)	Diferencia
Tasa de interacción completada	79%	91%	+12 pp
Tasa de abandono	21%	9%	−12 pp
Clínicas en el grupo	44	45	—
Período del estudio	Feb 2 – Abr 6, 2026	Feb 2 – Abr 6, 2026	—

La diferencia de 12 puntos porcentuales se mantuvo estable a lo largo de las 9 semanas. No fue un pico inicial que se diluyó: el efecto fue consistente desde la segunda semana hasta el final del período.

De cada 100 pacientes que iniciaban una conversación, el Grupo B convertía 12 más que el Grupo A. Para una clínica que recibe 400 consultas al mes, eso son 48 agendamientos adicionales sin cambiar nada más.

Desglose por tipo de flujo

Flujo	Grupo A	Grupo B	Delta
Agendar cita (nuevo paciente)	74%	89%	+15 pp
Consultar disponibilidad	83%	93%	+10 pp
Consultar precio o servicio	81%	94%	+13 pp
Reagendar cita existente	77%	90%	+13 pp
Solicitar derivación a humano	86%	92%	+6 pp

El efecto fue mayor en nuevos pacientes (flujo de agendamiento desde cero), donde el delta llegó a 15 puntos. Esto tiene sentido: un paciente nuevo no tiene historial con la clínica y está construyendo confianza desde cero. En ese contexto, la señal del timing tiene más peso.

¿Por qué los pacientes completan más con una respuesta "más lenta"?

Esta es la pregunta más importante del estudio, y también la más honesta de responder: no tenemos una respuesta definitiva. Lo que sí tenemos es una hipótesis respaldada por el patrón de datos y coherente con lo que se sabe sobre confianza en sistemas conversacionales de IA.

La hipótesis de confianza contextual

En salud y estética, el paciente está compartiendo información personal: síntomas, preocupaciones estéticas, diagnósticos previos, disponibilidad horaria. Esa exposición requiere que la contraparte se sienta presente y atenta. Una respuesta en 2 segundos puede activar el patrón cognitivo de "esto es un bot que no leyó lo que escribí". Una respuesta en 35 segundos activa el patrón de "alguien tomó un momento para considerar mi caso".

Estudios en el campo de la interacción humano-computadora han documentado que los usuarios atribuyen mayor credibilidad y competencia a sistemas que muestran latencia consistente con la complejidad de la tarea. Un médico que responde en 1 segundo genera desconfianza, no confianza. Lo mismo parece ocurrir con la IA en contextos de alta implicación personal.

El efecto de la señal social del mensaje

WhatsApp e Instagram DM son canales de mensajería entre personas. El usuario los asocia a conversaciones humanas. Cuando la IA responde en 2 segundos a un mensaje de 80 palabras, rompe ese contrato implícito: ninguna persona lee y responde 80 palabras en 2 segundos. Ese quiebre puede sentirse como artificial, y lo artificial genera desconfianza.

El Grupo B, al mantener el timing dentro del rango de "podría haber sido una persona", mantuvo ese contrato implícito intacto.

Lo que no podemos afirmar con este estudio

No medimos satisfacción post-agendamiento ni NPS.
No medimos si los pacientes del Grupo B asistieron más a sus citas (eso requiere seguimiento de 60+ días que está en progreso).
No tenemos datos suficientes para desagregar por país con confianza estadística.
No comparamos contra canales de voz o videollamada.
Este estudio no prueba que el timing sea la única variable relevante, ni que otros factores no influyan en la tasa de completación.

Qué significa esto para tu clínica

Si eres dueño de una clínica médica o estética y estás evaluando implementar IA para atención de pacientes, este estudio tiene una implicancia práctica directa: optimizar solo por velocidad técnica puede estar costándote pacientes.

Una IA que responde en menos de 5 segundos puede parecer técnicamente superior en un benchmark. Pero si 21 de cada 100 pacientes la abandonan antes de terminar el flujo — frente a 9 en el modelo con timing humano —, el resultado operacional es peor.

El cálculo de impacto real

Escenario	Consultas/mes	Completación	Agendamientos generados
IA con respuesta instantánea (Grupo A)	400	79%	316
IA con timing humano (Grupo B)	400	91%	364
Diferencia	—	+12 pp	+48 agendamientos/mes

Para una clínica con un valor promedio de consulta de $25.000 CLP, 48 agendamientos adicionales al mes equivalen a $1.200.000 CLP adicionales sin aumentar el presupuesto en ads, sin contratar más personal, y sin cambiar el agente de IA. Solo ajustando cómo se siente la respuesta.

Contexto más amplio: la confianza en IA conversacional

Este estudio no existe en un vacío. Hay una creciente literatura académica e industria de investigación sobre cómo los humanos perciben y confían en sistemas de IA conversacional. Algunos patrones recurrentes que son coherentes con nuestros hallazgos:

Timing y atribución de presencia: investigaciones en HCI (human-computer interaction) han documentado que el delay en respuestas digitales modula la percepción de presencia social. Sistemas demasiado rápidos pueden romper la percepción de que "hay alguien ahí".
Confianza en IA médica: en contextos de salud digital, los pacientes tienden a preferir sistemas que demuestren señales de cuidado y atención, más allá de precisión técnica pura.
El paradox of automation: en sistemas críticos, la automatización perfecta puede generar complacencia o desconfianza cuando supera el umbral de lo humanamente plausible.
Conversational AI en healthcare: estudios sobre chatbots en atención primaria han observado que el tono y los patrones de respuesta influyen significativamente en la disposición del paciente a completar la interacción.

Clinera no afirma que estas investigaciones validen directamente este estudio. Las mencionamos como contexto intelectual, no como respaldo científico formal. Nuestros datos son operacionales, no experimentales en el sentido académico.

Preguntas frecuentes

¿Es este un estudio científico o revisado por pares?

No. Es un estudio interno de Clinera basado en datos operacionales reales de 89 clínicas y más de 57.000 interacciones. No es un paper académico ni ha sido revisado externamente. Publicamos los resultados porque creemos que la evidencia operacional es tan valiosa como la académica, y porque la transparencia es parte de cómo construimos confianza con nuestros clientes.

¿Qué significa exactamente 'interacción completada'?

Una interacción se considera completada cuando el paciente llegó hasta el paso final del flujo conversacional: confirmar un agendamiento, obtener la información que solicitó, o ser derivado a un agente humano de forma correcta. Las interacciones abandonadas (paciente que deja de responder antes de terminar) se contaron como no completadas.

¿Por qué los pacientes completarían más cuando la IA es más lenta?

La hipótesis más sólida es de confianza contextual: en salud, una respuesta instantánea puede parecer un bot genérico que no 'leyó' tu mensaje. Una respuesta con un pequeño retraso, dentro del rango normal de mensajería humana, activa la percepción de que hay atención real detrás. Esto es consistente con lo que se observa en investigaciones sobre confianza en sistemas de IA conversacional: la velocidad extrema puede romper la ilusión de presencia.

¿Cuánto tiempo de delay usó el Grupo B?

Entre 20 y 90 segundos, distribuidos según la complejidad percibida del mensaje. Mensajes cortos recibían delays menores (20-35 s); mensajes largos o con múltiples preguntas recibían delays mayores (50-90 s). El objetivo era simular el tiempo que tomaría leer y redactar una respuesta humana real.

¿El modo de respuesta lenta afecta negativamente la experiencia?

No en el rango estudiado. 90 segundos sigue siendo entre 3 y 10 veces más rápido que una recepcionista en horario activo, y entre 20 y 50 veces más rápido en horario fuera de oficina. El estudio no encontró señales de frustración en el Grupo B. Lo que sí observamos: los pacientes del Grupo B completaban el flujo completo, en lugar de abandonarlo a mitad.

¿Los resultados aplican igual para Chile, México y los otros países?

La muestra más grande es Chile (61 de 89 clínicas), por lo que los resultados están más representados en ese mercado. Las clínicas de Perú, Ecuador, México, Paraguay y España mostraron la misma dirección del efecto, aunque con muestras más pequeñas. No publicamos desgloses por país para no hacer inferencias con N bajo.

¿Cómo aplico esto en mi clínica hoy?

Si usas Clinera, el modo de respuesta con timing humano puede activarse desde el panel de configuración de tu agente. Si aún no usas Clinera, agenda una demo y te mostramos los dos modos en vivo sobre un clon de tu propia clínica.

¿Habrá actualizaciones de este estudio?

Sí. Planeamos replicar el estudio con una muestra más grande a fines de 2026, incluyendo seguimiento post-agendamiento para medir si el tipo de timing también afecta la tasa de asistencia real a la cita.

Estudio interno Clinera — período 2 de febrero al 6 de abril de 2026. Publicado el 14 de mayo de 2026. Muestra: 89 clínicas, +57.000 interacciones. Estudio operacional, no revisado por pares. Datos disponibles para clientes activos bajo NDA.

Estudio Clinera 2026: los pacientes confían más en una IA que responde como humano, no necesariamente más rápido.