El destacado experto en metodología de ensayos clínicos y epidemiología, Dr. Stephen Evans, MD, explica conceptos estadísticos clave para pacientes. Aclara qué es un ensayo con potencia insuficiente y por qué no logra detectar efectos reales del tratamiento. El Dr. Evans detalla la importancia de los criterios de valoración principales preespecificados para evitar sesgos. También desglosa la métrica del Número Necesario a Tratar (NNT), destacando sus usos y limitaciones. Estos conceptos son vitales para interpretar noticias médicas y comprender la eficacia del tratamiento.
Comprensión del análisis de ensayos clínicos: potencia, variables de valoración y NNT explicados
Saltar a sección
- Ensayos clínicos con potencia insuficiente
- Variables primarias vs. secundarias
- Falacia del tirador de Texas
- Número necesario a tratar (NNT)
- Interpretación de resultados de ensayos
- Transcripción completa
Ensayos clínicos con potencia insuficiente
Un ensayo clínico con potencia insuficiente carece de participantes suficientes para detectar de forma fiable un efecto real del tratamiento. El Dr. Stephen Evans, MD, explica que la potencia de un ensayo es su capacidad para encontrar una diferencia real si existe. Utiliza como ejemplo los ensayos de tratamiento para COVID-19, señalando que estudiar la mortalidad requiere un tamaño muestral grande porque las tasas de mortalidad pueden ser bajas.
Por ejemplo, detectar una reducción de la mortalidad del 10% al 7% requiere un número elevado de pacientes. Si un ensayo es demasiado pequeño, se vuelve insuficientemente potente y puede pasar por alto un beneficio clínicamente importante. Los primeros ensayos sobre COVID-19 frecuentemente tenían potencia insuficiente para resultados de mortalidad. El Dr. Stephen Evans, MD, enfatiza que la potencia se relaciona directamente con el desenlace específico que se estudia.
Variables primarias vs. secundarias
Los ensayos clínicos definen variables primarias y secundarias para medir el éxito del tratamiento. La variable primaria es el resultado principal que el ensayo está diseñado para evaluar. El Dr. Stephen Evans, MD, señala que la mortalidad es una variable primaria crucial pero desafiante porque requiere números grandes de pacientes.
Los investigadores frecuentemente eligen variables primarias más fáciles de estudiar, como el tiempo hasta la recuperación o la carga viral. Estas medidas objetivas pueden requerir menos participantes. Sin embargo, el Dr. Evans advierte que estas definiciones deben ser claras y establecidas antes de iniciar el ensayo. Cambiar las variables después de ver los resultados introduce un sesgo significativo e invalida los hallazgos.
Falacia del tirador de Texas
La Falacia del Tirador de Texas es un concepto crítico en la integridad de los ensayos clínicos. El Dr. Stephen Evans, MD, la describe como dibujar una diana alrededor de los agujeros de bala después de disparar un arma. En investigación, esto significa cambiar la variable principal del ensayo después de ver los datos para obtener un resultado deseado.
Esta práctica introduce un sesgo severo y socava la validez del ensayo. Aunque existen razones legítimas para cambiar las variables, deben ocurrir antes de desvelar los resultados. El Dr. Evans subraya que la preespecificación de variables es esencial para un análisis creíble de ensayos clínicos. Esto evita que los investigadores manipulen los resultados para mostrar falsos positivos.
Número necesario a tratar (NNT)
El Número Necesario a Tratar (NNT) es una métrica útil para que los pacientes comprendan el beneficio del tratamiento. El Dr. Stephen Evans, MD, define el NNT como el número de pacientes que necesitan recibir un tratamiento para prevenir un evento adverso. Por ejemplo, si un medicamento reduce la mortalidad del 10% al 5%, el NNT es 20.
Esto significa que deben tratarse 20 personas para prevenir una muerte. Sin embargo, el Dr. Stephen Evans, MD, señala limitaciones importantes. El NNT no es un número puro; depende del tiempo de seguimiento y de la definición del resultado. Las comparaciones entre tratamientos solo son válidas si el NNT se calcula de forma idéntica. A pesar de su simplicidad, el NNT requiere una interpretación cuidadosa.
Interpretación de resultados de ensayos
Interpretar correctamente los resultados de ensayos clínicos requiere comprender conceptos estadísticos clave. El Dr. Stephen Evans, MD, recomienda buscar estudios con potencia adecuada y variables preespecificadas. Esto asegura que los hallazgos sean fiables y no se deban al azar o al sesgo.
Los pacientes deben considerar la relevancia clínica de los resultados. Un resultado estadísticamente significativo puede no ser relevante si el NNT es muy alto. El Dr. Anton Titov, MD, destaca la importancia de estos conceptos para la alfabetización en salud pública. Comprender la potencia, las variables y el NNT ayuda a todos a evaluar críticamente las noticias médicas y tomar decisiones informadas.
Transcripción completa
Dr. Anton Titov, MD: Profesor Evans, existen varios conceptos básicos en ensayos clínicos. ¿Qué significa, por ejemplo, que un ensayo tenga potencia insuficiente? La terminología de ensayos clínicos está ahora en primer plano; aparece en los periódicos. La gente debe entender estos conceptos básicos. Entonces, ¿qué significa si un ensayo tiene potencia insuficiente? ¿Qué es el NNT, número necesario a tratar? Hay ventajas e inconvenientes y ese tipo de conceptos básicos. ¿Cuáles son las variables primarias y secundarias de los ensayos clínicos? Claramente, algunos ensayos han estado moviendo las porterías, y esto ha sido información común en la comunidad médica.
Dr. Stephen Evans, MD: Intentaremos tomar casi todos nuestros ejemplos de la situación actual con COVID-19. Si vamos a estudiar mortalidad, eso requerirá un número bastante grande de personas. Afortunadamente, no todos morirán, incluso en situación hospitalaria. Si tenemos, digamos, un 10% de personas fallecidas, entonces para encontrar una diferencia que probablemente sería bastante importante—digamos, reducir esa tasa de mortalidad del 10% dentro de los 30 días de iniciar el tratamiento a un 7% de mortalidad—pasamos del 10% al 7%. Necesitaremos un número grande de pacientes para poder descubrir si tal diferencia está ocurriendo realmente.
Hacemos análisis estadístico sobre eso. Pero si los números son demasiado pequeños en el ensayo, entonces es un ensayo que llamamos con potencia insuficiente. La potencia del estudio para detectar una diferencia real, si existe, era demasiado baja. Esto fue cierto para algunos de los primeros ensayos que se realizaron sobre tratamientos potenciales para COVID-19.
Mientras que si estudiamos miles de pacientes, entonces es improbable que el ensayo tenga potencia insuficiente para mortalidad como resultado, siempre que estemos tratando con diferencias razonables. Si quisiéramos detectar una diferencia entre una tasa de mortalidad del 10% y una del 9,9%, necesitaríamos decenas de miles de pacientes. Esa, por supuesto, no es una diferencia que sería muy útil para pacientes individuales.
Así que los ensayos con potencia insuficiente son un problema. Es insuficientemente potente en relación con el resultado que estudias. Si hicieras de la mortalidad tu variable principal, necesitarías muchos pacientes. Muy a menudo, lo que hace la gente es hacer de la mortalidad una variable secundaria y hacer su variable principal algo que es más fácil de estudiar y para lo cual necesitamos menos pacientes.
En este tipo de situación, eso suele ser el tiempo hasta la recuperación de la enfermedad. El problema con eso es que puede ser ligeramente subjetivo. Puedes definir que alguien alcanza un nivel de recuperación basado en una evaluación clínica, pero puede basarse en carga viral o algo por el estilo, que es una evaluación objetiva.
Así que podemos tener una evaluación objetiva para una variable primaria que es más fácil de estudiar que la mortalidad. El problema es que cuando miramos la recuperación, tenemos una definición para ella. Pero puede que la gente no cumpla esas definiciones. Se vuelve obvio en el ensayo que la variable que estableciste como primaria no te va a dar datos útiles.
Puede haber razones legítimas para cambiarla. Pero la dificultad es que si la gente sabe lo que muestran los resultados, puede cambiar la pregunta y por tanto obtener la respuesta que quiere. En epidemiología, esto se llama el síndrome del tirador de Texas, donde el pistolero de Texas se para al lado de un granero y dispara su arma al granero, y luego después se acerca y dibuja una diana.
Necesitas en un ensayo tener una diana especificada de antemano, luego hacer el ensayo y ver cuáles son los resultados, en lugar de cambiar la diana mientras el ensayo está en marcha. En general, puede haber razones legítimas para cambiar tu variable. Pero debes tener mucho cuidado y asegurarte de que no lo estás haciendo después de haber disparado ya tu arma y visto dónde caen las balas.
Necesitas hacerlo antes de saber dónde están cayendo las balas.
Cuando llegamos a medir el resultado, una de las cosas que podemos hacer es decir, ¿cuál es la tasa de mortalidad? Digamos que tenemos una diferencia de tratamiento del 10% al 5%. Eso significa que por cada cien personas, habrá cinco personas que no mueren como resultado de recibir el tratamiento. Por cada 20 personas, habrá una persona que no muere.
Cuando le damos la vuelta a esto, decimos que el número necesario a tratar para prevenir una muerte será 20, con nuestra diferencia entre 10% y 5%. Eso también sería el caso si hubiera una diferencia entre 20% y 15% o entre 50% y 45%. Es una medida del número de pacientes que necesitan ser tratados para prevenir una muerte.
A veces, en lugar de muerte, miramos un evento particular como infarto de miocardio o ictus. El problema con este número es que no es un número puro. Depende de cuánto tiempo hayas seguido a los pacientes. También tiene algunos otros problemas estadísticos.
Así que no es uno que me guste particularmente, aunque suena bastante bien decir: "Oh, este medicamento necesita 20 pacientes necesarios a tratar para obtener el beneficio, mientras que este medicamento necesita 50 pacientes que necesitan ser tratados". Si has usado las mismas reglas para ambos, entonces el NNT puede ser bastante útil. Pero debes tener cuidado de asegurarte de que tu definición del NNT, que no es un número puro, se use exactamente igual cuando haces comparaciones entre tratamientos.