viernes, 26 de abril de 2019

STATISTICAL CONCEPTS SERIES


QUÉ SON LAS MUESTRAS ALEATORIAS Y EL TEOREMA DE LÍMITE CENTRAL

La obtención de una muestra que sea representativa de una población es clave en cualquier diseño de estudio. La única manera de estar seguros de obtener una muestra representativa es seleccionar a los sujetos al azar, de modo que el hecho de que se elija o no a cada sujeto de la población para la muestra es pura casualidad y no se basa en las características del sujeto.

Gracias a que la muestra se selecciona al azar, los métodos de la teoría de la probabilidad se pueden aplicar a los datos obtenidos.  Esto permite al clínico tener conciencia de la magnitud de los errores que pueden ocurrir a medida que aumenta el tamaño de la muestra,.

El teorema del limite central nos dice que los promedios de todas las muestras de una población de cualquier distribución se aproximarán a la distribución normal (gaussiana).  Esta es una propiedad importante porque permite a los médicos usar la distribución normal para formular inferencias a partir de los datos sobre las poblaciones aunque la muestra de la que disponga no tenga distribución normal. Sin embargo, el tamaño de muestra requerido para utilizar el teorema del límite central depende de la distribución subyacente de la población, y las poblaciones con gran variabilidad requieren muestras más grandes. A medida que aumenta el tamaño de la muestra, la media y la desviación estándar de la muestra se acercan más a la media a la media y la desviación estándar de la población. 


En esta figura observamos como a medida que la muestra es mayor la desviación estándar disminuye y por lo tanto también el intervalo de confianza al 95%. A medida que la muestra se hace mayor la media y la S.D de la muestra se parecen más a sus respectivos parámetros.



CUÁL ES LA DIFERENCIA ENTRE EL DESVIACIÓN ESTANDAR(DE) Y EL ERROR ESTANDAR DE LA MEDIA (EEM)

La D.E y la E.E.M miden dos entidades muy diferentes, pero los clínicos a menudo las confunden.  Algunos investigadores médicos resumen sus datos con el EEM porque siempre es más pequeño que el DE.  Debido a que el EEM es más pequeño, a menudo se usa de manera inadecuada para hacer que la variabilidad de los datos se vea más ajustada.  

El siguiente ejemplo se proporciona para ilustrar la diferencia entre la SD y la SEM y por qué se debe resumir los datos utilizando la SD.  Supongamos que, en una muestra de estudio de pacientes con enfermedad aterosclerótica, un investigador informó que el pico de velocidad sistólica (PSV) en la arteria carótida fue en promedio 220 cm / seg y el SD fue de 10. Este investigador sabe además por lo indicado en la literatura especializada que el PSV en aproximadamente el 95% de todos los miembros de la población se encuentra aproximadamente en 2 DE  de la media. Los resultados nos dirían que, suponiendo que la distribución sea aproximadamente normal, sería inusual observar una PSV menor a 200 cm / seg o superior a 240 cm / seg (una DE es 10 unidades) en la enfermedad aterosclerótica. Lo que se está indicando en el artículo es un resumen de la población y un rango con el cual comparar pacientes específicos que son examinados por el médico. Por lo general el investigador puede decir que el PSV de la arteria carótida común fue de 220 cm / s +-1.6 EEM (suponiendo que este sea el EEM encontrado a partir del tamaño de su muestra).  Si uno confundiera el SEM con el SD, se podría creer que el rango de la mayoría de la población era estrecho es tan estrecho como 216.8 y 223.2 cm / s lo cual es un error. Debemos entender que  estos valores describen el rango en el que aproximadamente el 95% de las veces incluye la media de TODA la población de la cual se eligió la muestra de pacientes.  El EEM es simplemente una medida de cuán lejos es probable que esté la media de la muestra de la media real de la población.  Sin embargo, en la práctica, generalmente se quiere comparar el PSV de un paciente individual con la distribución de la población en su totalidad y no con la media de la población.  Esta información es proporcionada por el DE y no por el EEM. Por ejemplo uno de los sujetos que pertenece a la muestra podría presentar un PSV de 235 lo cual está dentro de lo posible ya que la media es 220 dos dos DE es decir con valores de 200 y 240, sabiendo que la DE de la población es de 10 unidades. Si hubiéramos realizado la comparación con la EEM entonces caeríamos en la cuenta  de que 235 es demasiado alto para considerarse dentro de lo esperado, lo cual es un error porque la comparación debió hacerse con la DE.


QUÉ SON LOS INTERVALOS DE CONFIANZA (IC)

La mayoría de las investigaciones biomédicas se basan en la premisa de que lo que es cierto para una muestra seleccionada al azar de una población será cierto, más o menos, para la población a partir de la cual se eligió la muestra. Por lo tanto, las mediciones en la muestra se utilizan para estimar las características de la población incluida en el estudio. La confianza de los resultados obtenidos de una muestra se aborda mediante la construcción de IC en torno a las estadísticas de la muestra.  La cantidad de variación asociada con una estimación determinada a partir de una muestra puede expresarse mediante un IC. Los CI más amplios indican una menor precisión, mientras que los más estrechos indican una mayor precisión.  Los IC proporcionan límites a las estimaciones.




CÓMO SE CALCULAN LOS CI Y LA SIGNIFICANCIA ESTADISTICA

Si la muestra es grande con poca dispersión, la media de la muestra probablemente estará muy cerca de la media de la población.  Los cálculos estadísticos combinan el tamaño de la muestra y la variabilidad (es decir, SD) para generar un IC para la media poblacional. Se puede calcular un intervalo para cualquier grado de confianza deseado, aunque los IC del 95% es el más utilizado. Los IC se pueden construir para cualquier nivel de confianza deseado.  No hay nada mágico en el 95%, aunque se usa tradicionalmente.  Si se necesita mayor confianza, entonces los IC deben ser más amplios.  En consecuencia, los 99% de los IC son más amplios que los 95% de los IC, y los 90% de los IC son más estrechos que los 95% de los IC.  Los IC más amplios se asocian con mayor confianza, pero menos precisión. 

Si se supone que una muestra se seleccionó al azar de una determinada población (que sigue una distribución normal), se puede estar seguro al 95% de que el IC incluye la media de la población.  Más precisamente, si se generan muchos IC del 95% a partir de muchos conjuntos de datos, se puede esperar que el IC incluya la verdadera media de la población en el 95% de los casos y que el IC no incluya el valor medio verdadero en el otro 5%.  Por lo tanto, el IC del 95% se relaciona con la significación estadística en el nivel de 0.05, lo que significa que el propio IC se puede usar para determinar si un cambio estimado es estadísticamente significativo en el nivel de 0.05.

Mientras que el valor de "p" a menudo se interpreta como una indicación de una diferencia estadísticamente significativa, el CI, al proporcionar un rango de valores, permite al lector interpretar las implicaciones de los resultados o valores en cualquiera de los extremos del intervalo.  Por ejemplo, si un extremo del intervalo incluye resultados clínicamente importantes pero el otro no, los resultados pueden considerarse como no concluyentes, no simplemente como una indicación de una diferencia estadísticamente significativa o no.  Además, mientras que los valores de "p" no se presentan en unidades, los IC se presentan en las unidades de la variable de interés, y esta última presentación ayuda a los lectores a interpretar los resultados.  En general, se prefieren los IC a los valores del p valué porque los IC cambian la interpretación de un juicio cualitativo sobre el papel del azar a una estimación cuantitativa de la medida biológica del efecto.  Más importante aún, la IC cuantifica la precisión de la media

POR QUÉ ES IMPORTANTE EL IC PARA LA SENSIBILIDAD Y LA ESPECIFICIDAD

La mayoría de los radiólogos están familiarizados con los conceptos básicos de especificidad y sensibilidad y los utilizan para evaluar la precisión o rendimiento diagnóstico de las pruebas de diagnóstico en la práctica clínica.  Dado que la sensibilidad y la especificidad son proporciones, los IC pueden calcularse y deben informarse en todos los artículos de investigación. Los IC son necesarios para ayudar a uno a estar más seguros sobre el valor clínico de cualquier prueba de detección o diagnóstico y para decidir en qué grado se puede confiar en los resultados.

La prueba diagnóstica más simple es dicotómica, en la que los resultados se utilizan para clasificar a los pacientes en dos grupos según la presencia o ausencia de enfermedad (sigue un proceso de Bernoulli).  




La resonancia magnética (RM) y los hallazgos artroscópicos puede ser un ejemplo que nos sirva (ver la tabla más arriba). En este estudio hipotético, la artroscopia se considera el estándar de referencia.  La pregunta que surge en el entorno clínico es: "¿Qué tan buenas son las imágenes de RM de rodilla para ayudar a distinguir ligamento cruzado anterior ( ACL) desgarrados e intactos?" En otras palabras, "¿Hasta qué punto se puede confiar en la interpretación de las imágenes de RM para emitir juicios sobre el estado?  ¿De la rodilla de un paciente? Un método para medir el valor de la RM en la detección de desgarros de ACL es calcular la proporción de ACL desgarradas y la proporción de ACL intactas que se clasificaron correctamente utilizando imágenes de RM.  Estas proporciones se conocen como sensibilidad y especificidad de una prueba, respectivamente.

La sensibilidad se calcula como la proporción de ACL desgarradas que se clasificaron correctamente utilizando imágenes de RM.  En este ejemplo, de las 421 rodillas con desgarros de LCA, 394 se evaluaron correctamente con imágenes de RM (ver tabla más abajo).  La sensibilidad de la RM en la detección de desgarros de LCA es, por lo tanto, del 94% (es decir, sensibilidad = 394/421 = 0,94).  En otras palabras, el 94% de los desgarros de ACL se clasificaron correctamente como desgarrados utilizando imágenes de RM.  El IC del 95% para una proporción se puede determinar mediante la ecuación que se muestra aquí:




Al usar  esta ecuación, el IC del 95% para la sensibilidad es de 0,94 +- 0,02, o de 0,92 a 0,96.  Por lo tanto, se espera que la RM tenga una sensibilidad entre 92% y 96%.

La especificidad se calcula como la proporción de ACL intactas que se clasificaron correctamente utilizando imágenes de RM.  De las 133 rodillas con una LCA intacta, 101 se clasificaron correctamente.  La especificidad de la RM es, por lo tanto, del 76% (es decir, especificidad = 101/133 = 0,76).  Esto significa que el 76% de las ACL intactas se clasificaron correctamente como intactas utilizando imágenes de RM.  Al usar la Ecuación, el IC del 95% para la especificidad es de 0.76 +- 0.07 o 0.69 a 0.83.  Por lo tanto, se espera que la RM tenga una especificidad entre el 69% y el 83%.  También es importante tener en cuenta que el IC fue más amplio para la especificidad que para la sensibilidad porque los grupos de la muestra fueron 133 (más pequeños) y 421 (más grandes), respectivamente.

NOTA:

Se pueden calcular los IC para las proporciones de ODDS
Los IC también se pueden calcular en función de las medidas de riesgo, como el riesgo relativo(RR) o el odds ratio (OR).


Los IC pueden calcularse tanto para medias como para proporciones.  Las proporciones comúnmente utilizadas en medicina incluyen sensibilidad, especificidad y OR.  Las proporciones siempre deben ir acompañadas de un 95% de IC.  La correcta comprensión y el uso de estadísticas fundamentales, como la DE, la EEM y la IC, y sus cálculos permitirán un análisis, interpretación y comunicación más fiables de los datos clínicos a los pacientes y a los médicos remitentes.

PUEDES DESCARGAR EL ARTICULO AQUÍ

No hay comentarios:

Publicar un comentario