Tamaño muestral de una comparación de proporciones independientes mediante un test "z"

RELACIÓN ENTRE LOS PARÁMETROS UTILIZADOS PARA EL CÁLCULO DEL TAMAÑO MUESTRAL NECESARIO PARA REALIZAR UNA COMPARACIÓN DE PROPORCIONES INDEPENDIENTES MEDIANTE UN TEST Z.
Este post completa el contenido de los artículos Determinación del tamaño de la muestra en estudios epidemiológicos (I)  y (II) publicados en la revista Suis en abril (nº 96) y mayo (nº 97) de 2013, respectivamente.

Las variaciones en los parámetros en los que basamos los cálculos de tamaño muestral, afectan de forma importante al número de animales necesarios para nuestro estudio. G*Power nos permite explorar la relación entre todos estos parámetros. Ya lo describimos en el número 97 de Suis donde comparamos las medias de dos grupos independientes utilizando un test t. Ahora veremos cómo estudiar estas relaciones cuando pretendemos comparara dos proporciones de grupos independientes con un test z.


En el ejemplo planteado en el número 96 de Suis, pretendíamos dar respuesta a la pregunta: ¿cuántos animales necesito para comprobar si la aplicación de un tratamiento aumenta la tasa de curación respecto a otro? Calculamos que necesitábamos 222 animales para el caso de una proporción esperada de curación con el tratamiento control (p2) del 70% para detectar una diferencia entre tratamientos del 20% (p2-p1=0.14), es decir, obteniendo al menos una proporción esperada de curación con el tratamiento experimental del 84%, con un nivel de significación o error tipo 1 de 0,05 y una potencia o error tipo 2 de 0,80. Pero, puede suceder, que no estemos seguros de la proporción de éxito del tratamiento control (p2), por lo que nos puede resultar interesante ver cuántos animales necesitaríamos en función de diferentes escenarios, desde uno malo con un éxito del 60% hasta uno bueno con un éxito del 80%. Para ello utilizamos la opción “X-Y plot for a range of values”, después de realizar el cálculo planteado (Imagen 1).

Imagen 1. Ventana principal de G*Power con el ejemplo planteado en el artículo Determinación del tamaño de la muestra en estudios epidemiológicos (I), publicado en Suis en abril de 2013 (nº 96), resuelto.

En la ventana “GPower – Plot”, que aparece después de hacer clic sobre el botón “X-Y plot for a range of values” (Imagen 2), podemos representar gráficamente los cambios de tamaño muestral en función de los parámetros usados para su cálculo “Plot Parameters” y así dar respuesta al nuevo problema que hemos planteado.

Imagen 2. Componentes de la ventana “GPower – Plot”.

1.      Vamos a representar el tamaño muestral total en el eje de abcisas “Y”, por lo tanto, dejamos la opción que aparece por defecto “Total sample size” en “Plot (on y axis)”. Añadiremos marcadores, seleccionando “with markers”, y los valores de cada marcador, seleccionando “and displaying the values in the plot” con un número de decimales determinado en “Show digits” (en este ejemplo “0”).

2.      A continuación, determinamos el parámetro representado en el eje de ordenadas “X”, que será la proporción de éxito del grupo control (p2), seleccionando la opción “Proportion P2en “as a fuction of”. Indicaremos qué rango de valores de p2 queremos estudiar, desde (“from”) 0.60 (60%), poniendo un marcador cada (“in steps of”) 0.05 (5%), hasta (“through to”) 0.80 (80%).

Por el momento, no modificaremos los valores que G*Power nos da por defecto en el resto de parámetros.

3.      Número de líneas del gráfico “Plot: 1” y tipo de gráfico “graph(s): interpolating points”.

4.      Potencia o error tipo 2 “with Power (1- β) at 0.8”.

5.      Nivel de significación “and α err prob at 0.05”.

6.      Hacemos click en el botón “Draw Plot”.

Y veremos cómo varía el número de animales necesarios en función de diferentes proporciones de éxito del tratamiento control para una proporción de éxito del tratamiento experimental del 84%, con un nivel de significación de 0,05 y una potencia de 0,80 (Imagen 3).

Imagen 3. Cambios en el tamaño muestral total en función de diferentes proporciones de éxito del tratamiento control.

Podemos comprobar que a mayor proporción de éxito del grupo control, mayor es el número de animales que necesitamos, debido a que la diferencia de proporciones (p2-p1) que pretendemos detectar es cada vez menor.

Pero, ¿qué sucede si además cambiamos la potencia? Podemos estudiar, por ejemplo, el número de animales que necesitaríamos si establecemos potencias (error tipo 2) de 0,5, 0,7 y 0,9, manteniendo el nivel de significación de 0,05 (Imagen 4):

3.      Número de líneas del gráfico “Plot: 3”, una para cada simulación que queremos realizar, y tipo de gráfico “graph(s): interpolating points”.

4.      Potencia o error tipo 2 “with Power (1- β)” desde (“from”) 0.5 a intervalos de (“in steps of”) 0.2.

5.      Nivel de significación “and α err prob at 0.05”.

6.      Hacemos click en el botón “Draw Plot”.

Imagen 4. Cambios en el tamaño muestral total en función de diferentes proporciones de éxito del tratamiento control y diferentes potencias (error tipo 2). En este caso hemos quitado los valores de cada marcador (amarillo) para evitar que los números se superpongan unos con otros.

Vemos que a mayor potencia, mayor probabilidad de encontrar diferencias significativas en el caso en que realmente existan y mayor número de animales necesitamos.

Finalmente, podemos ver los resultados en forma de tabla en la pestaña “Table” (Imagen 5).


Comentarios

Entradas populares