- Diagrama de barras para la variable seleccionada.
- Tabla resumen de las bases:
- Resultados de la prueba de hipótesis:
- Intervalo de confianza para la proporción P:
Prueba de hipótesis para la diferencia de proporciones
Suponga que se tienen \(X\) y \(Y\) éxitos de dos variables aleatorias binomiales con las siguientes características:
- \(X\) número de éxitos observados en \(n_1\) ensayos cuya probabilidad de éxito es \(p_1\).
- \(Y\) número de éxitos observados en \(n_2\) ensayos cuya probabilidad de éxito es \(p_2\).
En este caso se quiere estudiar la hipótesis nula \(H_0: p_1 - p_2 = \delta_0\) y se sospecha que la diferencia de proporciones \(p_1 - p_2\) podría estar en alguna de las siguientes situaciones:
- \(H_a: p_1 - p_2 < \delta_0\)
- \(H_a: p_1 - p_2 \neq \delta_0\)
- \(H_a: p_1 - p_2 > \delta_0\)
El estadístico para realizar la prueba es: \[ Z_0=\frac{\hat{p}_1 - \hat{p}_2 - \delta_0}{\sqrt{\frac{\hat{p}_{1}(1-\hat{p}_{1})}{n_1} +\frac{\hat{p}_{2}(1-\hat{p}_{2})}{n_2}}}, \]
donde \(\hat{p}_1 =X/n_1\) y \(\hat{p}_2 =Y/n_2\) corresponden a la proporción de éxitos en una muestra de tamaño \(n_1\) y \(n_2\), respectivamente. En estas pruebas es común considerar que \(\delta_0=0\). En este caso, una práctica estándar es crear una estimación conjunta de las proporciones poblacionales tal que \(p_1=p_2\), de tal forma que el estadístico de prueba es:
\[ Z_0=\frac{\hat{p}_1 - \hat{p}_2 }{\sqrt{ \hat{p}(1-\hat{p})\left(\frac{1}{n_1} +\frac{1}{n_2} \right)}}, \]
donde \(\hat{p}=(X+Y)/(n_1 + n_2)\). Bajo la suposición de que \(H_0\) es verdadera, el estadístico \(Z_0\) en tiene una distribución aproximadamente normal estándar.
Si el valor calculado para el estadístico dado en la ecuación se denota por \(z_0\), entonces el valor-\(P\) de la prueba se calcula de acuerdo a la hipótesis alterna como:
- Si \(H_a:p_1 - p_2 < 0\), entonces valor-\(P\)=\(P(z < z_0)\).
- Si \(H_a:p_1 - p_2 \neq 0\), entonces valor-\(P\)=\(2 \times P(z > \lvert z_0 \rvert)\).
- Si \(H_a: p_1 - p_2 > 0\), entonces valor-\(P\)=\(P(z > z_0)\).
La hipótesis nula \(H_0\) se rechaza si el valor-\(P\) es menor que el nivel de significancia (\(\alpha\)).\
Cuando \(\left| \hat{p}_1-\hat{p}_2 \right|> 0.5 \left( 1/n_1 + 1/n_2 \right)\) se usa corrección por continuidad en el estadístico de prueba. Así el estadístico tendrá una expresión diferente:
- Si \(\hat{p}_1 - \hat{p}_2 > 0\), entonces \[ Z_0=\frac{\hat{p}_1 - \hat{p}_2 - \frac{1}{2} \left( \frac{1}{n_1} + \frac{1}{n_2} \right)}{\sqrt{ \hat{p}(1-\hat{p})\left(\frac{1}{n_1} +\frac{1}{n_2} \right)}}. \]
- Si \(\hat{p}_1 - \hat{p}_2 < 0\), entonces \[ Z_0=\frac{\hat{p}_1 - \hat{p}_2 + \frac{1}{2} \left( \frac{1}{n_1} + \frac{1}{n_2} \right)}{\sqrt{ \hat{p}(1-\hat{p})\left(\frac{1}{n_1} +\frac{1}{n_2} \right)}}. \]
El criterio del valor-\(P\) será el mismo utilizado cuando no se usa corrección por continuidad.