Concepto
La finalidad de un intervalo de confianza es estimar un parámetro desconocido de una población a partir de una muestra. Al estimar la media de la población a partir de una muestra, podemos cometer un error de estimación |X- μ|.
La estimación por intervalo consiste en acotar el error con una alta probabilidad 1 – α (nivel de confianza) de forma que |X- μ| no sea superior a un estimado máximo (Emáx).
El error de estimación máximo (Emáx) es función de la variabilidad de la variable en la población, del nivel de confianza (n.c.) y del tamaño de la muestra:
El n.c. o probabilidad 1 – α significa que si extrajésemos todas las muestras posibles de una población, calculásemos la media en cada una de ellas y el intervalo de confianza, una proporción 1 – α de todos los intervalos de confianza contendrá la media poblacional y una proporción α no lo contendrá.
Tamaño de la muestra
Interesa que un intervalo sea lo más estrecho posible y con alta probabilidad. A mayor nivel de confianza mayor es el error de estimación máximo, por lo que más amplio será el intervalo y menos precisa será la estimación. Una forma de mantener y reducir el error de estimación máximo dado y aumentar el n.c., es aumentando n.
Otro factor que interviene es la variabilidad de la variable, cuanto mayor sea la desviación típica de la población, mayor debe ser n para alcanzar una misma precisión.
Para calcular el tamaño de la muestra desconociendo σ, hay que sustituir en la ecuación, la desviación típica por la cuasidesviación típica (Sn-1) y z1- α/2 por tn-1, 1-α/2 (tabla VI).
Aplicaciones
Los pasos para aplicar un intervalo de confianza son los siguientes:
Establecer un error de estimación máximo para un nivel de confianza 1 – α.
Obtener el tamaño de la muestra n para el error de estimación máximo especificado.
Extraer una muestra aleatoria de tamaño n y medir la variable.
Calcular el estadístico (es estimador del parámetro) con las medidas obtenidas.
Calcular los límites del intervalo de confianza.
Intervalo de confianza para la media
Límites de los intervalos de confianza y supuestos para la estimación de la media:
π es la proporción de la población que no es conocida.
n es el tamaño de la muestra y se debe cumplir nπ(1-π) > 5 para la aproximación a la normal.
Los límites inferior y superior del intervalo de confianza se obtienen a partir del error de estimación máximo. Como desconocemos π, que es lo que precisamente queremos estimar, operamos con la proporción muestral P. Así, si en Emáx sustituimos π por la proporción muestral P, los límites inferior y superior del intervalo de confianza son: -Ver archivo adjunto-.