Muestra estadística

Una muestra estadística (o una muestra) es un subconjunto de elementos de la población estadística.

El mejor resultado para un proceso estadístico sería estudiar a toda la población. Pero esto generalmente resulta imposible, ya sea porque supone un coste económico alto o porque requiere demasiado tiempo.

Frente a la dificultad de hacer un censo (estudio de toda la población), se examina una muestra estadística que representará a la totalidad de los sujetos. Con los resultado obtenidos mediante la muestra, se intentará inferir las propiedades de todos los elementos, mediante la estadística inferencial.

La muestra elegida debe ser representativa de la población. Las muestras tienen un nivel de confianza de la bondad con la que representan a todos los sujetos, generalmente del 95% o superior.

Ejercicio

Supongamos que se realiza un control de calidad en una fábrica que produce dvds en el transcurso de un día. Esta empresa produce un millón de dvds diarios por lo que sería imposible para los controladores examinarlos todos. Por ello, se elige una muestra de cien elementos para realizar dicho control.

Pero surge la siguiente pregunta: ¿Cómo elegimos la muestra?

Existen diferentes tipos de muestreo.

Y otra pregunta: ¿Cuál debe ser el tamaño de la muestra?

Tamaño de la muestra

Calcular el tamaño de la muestra (o tamaño muestral) es fundamental. Una muestra más grande supone un desperdicio de recursos; una muestra más pequeña produce una pérdida en la calidad de los resultados.

La ecuación a emplear depende del objetivo que se persiga (p.ej. una proporción, una media, etc.) y también depende del tamaño de la población, de si ésta es N es finita o infinita o muy grande.

La elección de los parámetros intervinientes para el cálculo han de ser determinados con base experta y, en todo caso, “pecar de conservadores”.

Tamaño de una muestra para estimar una proporción

Se halla con esta fórmula:

Fórmula del tamaño de una muestra a través de la proporción

Para aplicarla, debemos saber:

El nivel de confianza (1-α) o nivel de seguridad.
Una estimación de la proporción (p) que se quiere medir.
El margen de error (e) deseado.

El nivel de confianza (1-α) se refiere a la probabilidad de que el dato deseado esté dentro del margen establecido. Este parámetro lo decide el investigador. Suele ser del 95%, (α = 0,05) al que se corresponde un coeficiente de confianza Z = 1,96, que es el que se pone en la fórmula. Es la semidistancia estandarizada en términos de desviaciones típicas que definen ambos extremos del intervalo.

Dibujo del nivel de confianza y el coeficiente de confianza

Al hacer varios experimentos semejantes con el mismo tipo de muestra, el 95% de los parámetros se encontrarían dentro del margen, mientras que el 5% se encontrarían fuera de él.

Suelen emplearse el 95% y el 99%. En la siguiente tabla se ve la correspondencia entre el nivel de confianza y el coeficiente de confianza:

La estimación de la proporción que se quiere medir es el tema clave. Se quiere estimar la proporción de los que cumplen la condición. El valor de esa estimación p la obtendremos de estudios anteriores. En caso contrario, se considera que la condición la cumplan un 50% y, por tanto, que no la cumplan (1 – p) el otro 50%. En ese caso, pondremos en la fórmula:

El margen de error deseado, o precisión, o margen de error admisible, se refiere a la diferencia entre la media muestral y la media poblacional. Desde luego, que no se pretende cometer errores. Se trata de un margen de error que estemos dispuestos a tolerar.

Suele adoptarse e = 3% (0,03), aunque está entre:

En la fórmula pondremos el tanto por uno, por ejemplo, 0,03.

Cuando el tamaño de la población sea muy grande (suele considerarse cuando N > 100.000), la fórmula para hallar la muestra para obtener una proporción se simplifica:

Ejercicio 1

Se quiere estimar la proporción de un determinado parámetro en una población de N = 1500, con un nivel de confianza del 95% (Z = 1,96). Adoptamos un margen de error e = 6% (0,06) y, como no tenemos datos previos, estimamos una proporción de cumplimiento del 50% (0,5).

Con estas premisas, el tamaño muestral será de 227 personas.

Ejercicio 2

Calcular el tamaño muestral necesario para el mismo planteamiento del ejercicio anterior, pero esta vez para una población mucho más grande, pongamos que de N = 200.000:

Ahora, el tamaño de la muestra necesario es de 267. Se ve que el tamaño de la muestra no es, ni mucho menos, proporcional al tamaño de la población.

Ejercicio 3

Calcular el tamaño muestral para el planteamiento anterior para la misma población N = 200.000 y con la misma estimación conservadora de la proporción esperada del 50%, pero esta vez con más exigencia, fijando un margen de error e = 3% (0,03).

Al buscar un margen de error más estricto, el tamaño de la muestra necesario ha aumentado considerablemente a 1067 sujetos.

Ejercicio 4

Cuántas personas deben formar la muestra para estimar la prevalencia (es una proporción) de la miopía en los menores de 18 años en una población de en la que actualmente hay censados 10.000 menores de 18 años. Sabemos previamente que la proporción esperada está alrededor del 60%. Escogemos un nivel de os confianza del 95% y admitimos un margen de error del 4%:

Cálculo en el ejercicio 1 de tamaño muestral con margen de error diferente

Deberán seleccionarse 545 sujetos menores de 18 años.

Tamaño de una muestra para estimar una media

Se halla con esta fórmula:

Fórmula del tamaño de una muestra a través de la media

Para aplicarla, debemos saber:

A parte del nivel de confianza (1-α) y el margen de error (e) admitido, de los que se ha hablado arriba, ahora debemos tener una idea de la varianza (σ²) de la distribución de la variable a considerar.

Sino tuviésemos datos de esa varianza, recurriríamos a:

Estudios anteriores sobre el mismo asunto.
Realizar una prueba piloto con una muestra pequeña.
Tomar una estimación conservadora de la varianza, con el cuadrado de la mitad de la diferencia entre el valor máximo y el mínimo que consideramos puede tomar la variable.

Fórmula del tamaño de una muestra a través de la media con varianza desconocida

Ejercicio 5

En una fábrica de muebles con un proceso muy mecanizado se quiere saber cuál es la media del peso de un determinado modelo de mesa que ha sido fabricado a lo largo del último año. Se han fabricado una cantidad muy grande de unidades. Por anteriores ejercicios sabemos que la desviación típica σ de la variable buscada está alrededor de 50 gr. Queremos saber la media con un margen de error del 95% y admitimos un margen de error de 6 gr.

El tamaño de la muestra debe ser de 172 mesas fabricadas.

Ejercicio 6

Los alumnos varones de 10 años matriculados en el curso 2017-2018 en una nueva agrupación de centros docentes de una ciudad son 1650. Se quiere hacer un estudio para estimar la media de la estatura de esos 1650 escolares. Se fija un nivel de confianza del 95% y admitimos un margen de error de 1,8 cm.

No hay datos previos de la varianza de la variable estatura, dada la pluraridad del origen de los alumnos. Se recurre a adoptar un valor “conservador” de la varianza estimada, tomando el cuadrado de la semiamplitud que se considera. Es decir, ω² será la mitad de la diferencia del valor máximo y mínimo que nos consta por experiencia que conforman las diferentes estaturas de los adolescentes masculinos de esa edad:

Cálculo de la varianza en el ejercicio 6 de tamaño de la muestra para estimar la media

Conociendo los parámetros de este ejercicio, se aplica la fórmula del tamaño de la muestra para estimar la media de una población finita.

Resultado en el ejercicio 6 de tamaño de la muestra para estimar la media

Se tendrá que seleccionar una muestra de 132 escolares varones.

Conclusiones

Los parámetros tamaño de la muestra, n, nivel de confianza, Z y margen de error, e están relacionados mutuamente.
Si disminuimos el margen de error, e, debemos aumentar el tamaño de la muestra, n.
Si el nivel de confianza, Z lo adoptamos más alto, también tendremos que incrementar el tamaño de la muestra, n.
Como el parámetro que no se quiere tocar normalmente es el nivel de confianza, Z, entonces, para disminuir el margen de error, e admitido nos obligará a aumentar el tamaño de la muestra, n.

Diego

12 septiembre, 2020 a las 00:31

Alguien puede decirme la referencia de este tema por favor?

Responder

Maria Vera

6 julio, 2020 a las 08:10

TU INFORMACIÓN ES BUENA Y MUY VALIOSA, SIN EMBARGO SIEMPRE ES IMPORTANTE INCLUIR LAS FUENTES DE CONSULTA DE DONDE TE APOYASTE PARA REALIZAR TU DOCUMENTO Y SUBIR TU INFORMACIÓN