Distribución binomial

ANUNCIOS

Una distribución binomial se refiere a la de la probabilidad de una variable aleatoria discreta binomial.

Esta variable aleatoria discreta binomial X solamente puede tomar dos valores: “éxito” o “fracaso”.

En cada ensayo del llamado experimento de Bernouilli, la probabilidad de los dos resultados puede adquirir una de estas tres posibilidades:

Dibujo de las tres posibilades que puede tomar la probabilidad en un experimento Bernouilli

En la distribución binomial se sigue la llamada prueba de Bernuilli de n pruebas, que consiste en la realización repetida de n experimentos aleatorios en los que sólo aparecen uno de dos resultados. Y en cada intento, las probabilidades de éxito o fracaso permanecen constantes, independientemente de los resultados anteriores.

Resumiendo, una variable aleatoria X sigue una distribución binomial si cumple que:

  • En cada prueba son posibles solamente dos resultados: “éxito” o “fracaso”.
  • En cada intento, su resultado es independiente de los anteriores.
  • La probabilidad de obtener “éxito” (y en consecuencia, la de “fracaso”) no cambia a lo largo de todo el proceso.
  • Llamamos p a la probabilidad de que se verifique “éxito” y 1 – p = q a la probabilidad de que aparezca un “fracaso”. En efecto, p + q = p + (1 – p) = 1.

Un ejemplo de experimento aleatorio puede ser el lanzamiento de dados. Así se pueden concretar diferentes variables aleatorias, como:

  • Número de unos que se sacan con diez lanzamientos.
  • Número veces que salen dos cuatros lanzando dos dados a la vez veinte veces.

Los parámetros de una distribución binomial son n (número de intentos) y p (probabilidad de éxito).

Siendo la variable aleatoria binomial X, la distribución binomial se caracteriza así: X ∼ B(n, p).

La fórmula que determina probabilidad de obtener k éxitos en un experimento, es:

Fórmula de la probabilidad de obtener k éxitos en la distribución binomial

En la que:

Fórmula del coeficiente binomial en la distribución binomial

Es el llamado coeficiente binomial, que remite al binomio de Newton (a + b)n. De ahí, la denominación de distribución binomial. El coeficiente binomial se corresponde con el número de combinaciones sin repetición de n tomados en grupos de k elementos. Se resuelve con la función de Excel COMBINAT. Su desarrollo factorial es:

Fórmula del desarrollo factorial del coeficiente binomial

La fórmula anterior es de fácil aplicación cuando los números son reducidos. En otro caso, se puede recurrir a las calculadoras científicas o, por ejemplo, a la fórmula de Excel DISTR.BINOM (o DISTR.BINOM.N en la versión Excel 2010). Y existen tablas de la binomial que, de manera exhaustiva, permiten también llegar al resultado. Las tablas de la binomial pueden ofrecer probabilidades puntuales o probabilidades acumulativas.

Para esta variable aleatoria X, con distribución binomial X ∼ B(n, p), su media o, también, esperanza es, con diferentes denominaciones, según autores:

Fórmula de la esperanza o media en la distribución binomial

Mientras que para la misma variable, su desviación estándar (o desviación típica) se obtiene de:

Fórmula de la desviación estándar en la distribución binomial

La función de distribución acumulativa de la binomial, al tratarse de una variable discreta, será:

Fórmula de la distribución acumulativa binomial

Siendo k el número entero menor o igual que x.

La distribución normal, una aproximación a la distribución binomial

ANUNCIOS



Se ha dicho que calcular la probabilidad de que se verifique un “éxito” de una variable X en una distribución binomial, cuando n es un número grande, resulta un proceso engorroso.

Entonces, una buena aproximación es a través de una variable contínua X’ de distribución normal N(μ σ) que tenga los mismos valores de la media y la desviación típica de la binomial, es decir:

Fórmula de paso de la distribución binomial a distribución normal

En la imagen:

Gráfica del paso de la distribución binomial a distribución normal

Se usan las tablas de la normal tipificada.

Suele tomarse como medida de una buena aproximación cuando n > 30 y que p esté próximo a 0,5. También es un criterio de aproximación aceptable cuando se cumple que n > 10 y np > 5 y nq > 5, simultáneamente.

La variable X es discreta. Pero la variable X’ de la normal es continua y no puede tomar un valor puntual, pues el área bajo la campana de Gauss de un valor determinado sería nula. En ese caso, se recurre a la corrección de Yates o de continuidad, añadiendo al valor márgenes de 0,5 puntos, a izquierda o derecha.

Los casos en que se aplica la corrección de Yates se muestran en esta tabla:

Tabla de la corrección de Yates

Entonces se procede a la estandarización o tipificación y se resuelve consultando las tablas de la distribución normal estandarizada.

El proceso se mostrará en el ejercicio 4.

Este método facilita mucho el cálculo para números elevados de experimentos.

Ejercicios

Ejercicio 1

En un país de Europa se venden un 9 % de los teléfonos celulares con sistema operativo IOS (de Apple). De los veinte primeros clientes que en una mañana compran un teléfono celular en una gran tienda de informática, ¿cuántos cabe esperar que sean de Apple?

Solución:

El número de entre los veinte primeros clientes que se espera que compren un teléfono móvil de Apple es:

Cálculo del número esperado en el ejercicio 1

Se espera que la media de estos compradores sea de 1,8. Y con desviación estándar de:

Cálculo de la media y desviación típica en el ejercicio 1

Serán 1,27 clientes.

Ejercicio 2

En un país, el factor RH negativo en sangre se presenta en un 10 % de sus habitantes. Que probabilidad hay de que un día en un gran hospital, de los ocho primeros pacientes al analizarse la sangre, dos tengan un RH negativo (p = 0,1).

a) Hallar el resultado con la fórmula de la función de probabilidad.

b) Realizar el cálculo usando una tabla de probabilidades puntuales de la binomial.

Solución:

Valores a tener en cuenta: pruebas n = 8, éxitos k = 2 y probabilidad de cada éxito p = 0,1.

a) Sobre ellos se aplica la fórmula de la función de probabilidad de la binomial y se obtiene:

Solución del apartado a en el ejercicio 2

Hay un 14,88 % de probabilidad de que de los ocho primeros pacientes, dos sean de sangre con el RH negativo.

b) Con los tres valores iniciales, entramos en una tabla de probabilidades puntuales (vemos solamente la parte afectada).

En la consulta de n experimentos = 8 (amarilla), vamos a la columna de los “éxitos” (naranja) y seleccionamos la fila correspondientes a k = 2 y la cruzamos con la columna correspondiente a la probabilidad (en verde) de cada experimento, que es la p = 0,10. Fila y columna marcan la celda de intersección, que se corresponde con la probabilidad buscada:

Solución del apartado b en el ejercicio 2

Se ha obtenido el mismo resultado, del 14,88 %.

Ejercicio 3

Pedro y María hacen una apuesta. Gana quien obtenga su resultado exacto buscado. Pedro lanzará un dado veinte veces con el fin de que le salgan exactamente en cinco ocasiones o un 3 o un 5; María lanzará el dado doce veces para intentar obtener solamente en cinco tiradas una cara par del dado. ¿Quién de los dos tiene más posibilidades de ganar la apuesta?

a) Hallar el resultado con la fórmula de la función de probabilidad.

b) Realizar el cálculo usando una tabla de probabilidades puntuales de la binomial.

Solución:

La probabilidad en cada lanzamiento de Pedro es de p = 2/6 = 1/3 (son dos caras posibles, de seis, que es el espacio muestral). Los ensayos, n = 20. Los éxitos esperados, k = 5.

La probabilidad en cada lanzamiento de María es de p = 3/6 = 0,5 (hay tres caras pares). Sus ensayos, n = 12. Los éxitos, k = 5.

a) Sobre los datos de Pedro y María, se aplica sucesivamente la fórmula de la función de probabilidad de la binomial y se obtiene:

  • Para Pedro una probabilidad de:
    Probabilidad de Pedro en el ejercicio 3
  • Y la probabilidad de María será:
    Probabilidad de María en el ejercicio 3

María tiene más posibilidades de ganar la apuesta. Un 19,34 % frente a un 14,57 % de Pedro.

b) Entramos sucesivamente en las zonas afectadas de la tabla de probabilidad puntual de la binomial, con los parámetros n, k y p de Pedro y de María:

  • En primer lugar, Pedro:
    Tabla de probabilidades de Pedro en el ejercicio 3
  • Y la probabilidad de María:
    Tabla de probabilidades de María en el ejercicio 3

Confirmándose los mismos resultados, con la mayor probabilidad de ganar la apuesta María.

Ejercicio 4

Lanzando una moneda doce veces, ¿qué probabilidad habrá de obtener menos de cinco caras.

a) Hallar el resultado con la fórmula de la función de probabilidad.

b) Realizar el cálculo, si se cumplieran los requisitos, aproximando con la distribución normal.

Solución:

La variable binomial aleatoria X es: “número de caras obtenidas en doce lanzamientos”.

La probabilidad en cada lanzamiento es de p = 0,5. Los ensayos, n = 12. Los éxitos esperados, k < 5.

a) Para el cálculo exacto con la fórmula de la función de probabilidad de la binomial, habrá que sumar las probabilidades de obtener 4, 3, 2, 1 y ninguna cara:

Suma de probabilidades en el ejercicio 4

Aproximamos nuestra distribución binomial de variable X B(12, 0,5) a la normal N(6, 1,732) de variable X’, cuyo resultado es:

Aproximación a una normal en el ejercicio 4

La probabilidad de obtener menos de cinco caras en doce lanzamientos de una moneda es del 19,38 %.

Esto mismo lo podemos ver reflejados en la tabla de probabilidades puntuales de la binomial:

Tabla de probabilidades puntuales en el ejercicio 4

O, más directamente, en la tabla de probabilidades acumulativas de la binomial:

Tabla de probabilidades acumulativas en el ejercicio 4

b) Ahora haremos el cáculo de la probabilidad buscada mediante la aproximación de la binomial B(12, 0,5) de variable discreta X a una distribución normal con una variable aleatoria X’.

Comprobemos si se cumplen las condiciones para la aproximación:

Condiciones de aproximación en el ejercicio 4

Se cumplen. La distribución normal tendrá los parámetros:

Cálculo de los parámetros de la normal en el ejercicio 4

Aproximamos la distribución binomial a la normal N(6, 1,732). Ahora le hacemos la corrección de Yates, restándole medio punto para que la nueva variable continua X’ no contenga el punto 5 (consultar este caso en la tabla de la corrección de Yates que se ha mostrado arriba).

Aplicación de la corrección de Yates en el ejercicio 4

Estandarizamos el valor de la variable:

Estandarizamos variable en el ejercicio 4

Este valor de la variable estandarizada lo llevamos a esta parte de valores negativos de Z de la tabla de probabilidad acumulada:

Tabla de la probabilidad acumulada en el ejercicio 4

Como la puntuación estándar a buscar en la tabla, que es z = -0,866, se encuentra entre las dos celdas de la tabla correspondientes a las intersecciones –0,86 y –0,87. Esas dos celdas tienen valores 0,1948 y 0,1921. El valor exacto antes calculado era del 19,38 %. Ahora, con el procedimiento de aproximación a la binomial obtenemos una horquilla entre el 19,48 % y el 19,21 %, llegando de esta manera a una aproximación muy aceptable.


AUTOR: Bernat Requena Serra

AÑO: 2020


SI TE HA GUSTADO, ¡COMPÁRTELO!

También te podría gustar...

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *