viernes, 8 de enero de 2016

DISTRIBUCIONES DE PROBABILIDAD

DESCARGAR EL PDF 

 VARIABLE ALEATORIA

 
En principio una variable es una característica o propiedad de una población y de la cual podemos podemos decir algo y en el mejor de los casos medirla. La variable aleatoria es una variable asociada a un experimento aleatorio, entonces necesariamente es una característica de los posibles resultados de un experimento aleatorio dentro del espacio muestral. La variable aleatoria tiene su dominio en el espacio muestral y su rango en los números reales.

Ejem1: considerando el ejemplo 5, definimos la variable aleatoria X: numero de genes para ojos castaños: en el siguiente gráfico se muestra el dominio y su rango conformado por los valores 0, 1 y 2.




El gráfico de arriba nos muestra que el  gen de (CC) tiene dos genes, la de (CA) 1 gen, la de (AC) un gen también y la de (AA) ningún gen. Por lo tanto en el rango de la variable aleatoria es más probable que haya genes para diferente color( C,A y A,C) porque son dos de un total de cuatro.

A partir de ahora estudiaremos el experimento aleatorio mediante la observación de la variable aleatoria.
Dependiendo de los valores que toma el rango de  la variable aleatoria esta se puede clasificar:


VARIABLE ALEATORIA DISCRETA: si los valores del rango son enteros. En el ejemplo anterior veremos que se trata de este tipo de variable aleatoria porque tiene tres posibles valores finitos.


VARIABLE ALEATORIA CONTINUA:si los valores del rango no son enteros


Indique usted según los ejemplos enunciados cual de ellos contiene una variables aleatoria discreta y cual es continua.

ejem.2

-numero de hijos de sexo masculino que tienen una familia con 4 hijos vivos

-numero de casos de cancer de pulmón relacionados a la exposición de asbesto en sujetos adultos, detectados mensualmente en los hospitales del MINSA de Lima Metropolitana.

-peso de los pacientes que se realizan una tomografía computarizada durante el año 2020 


Respuesta 1: los posibles valores que puede tomar esta variable aleatoria es de 5 posibles valores (0,1,2,3 y 4) lo cual quiere decir que es una variable aleatoria discreta (finita).


Respuesta 2: no se puede determinar el número posibles valores de la variable aleatoria por lo cual es una variable aleatoria discreta (infinita).

respuesta 3: se trata de una variable continua porque los valores que puede tomar la variable peso no necesariamente es un número entero. 



   
DISTRIBUCIÓN DE PROBABILIDAD DE UNA VARIABLE ALEATORIA DISCRETA
    
La distribución de la probabilidad de una variable aleatoria X es una forma de analizar y  modelar la variabilidad (recordemos que la estadística estudia la incertidumbre y la variabilidad), es decir  cómo se distribuyen los valores del rango, generalmente se representa de forma tabular, gráfica o fórmula, se muestran todos los valores posibles de la variable aleatoria con sus probabilidades respectivas de ocurrencia.

El tratamiento estadístico de la variable aleatoria se realiza mediante  la distribución de probabilidades proceso similar a la tabla de de distribución de frecuencias. Para estudiar a las variables aleatorias y  resumirlas correctamente debemos revisar el concepto de distribución de probabilidad con algo más de detalle. Como la definición lo indica se trata de distribuir en una tabla o con el apoyo de un gráfico los posibles  valores de una variable, para evidenciar la frecuencia de estos valores asociados a su probabilidad de ocurrencia. Sabemos ya que la probabilidad de ocurrencia depende estadísticamente de la frecuencia con que ocurra, es decir del valor de la variable.




La distribución de probabilidad se  puede realizar fundamentalmente de tres formas:



1 TABLAS: Es muy parecido a la tabla de frecuencias relativas



Donde  P() indica que se trata de  una probabilidad, X indica la variable aleatoria estudiada  y xi  es un posible valor de la variable. P(X=x)  se lee: la probabilidad de X tal que X tiene el el valor de x


2 GRÁFICOS 



Si se trata de una variable  aleatoria discreta entonces podemos utilizar el gráfico de barras como en el caso de las variables discretas anteriormente estudiadas.




3 FÓRMULAS


Cada probabilidad que se encuentra en  relación con el valor que toma la variable aleatoria discreta siempre es mayor o igual a 0.




La suma de todas la probabilidades es 1





Veamos algunos ejemplos:  

Tabla:




Como vemos cada una de las probabilidades es mayor o igual que cero y la suma de todas la probabilidades es 1. Cabe indicar que en este ejemplo deseamos saber cual es la distribución(forma) de probabilidades de los valores de la variable: 

"Numero escolares afectados en su salud por niveles no permisibles de plomo en un grupo de 5 escolares expuestos".

Además de considerar que ningún niño se encuentre afectado. Como observamos dos niños de la muestra aleatoria presentan la mayor probabilidad de estar afectados por niveles de plomo no permisible.


Gráfico:



La interpretación del gráfico sería: es más probable encontrar en una muestra de  5 escolares dos que estén afectados con niveles no permisibles de plomo

Observamos también que esta variable no es simétrica. Recordemos que  la simetría se presenta cuando los valores más bajos son iguales a los valores más altos respecto a sus probabilidades de ocurrencia . En este caso se presenta una  asimetría negativa.


Completar el gráfico:

Título: Distribución de probabilidad del número de escolares afectados en su salud, niveles de plomo en sangre.

El valor de la moda: es dos, es el valor de la variable con mayor frecuencia

Podríamos hacernos algunas preguntas interesantes sobre algunos casos de relevancia clínica, aquí mostramos  algunos ejemplos: 

*cuál es la probabilidad de que:

a) tres escolares estén afectados en su salud por niveles no permisibles de plomo en sangre

P(X=3)

b) a lo sumo dos escolares estén afectados en su salud por niveles no permisibles de plomo en sangre

P(X ≤ 2)

c) más de cuatro escolares estén afectados en su salud por niveles no permisibles de plomo en sangre

P(X ˃ 4)= P(X=5)

Más adelante resolveremos este tipo de preguntas 
  
ESPERANZA Y VARIANZA

De la misma forma en que hemos trabajado con la varianza y otras medidas de resumen como la media y la mediana con variables cuantitativas  lo podemos hacer con las variables aleatorias discretas que toman valores puntuales o enteros.

El valor de la media o esperanza se expresa por medio de la letra “µ”


La esperanza o media  es el resultado  del producto  de cada valor de  variable con su respectiva probabilidad. Y la sumatoria de todas las esperanzas de los valores de la variable es la esperanza total.




El cálculo de la varianza lo obtenemos al multiplicar la diferencia entre el valor de la variable y su esperanza todo al cuadrado por la probabilidad de ocurrencia del valor de la variable. Debemos tener en cuenta que la suma de todas las varianzas de los valores de la variable es la varianza total.




Del ejemplo de arriba veremos:


Observamos que en la tabla del ejemplo en la primera columna de la izquierda se encuentran los diferentes valores de la variable. En la segunda columna se encuentran los valores de la probabilidad de cada valor de la variable. En la tercera columna se encuentra cada uno de los valores de la esperanza para cada valor de la variable. Y en la sexta columna a partir de la izquierda se encuentran los valores de las varianzas para cada valor de la variable Las unidades de  varianza deben ser, en este, caso escolares al cuadrado.


Para no tener un valor al cuadrado como lo es la varianza le extraemos la raíz cuadrada la cual se denomina desviación estándar que seria 1.445.

Resumen:

 µ =E(X)=2.52 escolares

En promedio se espera que en la muestra aleatoria formada por  5 alumnos, 2,52 escolares se vean afectados su salud por niveles altos de plomo en sangre.

Varianza =V(X)=2,0596

Desviación estándar: 1.4455


¿Cuál es la dispersión de la variable aleatoria respecto de su esperanza?


Como es un solo grupo podemos calcular el coeficiente de variación. Recordemos que el coeficiente de variación es igual al cociente entre la desviación estándar y el promedio o la esperanza todo multiplicado por 100.  Si este es valor supera el 10 % entonces la variable es bastante heterogénea. En este ejemplo el coeficiente de variación es de 57 % lo cual quiere decir que existe una alta dispersión. Dicho de otra forma los valores de la variable tomando en cuenta su probabilidad se alejan mucho de la media que es 2.52.


   



DISTRIBUCIONES ESPECIALES DE PROBABILIDAD



Hemos estudiado cómo se distribuyen los valores de las variables mediante una distribución de frecuencias absolutas acompañadas de sus respectivas frecuencias relativas y porcentuales. Las variables constituyen, por lo tanto una sucesión  de eventos (valores que asume la variable) cada una con su propia frecuencia. Estudiando esta distribución hemos sido capaces de observar las frecuencias de cada uno de los eventos y los hemos clasificado, e incluso hemos calculado las medias, medianas, varianzas y desviacion estandar. 

Ahora veremos como cómo a partir de una distribución de valores o de eventos de una variable (discreta o continua)  se pueden calcular las probabilidades de cada uno de estos eventos bajo el enfoque teórico de la estadística frecuentista. Llegados a este punto hablaremos de la distribución de probabilidades en forma análoga a la distribución de valores de una variable en concreto. 

La distribución de probabilidades es una forma de estudiar cuán posible es que se presente cierto valor de una variable bajo ciertos parámetros. Esta  depende estrictamente del tipo de variable que analicemos.


 Una distribución de probabilidades es una función ƒ(x)  que asigna a cada  suceso, dando a conocer  la  probabilidad de que  dicho suceso ocurra.


Los resultados de experimentos aleatorios se estudian a partir de la distribución de probabilidad asociada a una variable aleatoria, existen algunos modelos para el caso univariante (una sola variable). 

La distribución de probabilidad binomial, el proceso de Poisson y la distribución normal de probabilidad son distribuciones de probabilidades que se emplean en experimentos aleatorios especiales o con variables aleatorias especiales. Por supuesto existen otros tipos de distribuciones de probabilidad, pero nos centraremos en las mencionadas. De este modo estudiaremos dos para variables aleatorias discretas: distribuciones Binomial y Poisson, y para  las variables continuas: Distribución Normal. 

El tipo de distribución que usemos depende fundamentalmente del tipo de variable bajo estudio. Las variables cualitativas o categóricas pueden ser distribuidas en sectores cuyo porcentaje nos dice cual es su frecuencia. Tomemos como ejemplo la distribución del sexo en un aula de clases, podríamos decir que 60% son mujeres y 40% hombres. El proceso es bastante sencillo viéndolo de esta manera. En contraste las variables cuantitativas continuas normalmente, debido a su gran densidad, poseen  muchos valores o múltiples frecuencias  que nos sería imposible representar en un gráfico de sectores o en una tabla de distribución de frecuencias. Para este tipo de variables es necesario hacer uso del histograma de frecuencias. Es así que en base a la distribución de frecuencias de los valores de la variable podemos establecer la probabilidad de cada uno de los eventos. Normalmente esto se realiza en muestras grandes o en poblaciones enteras, de tal suerte que mediante un procedimiento inferencial se puede usar para determinar a posteriori los posibles valores de probabilidad de los eventos de una variable aleatoria realizando extrapolaciones e interpolaciones. En esencia hemos descrito el trabajo estadístico que se realiza en un estudio científico, sin embargo es importante profundizar en cada uno de estos pasos para lograr  nuestro objetivo de aprendizaje.




Una distribución de probabilidad es una tabla, un  gráfico, una fórmula u otro sistema empleado para  especificar todos los valores posibles de un evento  junto a las probabilidades de ocurrencia de cada uno de  estos valores.




DISTRIBUCIÓN DE PROBABILIDAD BINOMIAL


 
PROCESO DE BERNOULLI



Es aquel experimento aleatorio que tiene tres características:


El éxito es el resultado que le interesa estudiar al investigador. Se trata por lo tanto del éxito en términos estadísticos, es decir de un resultado buscado por el investigador.  Por ejemplo si un investigador decide estudiar a las personas que tienen dengue mediante una prueba entonces el éxito del experimento aleatorio es probar que los sujetos de experimentación tienen dengue. Si  por el contrario decide estudiar a los que no tienen dengue entonces su existo es no detectar mediante las pruebas el dengue(pacientes sanos).





La probabilidad de éxito debe ser conocida y constante y se le representa con la “p” minúscula. Y la probabilidad del fracaso es 1-p o simplemente "q". La probabilidad de éxito es conocida porque se tuvo que haber determinada anteriormente de forma experimental, por lo tanto se trata de una probabilidad histórica. 




El éxito de una observación no depende de otras observaciones del mismo tipo. 

veamos algunos ejemplos:
En cualquiera de estos casos la posibilidad son dos.


A partir del experimento de Bernoulli se construye la distribución de probabilidad binomial, pero para eso es necesario hacer “n” repeticiones u observaciones con parámetro “p” debemos precisar que p, la probabilidad de éxito es el parámetro, es un valor conocido que caracteriza a la variable aleatoria . 


Formalización:

Si se repite un número fijo de veces n, un experimento de Bernoulli con parámetro p, el número de éxitos que ocurre en n repeticiones u observaciones siegue una distribución binomial con parámetros n y p. En este caso la variable aleatoria asociada al experimento aleatorio  es "X" y "x" es el Nº número de éxitos que ocurren en n observaciones, cuya distribución de probabilidad se expresa como:

    


En la distribución binomial en lugar de tratar saber cuál es la probabilidad de que un solo individuo  tenga VIH(como en el caso del proceso de Bernoulli), deseamos saber cuantos("x", número de éxitos)  de un cierto numero individuos (tamaño de la muestra, "n") lo tienen. Evidentemente debemos conocer por fuentes externas cual es la probabilidad de tener VIH en la población bajo estudio(esto se conoce normalmente como la prevalencia de una enfermedad). Simbolizamos esta probabilidad por "p"  De esta manera la variable aleatoria se estudia a partir de la distribución binomial. 


Observemos que la probabilidad de los eventos posibles, es decir de los valores de la variable aleatoria dependen del parámetro p, que es la probabilidad de que ocurra un evento para una población en particular, la denominamos probabilidad de ocurrencia. si la probabilidad de ocurrencia aumenta o disminuye la probabilidad de cada uno de los posibles eventos también aumentara o disminuirá, considerando el mismo numero de éxitos. 


En este punto sería adecuado indicar en qué consiste el cambio importante del enfoque probabilístico que se realiza para la distribución de probabilidad binomial. Al inicio nos centrábamos en calcular la probabilidad de las frecuencias de los valores de la variable según su ocurrencia o en su defecto de acuerdo a los axiomas propios de la estadística deductiva por ejemplo como en el caso de los dados. Ahora debemos calcular las probabilidades de los eventos de la variable aleatoria según una probabilidad previamente conocida en base a estudios anteriores. Esto significa que debemos hacer uso necesariamente de un enfoque  empírico o histórico.  expliquemos esto mejor con un ejemplo:

Se sabe que históricamente el 80% de los alumnos de tecnología Medica  desaprueban el curso de anatomía. ¿Cuál es la probabilidad de que este año todos los alumnos(160) aprueben  el curso de anatomía? ¿Cuál es la probabilidad de que este año todos los alumnos(160) desaprueben   el curso de anatomía? Son dos preguntas interesantes porque las respuestas  ponen en evidencia la naturaleza del proceso binomial. Como observamos la probabilidad de un evento futuro  es calculada en base a una probabilidad histórica o empírica. Esta es precisamente la ventaja y utilidad de la distribución de probabilidad binomial. La probabilidad de un evento futuro depende de la probabilidad empírica o histórica y de la cantidad de eventos de la variable aleatoria. En este caso la probabilidad histórica es 80% mientras que el numero de eventos o lo que llamamos numero de observaciones "n" es de 160 alumnos. Si la cantidad de eventos fuera menos o superior la probabilidad de cada evento cambiaría de la misma forma que lo hace si cambiaría la probabilidad histórica o empírica.

Para evaluar esta  probabilidad vamos a emplear la ya mencionada distribución de la probabilidad. Sabemos que la distribución de la probabilidad tiene tres formas: la forma tabular, la forma gráfica y la forma matemática.

Si deseamos calcular la probabilidad de que 10 individuos de 30 tengan VIH o en otras palabras si nos preguntamos cuánto es la probabilidad de que 10 individuos de los 30 tengan VIH entonces utilizaremos la forma matemática de distribución binomial. Indicamos que los cálculos matemáticos ya están programados en Excel.

A partir del conocimiento de n y p podemos saber los valores de:



  • esperanza:


  • varianza:


 10 Para abreviar los enunciados utilizamos la siguiente simbología:

La variable aleatoria X tiene distribución binomial  con parametros n y p





CALCULO DE LA PROBABILIDAD BINOMIAL

Existen dos tipos diferentes de cálculo de la probabilidad binomial según lo que deseamos saber:


  • Cálculo para probabilidades puntuales: cuando la variable aleatoria toma un único valor



  • Cálculo para probabilidades  acumuladas: cuando la variable aleatoria sea menor o igual que un valor.


Para hacer los cálculos de la probabilidad binomial debemos hacer uso del Excel o de otros programas estadísticos. Los cálculos más básicos se pueden realizar satisfactoriamente en Excel. En este programa buscaremos la categoría estadística y distribución binomial. Habiendo hecho lo anterior debemos indicar:


  • El número de éxitos(x): es el valor que toma la variable aleatoria (x). Este  puede ser puntual o acumulado.
  • El número de ensayos que es la cantidad de observaciones hecha (n), normalmente es la muestra 
  • La probabilidad de éxito (p)
  • No debemos olvidar en la opción acumulado debemos digital falso debido a que estamos haciendo un cálculo de probabilidad puntual. Para el cálculo de una probabilidad acumulada no digitaremos falso, en vez de ello digitaremos verdadero.
  • La probabilidad de cada valor de la variables tanto puntual como acumulada.


Un fármaco de aplicación intramuscular produce reacciones  adversas en 7 de cada mil oportunidades que se administra.
¿Cuál será la probabilidad que al aplicar 50 dosis se produzca una
reacción adversa?
Para este Problema:      n = 50    k o x = 1      p = 0.007








Ejemplo.2 estudiosos de un centro de investigación afirman que el 11 % de niños en edad escolar sufren de hiperactividad producida por una mutación genética. Si se elige al azar 10 niños de esta población, cuánto es la probabilidad de que sufran de hiperactividad producida por esta mutación genética:

1) exactamente dos niños
2) a lo sumo cuatro niños
3) más de dos niños

Veamos si el experimento aleatorio sigue un proceso de Bernoulli:



Los resultados son independientes porque la condición de que un niño tenga hiperactividad no implica que otro también lo tenga.



Variable aleatoria: Hiperactividad producida por una mutación genética
Esperanza o promedio: E(x)= np= 1.1 en la muestra de tamaño 10 se espera encontrar en promedio 1.1 niños con hiperactividad.
Varianza: V(X)=npq=0.979 niños al cuadrado con hiperactividad
Desviación estándar: σ=0.989 niños con hiperactividad
Usando los procedimientos pertinentes, los resultados son:


1)  P(X=2)= 0.21434726






2)  P(X ≤4)= en este caso estamos acumulando probabilidades P(X=0)+…+P(X=4)=0.99748303



       Como ya sabemos digitaremos “verdadero” para acumular los valores de probabilidad           puntuales en este caso son 5 valores desde 0 a 4.


3) P(X>2)=Sabemos que el rango varía desde 0 hasta 10, que son los valores que puede tomar la variable aleatoria. Por ello toma los valores de 3 a 10 para este problema en referencia al número de éxitos. Sabemos que Excel no puede calcular este tipo de probabilidad, solamente tiene acumulada y puntual.

     En este tipo de problemas debemos proceder del siguiente modo:

  1. calculamos en este caso P(X=2)
  2. sabemos que la suma de todas la probabilidades de los diferentes valores que toma la variable (en este caso 0,1,2…10) es 1 por ello si deseamos encontrar P(X>2) entonces restamos 1- P(X≤2). De esta manera tendremos las probabilidades acumuladas desde P(X=3)+…P(X=10).
P(X≤2)=0.911556
1    P(X>2) = 0.884435

Distribución binomial con parámetros n=10 y p=0.11



La gráfica en Excel:




No olvidemos el título del gráfico, y las correspondientes etiquetas como en este ejemplo de abajo:


También observamos que la forma de la gráfica es asimétrica positiva.
Es una variable heterogénea. Es dispersa a la media.
En la muestra de tamaño número 10 es más probable que encontremos un niño con hiperactividad ocasionada por una mutación genética.
El promedio es 1.1

Las probabilidades acumuladas también se pueden calcular en Excel:



Vemos en la tabla de arriba que la mediana se encuentra alrededor de 1 porque el 69 % acumulado de probabilidades se encuentra en el valor 1 (un niño) de la variable.
Recordemos que en términos de probabilidad se maneja esperanza y varianza.





PROCESO DE DISTRIBUCIÓN DE POISSON


Se trata del calculo de la distribución de probabilidad para una variable aleatoria discreta como la binomial. A diferencia del calculo binomial los valores que puede tomar la variable no son finitos.

Cuando un experimento aleatorio sigue un PROCESO DE POISSON tiene las siguientes características:



1. Se observa el número de ocurrencias, de algún evento en un intervalo de tiempo, espacio, volumen, área geográfica, etc.  Por ejemplo: cuantos pacientes se atienden en un consultorio cada hora, el número de árboles que están afectados en un área, numero de coliformes fecales por un litro de agua de mar.
2. La probabilidad de que ocurra el evento en un intervalo es la misma para los intervalos del mismo tamaño; pero también es proporcional a la longitud del intervalo y ocurren de forma independiente. Por ejemplo si llegan a un aula cada 5 minutos 10 alumnos entonces en 10 minutos llegarán 20 alumnos. También decimos que la probabilidad de que lleguen al aula 10 alumnos cada cinco minutos es la misma durante los siguientes 5 minutos.
3. El número de eventos que ocurren en un intervalo es independiente del número de eventos que ocurren en otro intervalo. Esto quiere decir que si en los primeros cinco minutos llegaron 10 alumnos en los próximos 5 minutos pueden llegar o cabe la posibilidad al menos de que lleguen  10, 15 o 20, alumnos es decir, los eventos son independientes uno del otro según los intervalos de tiempo.


DISTRIBUCIÓN DE PROBABILIDAD POISSON

Deseamos definir matemáticamente el proceso de Poisson para ello debemos estudiar la distribución de probabilidad Poisson.



Observamos por la definición que el número de observaciones o número de ensayos es muy grande o que tiende al infinito y que la probabilidad de éxito es mínima. Entendemos que una probabilidad es baja cuando estamos tratando con eventos raros. esta situación se presenta de esta manera porque los eventos de la variable aleatoria son densos (abundantes), aunque de naturaleza discreta y por lo tanto implican una gran cantidad de valores posibles.

Debemos tener en cuenta que la distribución de Poisson nace de la distribución binomial. En la distribución binomial buscábamos saber cuál es la probabilidad de un  número de éxitos determinado(x o k))  en “n” observaciones en el caso de la distribución de Poisson buscamos saber cuál es la probabilidad de un número de éxitos(x o k) determinado en un intervalo de valores(λ).  Tal intervalo se caracteriza por su alta densidad de valores.Esto se explica porque en la distribución de Poisson el número de observaciones es muy grande y se requiere tomar intervalos de longitud fija grandes. 


El parámetro de la distribución Poisson es (λ), esta es la media de la binomial y representa en la distribución Poisson el promedio de eventos por cada intervalo de valores. Así vemos que en la distribución Poisson solamente hay un solo parametro. El valor de probabilidad de un determinado numero de éxitos depende solamente del valor promedio de la variable. 


Observemos que la probabilidad de los eventos posibles, es decir de los valores de la variable aleatoria dependen del parámetro  λ , que es la probabilidad de que ocurra un evento para una población en particular, la denominamos probabilidad de ocurrencia. Si la probabilidad de ocurrencia aumenta o disminuye la probabilidad de cada uno de los posibles eventos también aumentara o disminuirá, considerando el mismo numero de éxitos. 

Veamos esto en un ejemplo: 
En un centro de trabajo por cada 100 horas ocurre un accidente laboral. Deseamos saber cuál es la probabilidad de que ocurra dos accidentes en 8 horas. Es evidente que la probabilidad será bastante baja  a diferencia de lo que ocurriría si la cantidad de accidentes por cada 100 horas fuera de 50 accidentes laborales. Como vemos la probabilidad de un evento depende solamente del valor promedio de la variable. Más adelante resolveremos este caso.

Formulación matemática:



X: toma valores enteros por eso decimos que es una variable aleatoria discreta(x o k).


La esperanza y la varianza coinciden en valor:


Observamos que λ siempre será bajo o cercano a cero porque es resultado de la multiplicación de un número alto por uno muy bajo. Decimos entonces que el promedio de la probabilidad de ocurrencia de un evento raro es bajo.


X se distribuye como una binomial con parámetro lamda.



Ejem. 3: Los siguientes casos corresponden a una v.a. de tipo Poisson:

-Número de casos atendidos a causa de accidente de tránsito diariamente en el servicio de emergencia del Hospital Dos de Mayo. En este caso la unidad de observación es “diariamente”

-Número de llamadas de teléfono que se reciben una central de emergencias en una hora. La unidad de medida es “una hora”.

-Número de asaltos denunciados diariamente en los puestos policiales de Lima Metropolitana. Unidad de observación es “diariamente”.





 Si k o x es el número de ocurrencias de algún evento  aleatorio en un intervalo de espacio o tiempo (o algún  volumen de materia), la probabilidad de que k o x ocurra  está dada por:

Donde λ es el parámetro de la distribución y es el  número promedio de ocurrencias del evento dentro del  intervalo (o volumen).



Resolvamos el primer ejercicio expuesto mas arriba:

"La incidencia de accidentes biológicos en personal de  laboratorio es de un accidente por cada 100 horas de  trabajo. Sí se observa a un trabajador durante un turno  de 8 horas, ¿cual es la probabilidad de ocurrencia de  dos accidentes?"





Por la definición antes dada del Proceso de poisson  decimos que cuando "n" es un número muy grande para un proceso binomial entonces toma la forma de de un proceso de poisson.




Observamos que la esperanza y la varianza son iguales.


1. 10 microorganismos, en 1 cm3.
Nos piden: P(X=10)
Calculo manual:







Con Excel:



Respuesta: P(X=10)=0.125

2. por lo menos de 15 microorganismo en 1 cm3
Nos piden: 1-P(X15)
Recordemos que Excel acumula las probabilidades solamente hacia la izquierda del valor máximo  de la variable hasta el cual queremos saber la probabilidad cumulada de que ocurra  lo que  deseamos medir.




P(X˂15)=?






Restando a 1 en valor de P(X˂15)




3. menos de 60 microorganismos, en 5 cm3 .
queremos hallar: P(X≤59)

Consideramos que la probabilidad de que ocurra un evento en un intervalo es la misma para un intervalo de misma magnitud. No olvidemos que también los intervalos y sus probabilidades son proporcionales.
Si en un cm3 teníamos un parámetro lamda de 10 microorganismos entonces en 5 cm3 de agua tenemos un parámetro lamda de 50. No olvidemos que el parámetro lamda es el promedio de microorganismos por unidad de volumen. En este caso diremos que el promedio de microorganismos en 5 cm3 de agua es de 50 microorganismos ( promedio).

Para resolver esta pregunta utilizaremos el Excel acumulando hasta 59.





Calculando en Excel:




Respuesta :
P(X≤59)=0.9077.
Esta respuesta representa un porcentaje el cual es de aproximadamente el 90 %. es decir la probabilidad de que encontremos menos 60 microorganismos en 5 cm3 de gua es del 90%.

Ahora debemos construir la tabla de probabilidades teniendo en cuenta que solamente representaremos los valores de probabilidad para cada valor de la variable hasta donde el valor de probabilidad se haga muy cercano a cero o cero.



En relación al gráfico debemos dar cuenta de su forma y del promedio que es una característica muy marcada para este tipo de distribución




Nota: A diferencia de la distribución binomial en donde es imposible hacer el calculo de probabilidad de un numero superior de éxitos(x o k) al de las observaciones, en la distribución de Poisson se puede calcular, al menos en teoría la probabilidad de infinitos números de éxitos.



CONCLUSIÓN




DISTRIBUCIÓN DE PROBABILIDAD DE VARIABLES DISCRETAS 






DISTRIBUCIÓN DE PROBABILIDAD DE VARIABLES CONTINUAS









DISTRIBUCIÓN NORMAL DE PROBABILIDAD



La distribución normal de probabilidad es la base de la inferencia estadística paramétrica. Muchas variables aleatorias continuas presentan una función de densidad cuya gráfica tiene forma de campana. Al considerar distribuciones binomiales, con parámetros n y p, para un mismo valor de p y valores de n cada vez mayores, se observa que se aproximan en su correspondiente gráfica a una curva en "forma de campana".

Matemáticamente la distribución normal tiene su origen en una distribución binomial. Recordemos que los parámetros de la distribución binomial son n y p, si se incrementa el número de observaciones (n) y p se mantiene en un valor fijo entonces observaremos que la gráfica de este tipo de distribución toma forma de campana(una gráfica caracterizada por su gran simetría bilateral debido a la distribución de las probabilidades  de los valores de la Variable). El valor de n también puede permanecer siendo el mismo que la binomial pero  p se encuentra muy cercano a 0.5. Si n es 20 y p 0.20 observamos un gráfica en forma de campana no tan definida mientras que si n sigue siendo 20 pero p toma el valor de 0,35 esta gráfica toma la forma muy aproximada a la de una campana, es decir se vuelve más simétrica. Es precisamente en esto en lo que consiste la distribución normal.

Variables asociadas que siguen este modelo de probabilidad tienen como características:

1. Características morfológicas de individuos (personas, animales, plantas,...) de una especie,. tallas, pesos, diámetros, perímetros,...
2. fisiológicas: efecto de una misma dosis de un fármaco, o de una misma cantidad de abono.
3. sociológicas: consumo (soles) de cierto producto de un grupo de individuos, puntajes de evaluaciones.

4. psicológicas: cociente intelectual, grado de adaptación a un medio,muy importante para realizar los test etc.

 La distribución binomial y de Poisson sirven para variables de tipo aleatoria discreta mientras que la distribución de la NORMAL nos servirá para variables aleatorias continuas.


La distribución normal es la base para las pruebas PARAMÉTRICAS


FUNCIÓN DE DENSIDAD

La distribución de una variable aleatoria continua, en este caso esta dada por:




La distribución normal es continua por ello lleva el nombre de función densidad. La palabra densidad alude a  que los valores que puede tomar la variable aleatoria son infinitos por lo cual se hace uso de los números reales, este último es un conjunto de números altamente denso.
Esta fórmula pertenece a una distribución continua porque X, es decir los valores que puede tomar la variable pertenecen al conjunto de los números reales.
Observamos que la media (µ)  pertenece a los reales  y que la desviación estándar σ (sigma) es mayor que cero.


La probabilidad de los eventos posibles, es decir de los valores de la variable aleatoria dependen de dos parámetros: la media(µ) y la desviación estándar (σ)  si la media o la desviación estándar varían,  la probabilidad de cada uno de los posibles eventos también variará en el mismo sentido y magnitud,considerando el mismo numero de éxitos. 


En esta ecuación aparece el símbolo de la integral lo cual quiere decir que se están realizando muchas sumas, similar al caso de una variable aleatoria discreta. La diferencia es que en este último caso la sumatoria se usaba para valores enteros en cambio la integral se usa para sumar valores reales.


Las distribuciones normales son una familia de  distribuciones que tienen en general la misma forma.  Son simétricas con valores que se concentran más hacia  el medio que hacia los extremos (colas). 








Observamos la gráfica de la campana de Gaus, muy útil para distribuciones normales. Se trata de una curva de distribución de probabilidad generada por: el nivel de probabilidad en el eje "y" versus los valores de la variable en el eje "x"




La simetría de la distribución normal o función de densidad está basada en la media porque ella es la que se encuentra en el centro del gráfico. Por ello decimos que es simétrica respecto a su esperanza.

Vemos cómo es que se hace la notación donde X tiene distribución normal(N). µ representa a LA MEDIA y sigma al cuadrado (σ)2 es la varianza.

 PROPIEDADES:



MÁS PROPIEDADES


-Tiene una única moda, que coincide con su media y su  mediana.Existe otra distribución en la que la media y la medina coinciden pero no la moda. La única distribución(uniforme) en la que coinciden estas tres medidas es en la distribución normal.
-La curva normal es asintótica al eje de abscisas. Por  ello, cualquier valor entre -∞ y +∞ es teóricamente  posible. El área total bajo la curva es igual a 1. Esta ultima condición nos explica porque a medida que el numero de observaciones aumentan la altura de cada valor, en la gráfica es menor. Por el contrario cuando los eventos son pocos la altura de la curva de distribución de probabilidad es mayor. 
-Es simétrica con respecto a su media µ(porque la media coincide con la medina). Según esto,  para este tipo de variables existe una probabilidad de  un 50% de observar un dato mayor que µ y un 50% de  observar un dato menor, es decir, la mitad de los valores de la variable se encuentran a la derecha de la media y el otro 50% a la izquierda de la media.
-El área bajo la curva comprendida entre los valores  situados aproximadamente a dos σ de la media es igual  a 0.95. Es decir, existe un 95% de posibilidades de  observar un valor de la variable comprendido en el intervalo.
-La distancia entre la línea trazada en la media y el  punto de inflexión de la curva es igual a una σ. Cuanto  mayor sea σ, más aplanada será la curva.
µ - 1.96σ ;     µ + 1.96σ
La forma de la campana de Gauss depende de los  parámetros µ y σ.


INTERPRETACIÓN DE LAS CARACTERÍSTICAS DE LA NORMAL 

Se nos indica que es simétrica con respecto a la esperanza porque esta ultima se encuentra en el punto más alto de la campana de Gaus, como se observa en el gráfico de abajo. Todo lo que se encuentra a la derecha de µ es equivalente a lo que se encuentra a su izquierda pero de diferente signo.
Se dice que es monótona creciente y monótona decreciente porque  desde un valor muy pequeño crece hasta µ y luego decrece hasta un valor también muy pequeño
Se dice que la gráfica de la distribución normal tiene puntos de inflexión por el cambio de sentido que sufren los valores de probabilidad en ciertos puntos de la gráfica, decimos entonces que pasa de cóncava hacia arriba a cóncava hacia abajo.

Es importante notar que en los puntos de inflexión de la gráfica como observamos en la figura de abajo se puede representar un intervalo cuyo valor en términos de porcentaje acumulado es del 68% de probabilidad. Este intervalo es desde µ-σ hasta µ+σ. De la misma forma desde µ-2σ hasta µ+2σ es del 95 % de probabilidad acumulada.




Observamos en el gráfico de arriba como los valores de probabilidad son mínimos en las regiones laterales y muy altas en la región central. Es evidente que la curva de la función densidad o campana de Gauss es una curva de probabilidades.
El que tenga puntos de inflexión quiere decir que a la media se le suma a la derecha σ y se le resta a la izquierda σ lo cual forma un intervalo. Los intervalos son muy útiles porque nos brindan información acerca de la confianza  de la probabilidad de un evento, son los llamados intervalos de confianza.

Debido a que la distribución de probabilidad normal depende de µ y σ la forma y posición de la curva dependerán de estas propiedades de la distribución.


En el gráfico de arriba observamos como la curva se hace más picuda cuando la desviación estándar disminuye y se hace más ancha cuando sucede lo contrario con la desviación estándar. Queda claro que cuando la desviación estándar disminuye se acompaña de un aumento en la cantidad de posibles  valores de la variable, dicho de otra forma la magnitud de la variable es más densa. Cuando disminuyen la cantidad de valores de la variable y la distancia entre ellas es mayor entonces la desviación estándar es mayor y por lo tanto la curva se hace más ancha.


En el gráfico mostrado arriba observamos como la posición de la curva de distribución normal,cambia en el eje x. Esto es resultado del cambio de la media(µ) de la distribución normal.

Función de distribución acumulada:


Cuya gráfica es:



Ejemplo 5. Si X~ N(4,25) gráfica:

1. P(X≤ 10)
2. P(9.5≤ X ≤12.6)
3. P(X=15.3)? vale cero, pero Excel hace una aproximación
 
respuesta:

* X~ N(4,25) ..4 representa la media mientras que 25 representa la varianza

* 5 es la desviación estándar.




RESOLUCIÓN:


1 P(X≤10)
En este ejemplo nos piden la probabilidad acumulada P(X≤10) de los valores de la variable hasta un valor máximo de 10. Lo podemos calcular por Excel






La gráfica será aproximadamente:





P(X≤10)= 0.8849


Nota: En Excel escogeremos la opción de no estandarizado porque los parámetros de esta distribución que son 4 y 25 no se encuentran entre cero y uno, en caso de serlo entonces estamos frente a una distribución estandarizada.



2 P(9.5≤X≤12.6)
En este ejercicio nos piden la probabilidad acumulada de los valores de la variable que se encuentran entre 9.5 y 12.6.
Como Excel no puede calcular este acumulado de probabilidades haremos lo siguiente:

-calculamos el acumulado de probabilidades hasta un valor de la variable de 12.6.
-calculamos el acumulado de probabilidades hasta un valor de la variable de 9.5.
- obtenidos los acumulados restamos P(X≤12.6)-P(X≤9.5). este valor es el pedido.

Los cálculos se pueden hacer en Excel


P(X≤12.6)=0.9572
P(X≤9.5)=0.8643
P(X≤12.6)-P(X≤9.5)=0.09294
Observamos a P(X≤12.6) le restamos P(X≤9.5) de manera que la probabilidad P(X=9.5) queda fuera del acumulado P(X≤12.6)-P(X≤9.5) por lo que surge cierta preocupación, sin embargo sabemos ya que los valores puntuales en este caso P(X=9.5) tienen el valor de cero y por lo tanto no afecta en nada nuestro procedimiento.


La gráfica es aproximadamente:




Cuál es la probabilidad que toma 15.3 para este ejemplo:


3 P(X=15.3)=0.00620

El cálculo con Excel para un valor puntual en una distribución normal es un valor de probabilidad muy pequeño. En este caso fue de : 0.00620, pero sabemos que en realidad el valor puntual vale cero desde el punto de vista probabilístico.

Al ver el gráfico de la distribución normal encontramos un área sombreada en color la cual representa la probabilidad acumulada hasta un valor de la variable dado. Esto ocurre así porque la variable es además de aleatoria continua e incluye a los decimales. Diremos por lo tanto que la densidad de la distribución normal es muy alta. En el caso de determinar la probabilidad de un valor puntual de la variable esta será minina debido a que no cubre área alguna dentro del gráfico. Recordemos que debajo de un punto no hay área por eso el valor es cero aunque Excel nos de un valor aproximado a cero.




IMPORTANCIA DE LA DISTRIBUCIÓN NORMAL DE PROBABILIDAD



La distribución normal es recurrente en los fenómenos de la naturaleza. Este tipo de distribución se puede graficar con la campana de Gaus con la cual podemos estudiar  cómo se comportan los datos en base a sus respectivas probabilidades de presentase. Por ejemplo si hacemos una investigación en la talla de niños de 11 años esta obedecerá a una distribución normal en el que los datos se acumulan alrededor de la mediana:



No debemos olvidar también que a mayor observaciones o número de éxitos que tengamos más semejante será la distribución a la curva normal.


Leyendo el problema nos damos cuenta de que el mismo nos dice que sigue una distribución normal. Si en un problema no nos dicen nada acerca de su tipo de distribución entonces debemos analizar un poco más el problema. Los primeros indicios de que el problema trata de una distribución normal es la forma aleatoria en que han sido seleccionado los datos y en un número mayor a treinta casos.

-Variable: contenido de arsénico en orina
-µ= 80 µg/L
-σ= 28 µg/L

X~N(80,784)

a) nos están pidiendo P(X≤50), es decir la probabilidad cumulada de los valores de la variable (arsénico en orina) hasta un valor máximo de 50 µg/L. este cálculo lo podemos hacer  con Excel:





Respuesta: 0.141


No olvidemos que la respuesta debe estar en términos de porcentajes.
La interpretación de los resultados sería que un 14.2 % de los niños de esa localidad tienen valores permisibles de arsénico. Por exclusión diríamos que un 85.8 % son los niños que están afectados.

La gráfica sería la siguiente:




b)nos están pidiendo P(X≥90) es decir las probabilidades acumuladas de los valores de la variable (arsénico en orina) a partir de 90  µg/L para arriba.
Debido a que Excel no calcula este tipo de acumulación hacemos uso del complemento:
P(X≥90)=1-P(X≤90)
Debemos calcular P(X≤90)



En Excel y nos da 0.639
1-0.639=0.360 que es nuestro resultado final: 36%de la muestra
La gráfica sería la siguiente:




Una observación muy importante que se cumple solamente para variables cuantitativas continuas es la siguiente:

Solo para una variable continua:


P(X≤a)=P(X˂a)


c) nos piden:


P(66≤X≤93)= P(X≤93)-P(X≤66)


Por lo cual debemos calcular estas dos probabilidades acumuladas y restar una de otra para obtener un valor de probabilidades aculadas que se encuentran entre 66 µg/L como mínimo y 93 µg/L como máximo.
0.676-0.308=0.370 que es nuestra respuesta en términos de porcentaje sería 37%
La gráfica sería:






DISTRIBUCIÓN  NORMAL INVERSA



Ejem. 7: Considere los datos del EJEMPLO 6 , para determinar

a  El valor máximo de arsénico del 30% inferior de niños.
En este caso ya tenemos la probabilidad acumulada (30%) de  ciertos valores de la variable, pero lo que desconocemos por el momento y que es motivo del problema es el mayor valor de la variable para el cual la probabilidad funciona como tope acumulativo. Es decir el número de éxito más alto que tiene la variable para tal probabilidad acumulada. Lo denotamos como un x minúscula.
Planteando el problema tenemos:
P(X=x)=30 % = 0.3
Pare resolver este tipo de problemas también podemos hacer uso de Excel y encontrar el valor de x del siguiente modo:

Debemos utilizar el comando distribución normal inversa.





Respuesta :
X= 65.31


No olvidemos que el área representa la probabilidad, evidentemente el área total del gráfico representa el 100 % de probabilidades.





El valor mínimo de arsénico para el quinto superior de niños.


Respuesta:
P(X=x)=80 % = 0.8
X= 103.56 

Cuáles son los valores de arsénico que contiene al 50% central de niños.

calcularemos: P(X=x)=25 % = 0.25





calcularemos: P(X=x)=75 % = 0.75



los valores que contienen al 50% centran son:
P(X=0.25) hasta P(X=0.75)   61,11 hasta 98.88 


DISTRIBUCIÓN NORMAL ESTANDARIZADA  


En la distribución normal de probabilidad los valores en el eje x eran los valores concretos de una variable aleatoria. Por ejemplo valores de creatinina, urea o plomo en sangre expresadas en mg/decilitro. Cada variable poseía su propia curva de distribución. Esta forma de estudiar los valores de probabilidad exigían un análisis particular para cada variable volviéndose tedioso. Para resolver este problema se emplea la distribución normal estandarizada. Con este tipo de análisis todas las variables de distribución normal pueden ser estudiadas bajo un mismo procedimiento. Valiendonos de tablas estadísticas previamente confeccionadas muy útiles para todos los casos de distribución normal podremos NORMALIZAR cualquier variable con distribución normal. Resulta mucho más fácil determinar los valores de probabilidad de cada evento aleatorio posible y posteriormente realizar las pruebas estadísticas adecuadas.


Si la X ̴ N (µ, σ2 ) entonces la variable aleatoria:


Se denomina normal estandarizada de X cuya función de densidad y función de distribución acumulada son respectivamente:






CARACTERÍSTICAS DE LA DISTRIBUCIÓN NORMAL ESTANDARIZADA


  1. su media es cero, su varianza es uno y su desviación típica es uno. No depende de ningún parámetro 
  2. la curva es simétrica respecto a Z=0 y toma aquí su máximo valor 
  3. tiene dos puntos de inflexión en: Z=1 y Z= -1



La característica más importante de este tipo de distribución es que la media vale cero y la varianza toma el valor de 1.



Es una distribución normal con µ=0 y σ=1

En la distribución normal estandarizada los valores que encontramos en el eje x , a diferencia de la distribución normal en la que se tenían valores concretos de unidades de una magnitud como creatinina, son números abstractos, es decir sin unidades de medida. Estos valores no son más que las desviaciones estándar distribuidas a lo ancho de la curva de distribución de probabilidad normal estandarizada.

En la distribución normal cada valor o evento  de la variable aleatoria bajo estudió se caracteriza por su desviación estándar respecto a la media, de esta manera podemos establecer la probabilidad de cada valor de la variable aleatoria de forma indirecta a través de la desviación estándar.

El cálculo de la probabilidad del evento de una variable a través de la desviación estándar se realiza a partir de la distribución de las observaciones. Este procedimiento se denomina estandarización de la variable. Después de esto el cálculo de las probabilidades de cada éxito es mucho más fácil.  Cada éxito (x o k) de un total de observaciones (n) del siguiente modo: 





Por ejemplo si observamos la distribución de glucosa en sangre y asumimos que la media es de 90 mg/dl y que su desviación estándar es de 15 entonces podríamos preguntarnos a cuantas desviaciones estándar se encuentra por ejemplo un individuo cuyo valor de glucosa en sangre es de 120 mg/dl. Restaríamos 120 menos 90 que es igual a 30, es decir, se encuentra por encima de 30 unidades de medida de la media. Si dividimos este valor entre la desviación estándar (15 mg/dl) que nos es más que la desviación promedio diríamos que se encuentra a 2 desviaciones estándar (Z). El valor de Z nos indica cuán lejos se encuentra de la media, por sobre encima o por debajo. 

Se sabe empíricamente el área que cubre  1 desviación estándar por encima y por debajo de la media equivale al 68 % de las observaciones, mientras que a 1,96 desviaciones estándar el área es equivalente al 95 % de las probabilidades. Por ejemplo si se sabe que el peso promedio de un recién nacido es de 3200 y su desviación estándar es de 400 gramos ¿entre que valores estaría comprendido el 95% ? no hace falta más que multiplicar dos desviaciones estándar (800 gr) y sumarlas y dividirlas a la media: 2400-4000 gr aproximadamente. 



EVALUACIÓN DE LA NORMALIDAD DE UNA DISTRIBUCIÓN 



- Medidas de tendencia central y dispersión
- Asimetría y curtosis.
- Gráficos (histograma, tallo y hojas, cajas, Q-Q).

- Pruebas de hipótesis.


Realizaremos el denominado ANÁLISIS EXPLORATORIO DE DATOS.




Ejemplo 8. si Z~N(0,1) calcular:


a) P(Z≤1,15)
b) P(Z ≥-0.83)
c) P(1.17 ≤ Z ≤ 1.25)
d) P(-1 ≤ Z ≤ 1)


a) si Z~N(0,1) entonces
µ: 0
σ: 1
P(Z≤1,15)
para hacer este cálculo debemos hacer uso del Excel en este caso usaremos la función distribución normal estándar







La gráfica aproximada sería:


Respuesta: 0.874=87.4%


b) si z~N(0,1) entonces
µ: 0
σ: 1
P(Z≥-0.83) como es evidente no podemos calcular en Excel este tipo de probabilidad cumulada hacia la derecha por lo cual decidimos hacer uso de la simetría de la distribución normal estándar para igualar P(Z≥-0.83) a P(Z≤0.83)




De esta manera ya podemos calcular el área acumulada para resolver el problema con Excel: en distribución normal estandarizada.



P(Z≤0.83)=0.7967=79.67%


c) si z~N(0,1) entonces
µ: 0
σ: 1
nos piden :
P(-1.17≤ Z ≤1.25)

Lo cual no se puede calcular por razones que ya explicamos. Debemos darle la forma adecuada para determinar la probabilidad acumulada de ese intervalo que nos piden.

Restamos: P( Z ≤ 1.25)-P(Z ≤ -1.17)

0.894-0.120=0.773 : esta seria nuestra respuesta.

NOTA: recordemos que la distribución normal estandarizada es una distribución normal pero con parámetros 0 y 1.



CALCULO DEL VALOR DE UNA V.A NORMAL ESTANDARIZAZA (INVERSA)


Si Z ̴ N (µ, σ) calcular k, a y b tal que:



µ:0
σ:1

a) nos piden P(Z=k)=0.10
Para este cálculo utilizaremos Excel haciendo uso de la función distribución normal estandarizada inversa.




K=-1.281: k representa a un valor de la variable cuya probabilidad es el tope del acumulado para esta probabilidad que es 0.10. y es lo que queríamos Hallar
El gráfico es una campana de distribución:




c) nos piden : P(a ≤ Z ≤ b)=0.75 probabilidad central

Como vemos este ejercicio se trata de una distribución normal estandarizada inversa en al que se debe hallar uno o dos valores si se trata de un parámetro de la variable cuyas probabilidades son el límite del cumulo de probabilidades de intervalo de probabilidades. En este caso efectivamente debemos hallar a y b que son los límites de un intervalo de valores de la variable  tal que la suma de sus probabilidades puntuales es un acumulado de valor 0.75. debemos hallar estos valores haciendo uso de la simetría en la campana de distribución para este tipo de variables.



P(Z≤a)=87,5 %=0,875




a=1,15
Por simetria b tendría el valor de -1,15


La solución de este problema es: a= -1.15 y b=1.15.



APROXIMACIÓN DE LA BINOMIAL POR LA

NORMAL(TEOREMA DE MOIVRE)



En líneas más arriba hemos dicho que cuando una distribución binomial presenta muchas repeticiones o muchos números de éxito entonces esta se puede aproximar a la distribución normal.

Con la fórmula de arriba se aproxima una binomial a normal, es el teorema de Moivre.


En importante que np≥5 y nq≥5, son condiciones para que se pueda aproximar a la binomial. Con esta transformación en lugar de hallar una probabilidad binomial se halla una probabilidad normal.

Observamos que este ejemplo reúne todas las características de una normal y nos damos cuenta de que el tamaño de la muestra es grande (mayor a treinta, 500) por ello es posible resolver este problema haciendo una aproximación a la distribución normal.  Verificamos que:
 np=135
 nq=98.55
y por lo tanto se confirma la aproximación a la distribución normal.


-a) nos piden : P(X=150)=P(149.5≤X≤150.5)
Debemos recordar que no podemos hallar la probabilidad puntual de manera que generamos un intervalo conveniente P(140.5≤X≤15.5) una vez hecho esto debemos hacer la transformación por el teorema de Moivre del siguiente modo:





De esta manera obtenemos el resultado haciendo uso del Excel restando las probabilidades acumuladas que se muestran en el gráfico de arriba.


P(z≤1,56)-P(z≤1,46)= 0.94-0.92=0.012

No hay comentarios:

Publicar un comentario