DESCARGAR EL PDF
VARIABLE ALEATORIA
En principio una
variable es una característica o propiedad de una población y de la cual podemos podemos decir algo y en el mejor de los casos medirla. La variable aleatoria es una variable asociada a un experimento
aleatorio, entonces necesariamente es una característica de los posibles resultados de un experimento
aleatorio dentro del espacio muestral. La variable aleatoria
tiene su dominio en el espacio muestral y su rango en los números reales.
Ejem1: considerando el
ejemplo 5, definimos la variable aleatoria X: numero de genes para ojos
castaños: en el siguiente gráfico se muestra el dominio y su rango conformado
por los valores 0, 1 y 2.
El gráfico de arriba nos
muestra que el gen de (CC) tiene dos
genes, la de (CA) 1 gen, la de (AC) un gen también y la de (AA) ningún gen. Por lo tanto en el rango de la variable aleatoria es más probable que haya genes para diferente color( C,A y A,C) porque son dos de un total de cuatro.
A partir de ahora
estudiaremos el experimento aleatorio mediante la observación de la variable
aleatoria.
Dependiendo de los valores que toma el rango de la variable aleatoria esta se puede clasificar:
Dependiendo de los valores que toma el rango de la variable aleatoria esta se puede clasificar:
VARIABLE ALEATORIA
DISCRETA: si los valores del rango son enteros. En el ejemplo anterior veremos
que se trata de este tipo de variable aleatoria porque tiene tres posibles
valores finitos.
VARIABLE ALEATORIA
CONTINUA:si los valores del rango no son enteros
Indique usted según los
ejemplos enunciados cual de ellos contiene una variables aleatoria discreta y
cual es continua.
ejem.2
-numero de hijos de sexo
masculino que tienen una familia con 4 hijos vivos
-numero de casos de cancer de pulmón relacionados a la exposición de asbesto en sujetos adultos,
detectados mensualmente en los hospitales del MINSA de Lima Metropolitana.
-peso de los pacientes que se realizan una tomografía computarizada durante el año 2020
-peso de los pacientes que se realizan una tomografía computarizada durante el año 2020
Respuesta 1: los posibles
valores que puede tomar esta variable aleatoria es de 5 posibles valores
(0,1,2,3 y 4) lo cual quiere decir que es una variable aleatoria discreta
(finita).
Respuesta 2: no se puede
determinar el número posibles valores de la variable aleatoria por lo cual es una variable aleatoria discreta (infinita).
respuesta 3: se trata de una variable continua porque los valores que puede tomar la variable peso no necesariamente es un número entero.
respuesta 3: se trata de una variable continua porque los valores que puede tomar la variable peso no necesariamente es un número entero.
DISTRIBUCIÓN DE
PROBABILIDAD DE UNA VARIABLE ALEATORIA DISCRETA
La distribución de la
probabilidad de una variable aleatoria X es una forma de analizar y modelar la
variabilidad (recordemos que la estadística estudia la incertidumbre y la variabilidad), es decir cómo se distribuyen los valores del rango,
generalmente se representa de forma tabular, gráfica o fórmula, se muestran
todos los valores posibles de la variable aleatoria con sus probabilidades
respectivas de ocurrencia.
El tratamiento estadístico de la variable aleatoria se realiza mediante la distribución de probabilidades proceso similar a la tabla de de distribución de frecuencias. Para estudiar a las variables aleatorias y resumirlas correctamente debemos revisar el concepto de distribución de probabilidad con algo más de detalle. Como la definición lo indica se trata de distribuir en una tabla o con el apoyo de un gráfico los posibles valores de una variable, para evidenciar la frecuencia de estos valores asociados a su probabilidad de ocurrencia. Sabemos ya que la probabilidad de ocurrencia depende estadísticamente de la frecuencia con que ocurra, es decir del valor de la variable.
La distribución de
probabilidad se puede realizar fundamentalmente de tres formas:
1 TABLAS: Es muy parecido a
la tabla de frecuencias relativas
2 GRÁFICOS
Si se trata de una
variable aleatoria discreta entonces
podemos utilizar el gráfico de barras como en el caso de las variables
discretas anteriormente estudiadas.
3 FÓRMULAS
Cada probabilidad que
se encuentra en relación con el valor
que toma la variable aleatoria discreta siempre es mayor o igual a 0.
La suma de todas la
probabilidades es 1
Veamos algunos ejemplos:
Tabla:
Como vemos cada una de las
probabilidades es mayor o igual que cero y la suma de todas la probabilidades
es 1. Cabe indicar que en este ejemplo deseamos saber cual es la
distribución(forma) de probabilidades de los valores de la
variable:
"Numero escolares afectados en su salud por niveles no permisibles de
plomo en un grupo de 5 escolares expuestos".
Además de considerar que ningún
niño se encuentre afectado. Como observamos dos niños de la muestra aleatoria
presentan la mayor probabilidad de estar afectados por niveles de plomo no
permisible.
Gráfico:
La interpretación del
gráfico sería: es más probable encontrar en una muestra de 5 escolares dos que estén afectados con
niveles no permisibles de plomo
Observamos también que
esta variable no es simétrica. Recordemos que la simetría se presenta cuando los
valores más bajos son iguales a los valores más altos respecto a sus probabilidades de ocurrencia . En este caso se presenta una
asimetría negativa.
Completar el gráfico:
Título: Distribución de
probabilidad del número de escolares afectados en su salud, niveles de plomo en
sangre.
El valor de la moda: es
dos, es el valor de la variable con mayor frecuencia
Podríamos hacernos algunas preguntas interesantes sobre algunos casos de relevancia clínica, aquí mostramos algunos ejemplos:
Podríamos hacernos algunas preguntas interesantes sobre algunos casos de relevancia clínica, aquí mostramos algunos ejemplos:
*cuál es la probabilidad de
que:
a) tres escolares estén
afectados en su salud por niveles no permisibles de plomo en sangre
P(X=3)
b) a lo sumo dos escolares
estén afectados en su salud por niveles no permisibles de plomo en sangre
P(X ≤ 2)
c) más de cuatro escolares
estén afectados en su salud por niveles no permisibles de plomo en sangre
P(X ˃
4)= P(X=5)
Más adelante resolveremos este tipo de preguntas
Más adelante resolveremos este tipo de preguntas
ESPERANZA Y VARIANZA
De la misma forma en que
hemos trabajado con la varianza y otras medidas de resumen como la media y la
mediana con variables cuantitativas lo
podemos hacer con las variables aleatorias discretas que toman valores puntuales
o enteros.
El valor de la media o
esperanza se expresa por medio de la letra “µ”
La esperanza o
media es el resultado del producto
de cada valor de variable con su
respectiva probabilidad. Y la sumatoria de todas las esperanzas de los valores
de la variable es la esperanza total.
El cálculo de la
varianza lo obtenemos al multiplicar la diferencia entre el valor de la
variable y su esperanza todo al cuadrado por la probabilidad de ocurrencia del valor de la
variable. Debemos tener en cuenta que la suma de todas las varianzas de los
valores de la variable es la varianza total.
Del ejemplo de arriba
veremos:
Observamos que en la
tabla del ejemplo en la primera columna de la izquierda se encuentran los
diferentes valores de la variable. En la segunda columna se encuentran los valores
de la probabilidad de cada valor de la variable. En la tercera columna se
encuentra cada uno de los valores de la esperanza para cada valor de la variable.
Y en la sexta columna a partir de la izquierda se encuentran los valores de las
varianzas para cada valor de la variable Las unidades de varianza deben ser, en este, caso escolares
al cuadrado.
Para no tener un valor al
cuadrado como lo es la varianza le extraemos la raíz cuadrada la cual se
denomina desviación estándar que seria 1.445.
Resumen:
µ =E(X)=2.52 escolares
En promedio se espera que en la muestra aleatoria formada por 5 alumnos, 2,52 escolares se vean afectados su
salud por niveles altos de plomo en sangre.
Varianza =V(X)=2,0596
Desviación estándar: 1.4455
¿Cuál es la dispersión de
la variable aleatoria respecto de su esperanza?
Como es un solo grupo podemos calcular el coeficiente de variación. Recordemos que el coeficiente de variación es igual al cociente entre la desviación estándar y el promedio o la esperanza todo multiplicado por 100. Si este es valor supera el 10 % entonces la variable es bastante heterogénea. En este ejemplo el coeficiente de variación es de 57 % lo cual quiere decir que existe una alta dispersión. Dicho de otra forma los valores de la variable tomando en cuenta su probabilidad se alejan mucho de la media que es 2.52.
DISTRIBUCIONES ESPECIALES DE PROBABILIDAD
Hemos estudiado cómo se distribuyen los valores de las variables mediante una distribución de frecuencias absolutas acompañadas de sus respectivas frecuencias relativas y porcentuales. Las variables constituyen, por lo tanto una sucesión de eventos (valores que asume la variable) cada una con su propia frecuencia. Estudiando esta distribución hemos sido capaces de observar las frecuencias de cada uno de los eventos y los hemos clasificado, e incluso hemos calculado las medias, medianas, varianzas y desviacion estandar.
Ahora veremos como cómo a partir de una distribución de valores o de eventos de una variable (discreta o continua) se pueden calcular las probabilidades de cada uno de estos eventos bajo el enfoque teórico de la estadística frecuentista. Llegados a este punto hablaremos de la distribución de probabilidades en forma análoga a la distribución de valores de una variable en concreto.
La distribución de probabilidades es una forma de estudiar cuán posible es que se presente cierto valor de una variable bajo ciertos parámetros. Esta depende estrictamente del tipo de variable que analicemos.
Una distribución
de probabilidades es una función ƒ(x)
que asigna a cada suceso, dando a
conocer la probabilidad de que dicho suceso ocurra.
Los resultados de experimentos aleatorios se estudian a partir de la distribución de probabilidad asociada a una variable aleatoria, existen algunos modelos para el caso univariante (una sola variable).
La distribución de probabilidad binomial, el proceso de Poisson y la distribución normal de probabilidad son distribuciones de probabilidades que se emplean en experimentos aleatorios especiales o con variables aleatorias especiales. Por supuesto existen otros tipos de distribuciones de probabilidad, pero nos centraremos en las mencionadas. De este modo estudiaremos dos para variables aleatorias discretas: distribuciones Binomial y Poisson, y para las variables continuas: Distribución Normal.
La distribución de probabilidad binomial, el proceso de Poisson y la distribución normal de probabilidad son distribuciones de probabilidades que se emplean en experimentos aleatorios especiales o con variables aleatorias especiales. Por supuesto existen otros tipos de distribuciones de probabilidad, pero nos centraremos en las mencionadas. De este modo estudiaremos dos para variables aleatorias discretas: distribuciones Binomial y Poisson, y para las variables continuas: Distribución Normal.
El tipo de distribución que usemos depende fundamentalmente del tipo de variable bajo estudio. Las variables cualitativas o categóricas pueden ser distribuidas en sectores cuyo porcentaje nos dice cual es su frecuencia. Tomemos como ejemplo la distribución del sexo en un aula de clases, podríamos decir que 60% son mujeres y 40% hombres. El proceso es bastante sencillo viéndolo de esta manera. En contraste las variables cuantitativas continuas normalmente, debido a su gran densidad, poseen muchos valores o múltiples frecuencias que nos sería imposible representar en un gráfico de sectores o en una tabla de distribución de frecuencias. Para este tipo de variables es necesario hacer uso del histograma de frecuencias. Es así que en base a la distribución de frecuencias de los valores de la variable podemos establecer la probabilidad de cada uno de los eventos. Normalmente esto se realiza en muestras grandes o en poblaciones enteras, de tal suerte que mediante un procedimiento inferencial se puede usar para determinar a posteriori los posibles valores de probabilidad de los eventos de una variable aleatoria realizando extrapolaciones e interpolaciones. En esencia hemos descrito el trabajo estadístico que se realiza en un estudio científico, sin embargo es importante profundizar en cada uno de estos pasos para lograr nuestro objetivo de aprendizaje.
Una distribución de
probabilidad es una tabla, un gráfico,
una fórmula u otro sistema empleado para
especificar todos los valores posibles de un evento junto a las probabilidades de ocurrencia de
cada uno de estos valores.
DISTRIBUCIÓN DE PROBABILIDAD BINOMIAL
PROCESO DE BERNOULLI
El éxito es el resultado que le interesa estudiar al
investigador. Se trata por lo tanto del éxito en términos estadísticos, es
decir de un resultado buscado por el investigador. Por ejemplo si un
investigador decide estudiar a las personas que tienen dengue mediante una
prueba entonces el éxito del experimento aleatorio es probar que los sujetos de
experimentación tienen dengue. Si por el contrario decide estudiar a los
que no tienen dengue entonces su existo es no detectar mediante las pruebas el
dengue(pacientes sanos).
La probabilidad de éxito debe ser conocida y constante y se le representa con la “p” minúscula. Y la probabilidad del fracaso es 1-p o simplemente "q". La probabilidad de éxito es conocida porque se tuvo que haber determinada anteriormente de forma experimental, por lo tanto se trata de una probabilidad histórica.
El éxito de una observación no depende de otras observaciones del mismo tipo.
veamos algunos ejemplos:
En cualquiera de estos casos la posibilidad son dos.
|
A partir del experimento de Bernoulli se construye la distribución de probabilidad binomial, pero para eso es necesario hacer “n” repeticiones u observaciones con parámetro “p” debemos precisar que p, la probabilidad de éxito es el parámetro, es un valor conocido que caracteriza a la variable aleatoria .
Formalización:
Si se repite un número fijo de veces n, un experimento de Bernoulli con parámetro p, el número de éxitos que ocurre en n repeticiones u observaciones siegue una distribución binomial con parámetros n y p. En este caso la variable aleatoria asociada al experimento aleatorio es "X" y "x" es el Nº número de éxitos que ocurren en n observaciones, cuya distribución de probabilidad se expresa como:
Si se repite un número fijo de veces n, un experimento de Bernoulli con parámetro p, el número de éxitos que ocurre en n repeticiones u observaciones siegue una distribución binomial con parámetros n y p. En este caso la variable aleatoria asociada al experimento aleatorio es "X" y "x" es el Nº número de éxitos que ocurren en n observaciones, cuya distribución de probabilidad se expresa como:
En la distribución binomial en lugar de tratar saber cuál es la probabilidad de que un solo individuo tenga VIH(como en el caso del
proceso de Bernoulli), deseamos saber cuantos("x", número de éxitos) de un cierto numero individuos (tamaño de la
muestra, "n") lo tienen. Evidentemente debemos conocer por fuentes
externas cual es la probabilidad de tener VIH en la población bajo estudio(esto
se conoce normalmente como la prevalencia de una enfermedad). Simbolizamos esta
probabilidad por "p" De esta
manera la variable aleatoria se estudia a partir de la distribución binomial.
Observemos que la probabilidad de los eventos posibles, es decir de los valores de la variable aleatoria dependen del parámetro p, que es la probabilidad de que ocurra un evento para una población en particular, la denominamos probabilidad de ocurrencia. si la probabilidad de ocurrencia aumenta o disminuye la probabilidad de cada uno de los posibles eventos también aumentara o disminuirá, considerando el mismo numero de éxitos.
En este punto sería adecuado indicar en qué consiste el
cambio importante del enfoque probabilístico que se realiza para la
distribución de probabilidad binomial. Al inicio nos centrábamos en calcular la
probabilidad de las frecuencias de los valores de la variable según su
ocurrencia o en su defecto de acuerdo a los axiomas propios de la estadística
deductiva por ejemplo como en el caso de los dados. Ahora debemos calcular las
probabilidades de los eventos de la variable aleatoria según una probabilidad previamente conocida en base a estudios anteriores. Esto significa que
debemos hacer uso necesariamente de un enfoque empírico o histórico. expliquemos esto mejor con un ejemplo:
Se sabe que históricamente el 80% de los alumnos de tecnología Medica desaprueban el curso de anatomía. ¿Cuál es la probabilidad de que este año todos los alumnos(160) aprueben el curso de anatomía? ¿Cuál es la probabilidad de que este año todos los alumnos(160) desaprueben el curso de anatomía? Son dos preguntas interesantes porque las respuestas ponen en evidencia la naturaleza del proceso binomial. Como observamos la probabilidad de un evento futuro es calculada en base a una probabilidad histórica o empírica. Esta es precisamente la ventaja y utilidad de la distribución de probabilidad binomial. La probabilidad de un evento futuro depende de la probabilidad empírica o histórica y de la cantidad de eventos de la variable aleatoria. En este caso la probabilidad histórica es 80% mientras que el numero de eventos o lo que llamamos numero de observaciones "n" es de 160 alumnos. Si la cantidad de eventos fuera menos o superior la probabilidad de cada evento cambiaría de la misma forma que lo hace si cambiaría la probabilidad histórica o empírica.
Para evaluar esta probabilidad vamos a emplear la ya mencionada distribución de la probabilidad. Sabemos que la distribución de la probabilidad tiene tres formas: la forma tabular, la forma gráfica y la forma matemática.
Si deseamos calcular
la probabilidad de que 10 individuos de 30 tengan VIH o en otras palabras si
nos preguntamos cuánto es la probabilidad de que 10 individuos de los 30 tengan
VIH entonces utilizaremos la forma matemática de distribución binomial. Indicamos que los cálculos matemáticos ya están programados
en Excel.
A partir del conocimiento de n y p podemos saber los valores de:
- esperanza:
- varianza:
10 Para abreviar los enunciados utilizamos la
siguiente simbología:
La variable aleatoria X
tiene distribución binomial con parametros n y p
CALCULO DE LA PROBABILIDAD BINOMIAL
Existen dos tipos
diferentes de cálculo de la probabilidad binomial según lo que deseamos saber:
- Cálculo para probabilidades puntuales: cuando la variable aleatoria toma un único valor
- Cálculo para probabilidades acumuladas: cuando la variable aleatoria sea menor o igual que un valor.
Para hacer los
cálculos de la probabilidad binomial debemos hacer uso del Excel o de otros
programas estadísticos. Los cálculos más básicos se pueden realizar
satisfactoriamente en Excel. En este programa buscaremos la categoría
estadística y distribución binomial. Habiendo hecho lo anterior debemos indicar:
- El número de éxitos(x): es el valor que toma la variable aleatoria (x). Este puede ser puntual o acumulado.
- El número de ensayos que es la cantidad de observaciones hecha (n), normalmente es la muestra
- La probabilidad de éxito (p)
- No debemos olvidar en la opción acumulado debemos digital falso debido a que estamos haciendo un cálculo de probabilidad puntual. Para el cálculo de una probabilidad acumulada no digitaremos falso, en vez de ello digitaremos verdadero.
- La probabilidad de cada valor de la variables tanto puntual como acumulada.
Un fármaco de aplicación
intramuscular produce reacciones
adversas en 7 de cada mil oportunidades que se administra.
¿Cuál será la probabilidad que al aplicar 50 dosis se
produzca una
reacción adversa?
Para este Problema: n
= 50 k o x = 1 p = 0.007
Ejemplo.2 estudiosos de un
centro de investigación afirman que el 11 % de niños en edad escolar sufren de
hiperactividad producida por una mutación genética. Si se elige al azar 10
niños de esta población, cuánto es la probabilidad de que sufran de
hiperactividad producida por esta mutación genética:
1) exactamente dos niños
2) a lo sumo cuatro niños
3) más de dos niños
Veamos si el experimento aleatorio sigue un proceso de Bernoulli:
Los resultados son
independientes porque la condición de que un niño tenga hiperactividad no
implica que otro también lo tenga.
Variable aleatoria: Hiperactividad producida por una mutación genética
Esperanza o promedio: E(x)= np= 1.1 en la muestra de tamaño 10 se espera encontrar en promedio 1.1 niños con hiperactividad.
Varianza: V(X)=npq=0.979 niños al cuadrado con hiperactividad
Desviación estándar: σ=0.989 niños con hiperactividad
2) P(X ≤4)= en este caso
estamos acumulando probabilidades P(X=0)+…+P(X=4)=0.99748303
Como ya sabemos
digitaremos “verdadero” para acumular los valores de probabilidad puntuales en
este caso son 5 valores desde 0 a 4.
3) P(X>2)=Sabemos que el rango varía desde 0 hasta 10, que son los valores que puede tomar la variable aleatoria. Por ello toma los valores de 3 a 10 para este problema en referencia al número de éxitos. Sabemos que Excel no puede calcular este tipo de probabilidad, solamente tiene acumulada y puntual.
3) P(X>2)=Sabemos que el rango varía desde 0 hasta 10, que son los valores que puede tomar la variable aleatoria. Por ello toma los valores de 3 a 10 para este problema en referencia al número de éxitos. Sabemos que Excel no puede calcular este tipo de probabilidad, solamente tiene acumulada y puntual.
En este tipo de problemas
debemos proceder del siguiente modo:
- calculamos en este caso P(X=2)
- sabemos que la suma de todas la probabilidades de los diferentes valores que toma la variable (en este caso 0,1,2…10) es 1 por ello si deseamos encontrar P(X>2) entonces restamos 1- P(X≤2). De esta manera tendremos las probabilidades acumuladas desde P(X=3)+…P(X=10).
P(X≤2)=0.911556
1 P(X>2) = 0.884435
Distribución binomial con parámetros n=10 y p=0.11
La gráfica en Excel:
No olvidemos el título del gráfico, y las correspondientes etiquetas como en este ejemplo de abajo:
También observamos que la forma de la gráfica es asimétrica
positiva.
Es una variable heterogénea. Es dispersa a la media.
En la muestra de tamaño número 10 es más probable que
encontremos un niño con hiperactividad ocasionada por una mutación genética.
El promedio es 1.1
Las probabilidades acumuladas también se pueden calcular en
Excel:
Vemos en la tabla de arriba
que la mediana se encuentra alrededor de 1 porque el 69 % acumulado de
probabilidades se encuentra en el valor 1 (un niño) de la variable.
Recordemos que en términos
de probabilidad se maneja esperanza y varianza.
PROCESO DE DISTRIBUCIÓN DE POISSON
Se trata del calculo de la distribución de probabilidad para una variable aleatoria discreta como la binomial. A diferencia del calculo binomial los valores que puede tomar la variable no son finitos.
Cuando un experimento
aleatorio sigue un PROCESO DE POISSON tiene las siguientes características:
DISTRIBUCIÓN DE PROBABILIDAD POISSON
Deseamos definir matemáticamente el proceso de Poisson para ello debemos estudiar la distribución de probabilidad Poisson.
1. Se observa el número de ocurrencias, de algún evento en un intervalo de tiempo, espacio, volumen, área geográfica, etc. Por ejemplo: cuantos pacientes se atienden en un consultorio cada hora, el número de árboles que están afectados en un área, numero de coliformes fecales por un litro de agua de mar.
2. La probabilidad de que ocurra el evento en un intervalo es la misma para los intervalos del mismo tamaño; pero también es proporcional a la longitud del intervalo y ocurren de forma independiente. Por ejemplo si llegan a un aula cada 5 minutos 10 alumnos entonces en 10 minutos llegarán 20 alumnos. También decimos que la probabilidad de que lleguen al aula 10 alumnos cada cinco minutos es la misma durante los siguientes 5 minutos.
3. El número de eventos que ocurren en un intervalo es independiente del número de eventos que ocurren en otro intervalo. Esto quiere decir que si en los primeros cinco minutos llegaron 10 alumnos en los próximos 5 minutos pueden llegar o cabe la posibilidad al menos de que lleguen 10, 15 o 20, alumnos es decir, los eventos son independientes uno del otro según los intervalos de tiempo.
DISTRIBUCIÓN DE PROBABILIDAD POISSON
Deseamos definir matemáticamente el proceso de Poisson para ello debemos estudiar la distribución de probabilidad Poisson.
Observamos por la definición
que el número de observaciones o número de ensayos es muy grande o que tiende
al infinito y que la probabilidad de éxito es mínima.
Entendemos que una probabilidad es baja cuando estamos tratando con eventos raros.
esta situación se presenta de esta manera porque los eventos de la variable
aleatoria son densos (abundantes), aunque de naturaleza discreta y por lo tanto implican una gran cantidad de valores
posibles.
Debemos tener en cuenta que
la distribución de Poisson nace de la distribución binomial. En la distribución
binomial buscábamos saber cuál es la probabilidad de un número de éxitos determinado(x o k)) en “n” observaciones en
el caso de la distribución de Poisson buscamos saber cuál es la probabilidad de un número de
éxitos(x o k) determinado en un intervalo de valores(λ). Tal intervalo se caracteriza por su alta densidad de valores.Esto se explica porque en la distribución de Poisson el
número de observaciones es muy grande y se requiere tomar intervalos de
longitud fija grandes.
El parámetro de la
distribución Poisson es (λ), esta es la media de la binomial y representa en la
distribución Poisson el promedio de eventos por cada intervalo de valores. Así
vemos que en la distribución Poisson solamente hay un solo parametro. El valor de probabilidad de un determinado numero de éxitos depende solamente del valor promedio de la variable.
Veamos esto en un ejemplo:
En un centro de trabajo por cada 100 horas ocurre un accidente laboral. Deseamos saber cuál es la probabilidad de que ocurra dos accidentes en 8 horas. Es evidente que la probabilidad será bastante baja a diferencia de lo que ocurriría si la cantidad de accidentes por cada 100 horas fuera de 50 accidentes laborales. Como vemos la probabilidad de un evento depende solamente del valor promedio de la variable. Más adelante resolveremos este caso.
Formulación matemática:
Observemos que la probabilidad de los eventos posibles, es decir de los valores de la variable aleatoria dependen del parámetro λ , que es la probabilidad de que ocurra un evento para una población en particular, la denominamos probabilidad de ocurrencia. Si la probabilidad de ocurrencia aumenta o disminuye la probabilidad de cada uno de los posibles eventos también aumentara o disminuirá, considerando el mismo numero de éxitos.
En un centro de trabajo por cada 100 horas ocurre un accidente laboral. Deseamos saber cuál es la probabilidad de que ocurra dos accidentes en 8 horas. Es evidente que la probabilidad será bastante baja a diferencia de lo que ocurriría si la cantidad de accidentes por cada 100 horas fuera de 50 accidentes laborales. Como vemos la probabilidad de un evento depende solamente del valor promedio de la variable. Más adelante resolveremos este caso.
Formulación matemática:
La esperanza y la varianza coinciden en valor:
Observamos que λ siempre será bajo o cercano a cero porque es resultado de la multiplicación de un número alto por uno muy bajo. Decimos entonces que el promedio de la probabilidad de ocurrencia de un evento raro es bajo.
X se distribuye como una binomial con parámetro lamda.
Ejem. 3: Los siguientes casos corresponden a una v.a. de tipo Poisson:
-Número de casos atendidos a
causa de accidente de tránsito diariamente en el servicio de emergencia del
Hospital Dos de Mayo. En este caso la unidad de observación es “diariamente”
-Número de llamadas de
teléfono que se reciben una central de emergencias en una hora. La unidad de
medida es “una hora”.
-Número de asaltos
denunciados diariamente en los puestos policiales de Lima Metropolitana. Unidad
de observación es “diariamente”.
Si k o x es el número de ocurrencias de algún evento aleatorio en un intervalo de espacio o tiempo
(o algún volumen de materia), la
probabilidad de que k o x ocurra está dada
por:
Donde λ es el parámetro de la distribución y es el número promedio de ocurrencias del evento
dentro del intervalo (o volumen).
Resolvamos el primer ejercicio expuesto mas arriba:
"La incidencia de accidentes biológicos en personal de laboratorio es de un accidente por cada 100 horas de trabajo. Sí se observa a un trabajador durante un turno de 8 horas, ¿cual es la probabilidad de ocurrencia de dos accidentes?"
"La incidencia de accidentes biológicos en personal de laboratorio es de un accidente por cada 100 horas de trabajo. Sí se observa a un trabajador durante un turno de 8 horas, ¿cual es la probabilidad de ocurrencia de dos accidentes?"
Por la definición antes dada
del Proceso de poisson decimos que
cuando "n" es un número muy grande para un proceso binomial entonces toma la
forma de de un proceso de poisson.
Observamos que la esperanza
y la varianza son iguales.
1. 10 microorganismos, en 1
cm3.
Nos piden: P(X=10)
Calculo manual:
Con Excel:
Respuesta: P(X=10)=0.125
2. por lo menos de 15 microorganismo en 1 cm3
Nos piden: 1-P(X≥15)
Recordemos que Excel acumula
las probabilidades solamente hacia la izquierda del valor máximo de la variable hasta el cual queremos saber
la probabilidad cumulada de que ocurra
lo que deseamos medir.
P(X˂15)=?
Restando a 1 en valor de
P(X˂15)
3. menos de 60
microorganismos, en 5 cm3 .
queremos hallar: P(X≤59)
Consideramos que la
probabilidad de que ocurra un evento en un intervalo es la misma para un
intervalo de misma magnitud. No olvidemos que también los intervalos y sus
probabilidades son proporcionales.
Si en un cm3 teníamos un
parámetro lamda de 10 microorganismos entonces en 5 cm3 de agua tenemos un
parámetro lamda de 50. No olvidemos que el parámetro lamda es el promedio de
microorganismos por unidad de volumen. En este caso diremos que el promedio de
microorganismos en 5 cm3 de agua es de 50 microorganismos ( promedio).
Para resolver esta pregunta
utilizaremos el Excel acumulando hasta 59.
Calculando en Excel:
Respuesta :
P(X≤59)=0.9077.
Esta respuesta representa un porcentaje el cual es de aproximadamente el 90 %. es decir la probabilidad de que encontremos menos 60 microorganismos en 5 cm3 de gua es del 90%.
Esta respuesta representa un porcentaje el cual es de aproximadamente el 90 %. es decir la probabilidad de que encontremos menos 60 microorganismos en 5 cm3 de gua es del 90%.
Ahora debemos construir la tabla de probabilidades teniendo en cuenta que solamente
representaremos los valores de probabilidad para cada valor de la variable
hasta donde el valor de probabilidad se haga muy cercano a cero o cero.
En relación al gráfico
debemos dar cuenta de su forma y del promedio que es una característica muy
marcada para este tipo de distribución
Nota: A diferencia de la distribución binomial en donde es
imposible hacer el calculo de probabilidad de un numero superior de éxitos(x o
k) al de las observaciones, en la distribución de Poisson se puede calcular, al
menos en teoría la probabilidad de infinitos números de éxitos.
CONCLUSIÓN
DISTRIBUCIÓN DE PROBABILIDAD DE VARIABLES DISCRETAS
DISTRIBUCIÓN DE PROBABILIDAD DE VARIABLES CONTINUAS
DISTRIBUCIÓN NORMAL DE
PROBABILIDAD
La distribución normal de
probabilidad es la base de la inferencia estadística paramétrica.
Muchas variables aleatorias continuas presentan una función de densidad cuya gráfica
tiene forma de campana. Al considerar distribuciones binomiales, con parámetros
n y p, para un mismo valor de p y valores de n cada vez mayores, se observa que se
aproximan en su correspondiente gráfica a una curva en "forma de
campana".
Matemáticamente la
distribución normal tiene su origen en una distribución binomial. Recordemos
que los parámetros de la distribución binomial son n y p, si se incrementa el
número de observaciones (n) y p se mantiene en un valor fijo entonces
observaremos que la gráfica de este tipo de distribución toma forma de
campana(una gráfica caracterizada por su gran simetría bilateral debido a la
distribución de las probabilidades de los valores de la Variable).
El valor de n también puede permanecer siendo el mismo que la binomial
pero p se encuentra muy cercano a 0.5.
Si n es 20 y p 0.20 observamos un gráfica en forma de campana no tan definida
mientras que si n sigue siendo 20 pero p toma el valor de 0,35 esta gráfica
toma la forma muy aproximada a la de una campana, es decir se vuelve más
simétrica. Es precisamente en esto en lo que consiste la distribución normal.
Variables asociadas que
siguen este modelo de probabilidad tienen como características:
1. Características
morfológicas de individuos (personas, animales, plantas,...) de una especie,.
tallas, pesos, diámetros, perímetros,...
2. fisiológicas: efecto de
una misma dosis de un fármaco, o de una misma cantidad de abono.
3. sociológicas: consumo
(soles) de cierto producto de un grupo de individuos, puntajes de evaluaciones.
4. psicológicas: cociente
intelectual, grado de adaptación a un medio,muy importante para realizar los test etc.
La distribución binomial y de Poisson sirven
para variables de tipo aleatoria discreta mientras que la distribución de la
NORMAL nos servirá para variables aleatorias continuas.
La distribución normal
es la base para las pruebas PARAMÉTRICAS
FUNCIÓN DE DENSIDAD
La distribución de una
variable aleatoria continua, en este caso esta dada por:
La distribución normal es
continua por ello lleva el nombre de función densidad. La palabra densidad
alude a que los valores que puede tomar
la variable aleatoria son infinitos por lo cual se hace uso de los números
reales, este último es un conjunto de números altamente denso.
Esta
fórmula pertenece a una distribución continua porque X, es decir los valores
que puede tomar la variable pertenecen al conjunto de los números reales.
Observamos que la media
(µ) pertenece a los reales y que la desviación estándar σ (sigma) es
mayor que cero.
La probabilidad de los eventos posibles, es decir de los valores de la variable aleatoria dependen de dos parámetros: la media(µ) y la desviación estándar (σ) si la media o la desviación estándar varían, la probabilidad de cada uno de los posibles eventos también variará en el mismo sentido y magnitud,considerando el mismo numero de éxitos.
En esta
ecuación aparece el símbolo de la integral lo cual quiere decir que se están
realizando muchas sumas, similar al caso de una variable aleatoria discreta. La
diferencia es que en este último caso la sumatoria se usaba para valores enteros
en cambio la integral se usa para sumar valores reales.
Las distribuciones
normales son una familia de
distribuciones que tienen en general la misma forma. Son simétricas con valores que se concentran
más hacia el medio que hacia los
extremos (colas).
Observamos la gráfica de
la campana de Gaus, muy útil para distribuciones normales. Se trata de una
curva de distribución de probabilidad generada por: el nivel de probabilidad en
el eje "y" versus los valores de la variable en el eje "x"
La simetría de la
distribución normal o función de densidad está basada en la media porque ella
es la que se encuentra en el centro del gráfico. Por ello decimos que es
simétrica respecto a su esperanza.
Vemos cómo es que se hace
la notación donde X tiene distribución normal(N). µ representa a LA MEDIA y
sigma al cuadrado (σ)2 es la varianza.
PROPIEDADES:
MÁS PROPIEDADES
-Tiene una única moda, que
coincide con su media y su
mediana.Existe otra distribución en la que la media y la medina coinciden
pero no la moda. La única distribución(uniforme) en la que coinciden estas tres
medidas es en la distribución normal.
-La curva normal es
asintótica al eje de abscisas. Por ello,
cualquier valor entre -∞ y +∞ es teóricamente
posible. El área total bajo la curva es igual a 1. Esta ultima condición
nos explica porque a medida que el numero de observaciones aumentan la altura
de cada valor, en la gráfica es menor. Por el contrario cuando los eventos son pocos la altura de la curva
de distribución de probabilidad es mayor.
-Es simétrica con respecto
a su media µ(porque la media coincide con la medina). Según esto, para este tipo de variables existe una
probabilidad de un 50% de observar un
dato mayor que µ y un 50% de observar un
dato menor, es decir, la mitad de los valores de la variable se encuentran a la
derecha de la media y el otro 50% a la izquierda de la media.
-El área bajo la curva
comprendida entre los valores situados
aproximadamente a dos σ de la media es igual
a 0.95. Es decir, existe un 95% de posibilidades de observar un valor de la variable comprendido en el intervalo.
-La distancia entre la
línea trazada en la media y el punto de
inflexión de la curva es igual a una σ. Cuanto
mayor sea σ, más aplanada será la curva.
µ - 1.96σ ; µ + 1.96σ
La forma de la campana de
Gauss depende de los parámetros µ y σ.
INTERPRETACIÓN DE LAS
CARACTERÍSTICAS DE LA NORMAL
Se nos indica que es
simétrica con respecto a la esperanza porque esta ultima se encuentra en el
punto más alto de la campana de Gaus, como se observa en el gráfico de abajo.
Todo lo que se encuentra a la derecha de µ es equivalente a lo que se encuentra
a su izquierda pero de diferente signo.
Se dice que es monótona
creciente y monótona decreciente porque
desde un valor muy pequeño crece hasta µ y luego decrece hasta un valor
también muy pequeño
Se dice que la gráfica de
la distribución normal tiene puntos de inflexión por el cambio de sentido que
sufren los valores de probabilidad en ciertos puntos de la gráfica, decimos
entonces que pasa de cóncava hacia arriba a cóncava hacia abajo.
Es importante notar que en
los puntos de inflexión de la gráfica como observamos en la figura de abajo se
puede representar un intervalo cuyo valor en términos de porcentaje acumulado
es del 68% de probabilidad. Este intervalo es desde µ-σ hasta µ+σ. De la misma
forma desde µ-2σ hasta µ+2σ es del 95 % de probabilidad acumulada.
Observamos en el gráfico
de arriba como los valores de probabilidad son mínimos en las regiones
laterales y muy altas en la región central. Es evidente que la curva de la
función densidad o campana de Gauss es una curva de probabilidades.
El que tenga puntos de
inflexión quiere decir que a la media se le suma a la derecha σ y se le resta a
la izquierda σ lo cual forma un intervalo. Los intervalos son muy útiles porque
nos brindan información acerca de la confianza
de la probabilidad de un evento, son los llamados intervalos de
confianza.
Debido a que la
distribución de probabilidad normal depende de µ y σ la forma y posición de la
curva dependerán de estas propiedades de la distribución.
En el gráfico de arriba
observamos como la curva se hace más picuda cuando la desviación estándar
disminuye y se hace más ancha cuando sucede lo contrario con la desviación
estándar. Queda claro que cuando la desviación estándar disminuye se acompaña
de un aumento en la cantidad de posibles valores de la variable, dicho de otra forma la magnitud de la
variable es más densa. Cuando disminuyen la cantidad de valores de la
variable y la distancia entre ellas es mayor entonces la desviación estándar es
mayor y por lo tanto la curva se hace más ancha.
En el gráfico mostrado
arriba observamos como la posición de la curva de distribución normal,cambia en
el eje x. Esto es resultado del cambio de la media(µ) de la distribución
normal.
Función de distribución
acumulada:
Cuya gráfica es:
Ejemplo 5. Si X~ N(4,25)
gráfica:
1. P(X≤ 10)
2. P(9.5≤ X ≤12.6)
3. P(X=15.3)? vale cero,
pero Excel hace una aproximación
respuesta:
* X~ N(4,25) ..4
representa la media mientras que 25 representa la varianza
* 5 es la desviación
estándar.
RESOLUCIÓN:
1 P(X≤10)
En este ejemplo nos piden
la probabilidad acumulada P(X≤10) de los valores de la variable hasta un valor
máximo de 10. Lo podemos calcular por Excel
La gráfica será
aproximadamente:
P(X≤10)= 0.8849
Nota: En Excel escogeremos
la opción de no estandarizado porque los parámetros de esta distribución que
son 4 y 25 no se encuentran entre cero y uno, en caso de serlo entonces estamos
frente a una distribución estandarizada.
2 P(9.5≤X≤12.6)
En este ejercicio nos
piden la probabilidad acumulada de los valores de la variable que se encuentran
entre 9.5 y 12.6.
Como Excel no puede
calcular este acumulado de probabilidades haremos lo siguiente:
-calculamos el acumulado
de probabilidades hasta un valor de la variable de 12.6.
-calculamos el acumulado
de probabilidades hasta un valor de la variable de 9.5.
- obtenidos los acumulados
restamos P(X≤12.6)-P(X≤9.5). este valor es el pedido.
P(X≤12.6)=0.9572
P(X≤9.5)=0.8643
P(X≤12.6)-P(X≤9.5)=0.09294
Observamos a P(X≤12.6) le
restamos P(X≤9.5) de manera que la probabilidad P(X=9.5) queda fuera del
acumulado P(X≤12.6)-P(X≤9.5) por lo que surge cierta preocupación, sin embargo
sabemos ya que los valores puntuales en este caso P(X=9.5) tienen el valor de
cero y por lo tanto no afecta en nada nuestro procedimiento.
La gráfica es
aproximadamente:
3 P(X=15.3)=0.00620
El cálculo con Excel para
un valor puntual en una distribución normal es un valor de probabilidad muy
pequeño. En este caso fue de : 0.00620, pero sabemos que en realidad el valor
puntual vale cero desde el punto de vista probabilístico.
Al ver el gráfico de la
distribución normal encontramos un área sombreada en color la cual representa
la probabilidad acumulada hasta un valor de la variable dado. Esto ocurre así
porque la variable es además de aleatoria continua e incluye a los decimales.
Diremos por lo tanto que la densidad de la distribución normal es muy alta. En
el caso de determinar la probabilidad de un valor puntual de la variable esta
será minina debido a que no cubre área alguna dentro del gráfico. Recordemos
que debajo de un punto no hay área por eso el valor es cero aunque Excel nos de
un valor aproximado a cero.
IMPORTANCIA DE LA
DISTRIBUCIÓN NORMAL DE PROBABILIDAD
La distribución normal es
recurrente en los fenómenos de la naturaleza. Este tipo de distribución se
puede graficar con la campana de Gaus con la cual podemos estudiar cómo se comportan los datos en base a sus
respectivas probabilidades de presentase. Por ejemplo si hacemos una
investigación en la talla de niños de 11 años esta obedecerá a una distribución
normal en el que los datos se acumulan alrededor de la mediana:
No debemos olvidar también
que a mayor observaciones o número de éxitos que tengamos más semejante será la
distribución a la curva normal.
Leyendo el problema nos
damos cuenta de que el mismo nos dice que sigue una distribución normal. Si en
un problema no nos dicen nada acerca de su tipo de distribución entonces
debemos analizar un poco más el problema. Los primeros indicios de que el
problema trata de una distribución normal es la forma aleatoria en que han sido
seleccionado los datos y en un número mayor a treinta casos.
-Variable: contenido de
arsénico en orina
-µ= 80 µg/L
-σ= 28 µg/L
X~N(80,784)
a) nos están pidiendo
P(X≤50), es decir la probabilidad cumulada de los valores de la variable
(arsénico en orina) hasta un valor máximo de 50 µg/L. este cálculo lo podemos
hacer con Excel:
Respuesta: 0.141
No olvidemos que la
respuesta debe estar en términos de porcentajes.
La interpretación de los
resultados sería que un 14.2 % de los niños de esa localidad tienen valores
permisibles de arsénico. Por exclusión diríamos que un 85.8 % son los niños que
están afectados.
La gráfica sería la
siguiente:
b)nos están pidiendo P(X≥90)
es decir las probabilidades acumuladas de los valores de la variable (arsénico
en orina) a partir de 90 µg/L para
arriba.
Debido a que Excel no
calcula este tipo de acumulación hacemos uso del complemento:
P(X≥90)=1-P(X≤90)
1-0.639=0.360 que es
nuestro resultado final: 36%de la muestra
La gráfica sería la
siguiente:
Una observación muy
importante que se cumple solamente para variables cuantitativas continuas es la
siguiente:
Solo para una variable
continua:
P(X≤a)=P(X˂a)
c) nos piden:
P(66≤X≤93)=
P(X≤93)-P(X≤66)
Por lo cual debemos
calcular estas dos probabilidades acumuladas y restar una de otra para obtener
un valor de probabilidades aculadas que se encuentran entre 66 µg/L como mínimo
y 93 µg/L como máximo.
0.676-0.308=0.370 que es
nuestra respuesta en términos de porcentaje sería 37%
La gráfica sería:
DISTRIBUCIÓN NORMAL INVERSA
Ejem. 7: Considere los
datos del EJEMPLO 6 , para determinar
a El valor máximo de arsénico del 30%
inferior de niños.
En este caso ya tenemos la
probabilidad acumulada (30%) de ciertos
valores de la variable, pero lo que desconocemos por el momento y que es motivo
del problema es el mayor valor de la variable para el cual la probabilidad
funciona como tope acumulativo. Es decir el número de éxito más alto que tiene
la variable para tal probabilidad acumulada. Lo denotamos como un x minúscula.
Planteando el problema
tenemos:
P(X=x)=30 % = 0.3
Pare resolver este tipo de
problemas también podemos hacer uso de Excel y encontrar el valor de x del
siguiente modo:
Debemos utilizar el
comando distribución normal inversa.
Respuesta :
X= 65.31
No olvidemos que el área
representa la probabilidad, evidentemente el área total del gráfico representa
el 100 % de probabilidades.
El valor mínimo de arsénico para el
quinto superior de niños.
Respuesta:
P(X=x)=80 % = 0.8
X= 103.56
P(X=x)=80 % = 0.8
X= 103.56
Cuáles son los valores
de arsénico que contiene al 50% central de niños.
calcularemos: P(X=x)=25 % = 0.25
calcularemos: P(X=x)=75 % = 0.75
calcularemos: P(X=x)=25 % = 0.25
calcularemos: P(X=x)=75 % = 0.75
DISTRIBUCIÓN NORMAL ESTANDARIZADA
En la distribución normal
de probabilidad los valores en el eje x eran los valores concretos de una
variable aleatoria. Por ejemplo valores de creatinina, urea o plomo en sangre
expresadas en mg/decilitro. Cada variable poseía su propia curva de
distribución. Esta forma de estudiar los valores de probabilidad exigían un
análisis particular para cada variable volviéndose tedioso. Para
resolver este problema se emplea la distribución normal estandarizada. Con este
tipo de análisis todas las variables de distribución normal pueden ser estudiadas
bajo un mismo procedimiento. Valiendonos de tablas estadísticas previamente
confeccionadas muy útiles para todos los casos de distribución normal podremos NORMALIZAR cualquier variable con distribución normal. Resulta mucho más fácil determinar los valores de probabilidad de cada evento aleatorio posible y posteriormente realizar las pruebas estadísticas adecuadas.
Si la X ̴ N (µ,
σ2 ) entonces la variable aleatoria:
Se denomina normal estandarizada de X
cuya función de densidad y función de distribución acumulada son
respectivamente:
- su media es cero, su varianza es uno y su desviación típica es uno. No depende de ningún parámetro
- la curva es simétrica respecto a Z=0 y toma aquí su máximo valor
- tiene dos puntos de inflexión en: Z=1 y Z= -1
La característica más
importante de este tipo de distribución es que la media vale cero y la varianza
toma el valor de 1.
Es una distribución normal
con µ=0 y σ=1
En la distribución normal estandarizada los
valores que encontramos en el eje x , a diferencia de la distribución normal en
la que se tenían valores concretos de unidades de una magnitud como creatinina,
son números abstractos, es decir sin unidades de medida. Estos valores no son
más que las desviaciones estándar distribuidas a lo ancho de la curva de
distribución de probabilidad normal estandarizada.
En la distribución normal
cada valor o evento de la variable
aleatoria bajo estudió se caracteriza por su desviación estándar respecto a la
media, de esta manera podemos establecer la probabilidad de cada valor de la
variable aleatoria de forma indirecta a través de la desviación estándar.
El cálculo de la
probabilidad del evento de una variable a través de la desviación estándar se
realiza a partir de la distribución de las observaciones. Este procedimiento se
denomina estandarización de la variable. Después de esto el cálculo de las
probabilidades de cada éxito es mucho más fácil. Cada éxito (x o k) de un total de
observaciones (n) del siguiente modo:
Por ejemplo si observamos la distribución de glucosa en sangre y asumimos que la media es de 90 mg/dl y que su desviación estándar es de 15 entonces podríamos preguntarnos a cuantas desviaciones estándar se encuentra por ejemplo un individuo cuyo valor de glucosa en sangre es de 120 mg/dl. Restaríamos 120 menos 90 que es igual a 30, es decir, se encuentra por encima de 30 unidades de medida de la media. Si dividimos este valor entre la desviación estándar (15 mg/dl) que nos es más que la desviación promedio diríamos que se encuentra a 2 desviaciones estándar (Z). El valor de Z nos indica cuán lejos se encuentra de la media, por sobre encima o por debajo.
Se sabe empíricamente el área que cubre 1 desviación estándar por encima y por debajo de la media equivale al 68 % de las observaciones, mientras que a 1,96 desviaciones estándar el área es equivalente al 95 % de las probabilidades. Por ejemplo si se sabe que el peso promedio de un recién nacido es de 3200 y su desviación estándar es de 400 gramos ¿entre que valores estaría comprendido el 95% ? no hace falta más que multiplicar dos desviaciones estándar (800 gr) y sumarlas y dividirlas a la media: 2400-4000 gr aproximadamente.
EVALUACIÓN DE LA NORMALIDAD DE UNA DISTRIBUCIÓN
Realizaremos el denominado ANÁLISIS EXPLORATORIO DE DATOS.
Ejemplo 8. si Z~N(0,1) calcular:
- Medidas de tendencia
central y dispersión
- Asimetría y curtosis.
- Gráficos (histograma,
tallo y hojas, cajas, Q-Q).
- Pruebas de hipótesis.
Realizaremos el denominado ANÁLISIS EXPLORATORIO DE DATOS.
Ejemplo 8. si Z~N(0,1) calcular:
a) P(Z≤1,15)
b) P(Z ≥-0.83)
c) P(1.17 ≤ Z ≤ 1.25)
d) P(-1 ≤ Z ≤ 1)
a) si Z~N(0,1) entonces
µ: 0
σ: 1
P(Z≤1,15)
para hacer este cálculo
debemos hacer uso del Excel en este caso usaremos la función distribución
normal estándar
La gráfica aproximada
sería:
Respuesta: 0.874=87.4%
b) si z~N(0,1) entonces
µ: 0
σ: 1
P(Z≥-0.83) como es
evidente no podemos calcular en Excel este tipo de probabilidad cumulada hacia
la derecha por lo cual decidimos hacer uso de la simetría de la distribución
normal estándar para igualar P(Z≥-0.83) a P(Z≤0.83)
De esta manera ya podemos
calcular el área acumulada para resolver el problema con Excel: en distribución
normal estandarizada.
P(Z≤0.83)=0.7967=79.67%
c) si z~N(0,1) entonces
µ: 0
σ: 1
nos piden :
P(-1.17≤ Z ≤1.25)
Lo cual no se puede
calcular por razones que ya explicamos. Debemos darle la forma adecuada para
determinar la probabilidad acumulada de ese intervalo que nos piden.
Restamos: P( Z ≤ 1.25)-P(Z
≤ -1.17)
0.894-0.120=0.773 : esta
seria nuestra respuesta.
NOTA: recordemos que la
distribución normal estandarizada es una distribución normal pero con
parámetros 0 y 1.
CALCULO DEL VALOR DE UNA
V.A NORMAL ESTANDARIZAZA (INVERSA)
µ:0
σ:1
a) nos piden P(Z=k)=0.10
Para este cálculo
utilizaremos Excel haciendo uso de la función distribución normal estandarizada
inversa.
K=-1.281: k representa a
un valor de la variable cuya probabilidad es el tope del acumulado para esta
probabilidad que es 0.10. y es lo que queríamos Hallar
El gráfico es una campana
de distribución:
c) nos piden : P(a ≤ Z ≤
b)=0.75 probabilidad central
Como vemos este ejercicio
se trata de una distribución normal estandarizada inversa en al que se debe
hallar uno o dos valores si se trata de un parámetro de la variable cuyas
probabilidades son el límite del cumulo de probabilidades de intervalo de
probabilidades. En este caso efectivamente debemos hallar a y b que son los
límites de un intervalo de valores de la variable tal que la suma de sus probabilidades puntuales
es un acumulado de valor 0.75. debemos hallar estos valores haciendo uso de la
simetría en la campana de distribución para este tipo de variables.
La solución de este
problema es: a= -1.15 y b=1.15.
APROXIMACIÓN DE LA
BINOMIAL POR LA
NORMAL(TEOREMA DE MOIVRE)
En líneas más arriba hemos
dicho que cuando una distribución binomial presenta muchas repeticiones o
muchos números de éxito entonces esta se puede aproximar a la distribución
normal.
Con la fórmula de arriba
se aproxima una binomial a normal, es el teorema de Moivre.
En importante que np≥5 y
nq≥5, son condiciones para que se pueda aproximar a la binomial. Con esta
transformación en lugar de hallar una probabilidad binomial se halla una
probabilidad normal.
Observamos que este
ejemplo reúne todas las características de una normal y nos damos cuenta de que
el tamaño de la muestra es grande (mayor a treinta, 500) por ello es posible
resolver este problema haciendo una aproximación a la distribución normal. Verificamos que:
np=135
nq=98.55
y por lo tanto se confirma
la aproximación a la distribución normal.
-a) nos piden :
P(X=150)=P(149.5≤X≤150.5)
Debemos recordar que no
podemos hallar la probabilidad puntual de manera que generamos un intervalo
conveniente P(140.5≤X≤15.5) una vez hecho esto debemos hacer la transformación
por el teorema de Moivre del siguiente modo:
De esta manera obtenemos
el resultado haciendo uso del Excel restando las probabilidades acumuladas que
se muestran en el gráfico de arriba.
P(z≤1,56)-P(z≤1,46)= 0.94-0.92=0.012
No hay comentarios:
Publicar un comentario