Clase 7: Distribuciones de Probabilidad Discretas
📚 Introducción
En esta clase estudiaremos las distribuciones de probabilidad discretas más importantes y utilizadas en estadística. Estas distribuciones son modelos matemáticos que describen fenómenos aleatorios específicos que aparecen frecuentemente en la práctica. Cada distribución tiene su propio contexto de aplicación, función de probabilidad característica, y fórmulas para su esperanza y varianza. Dominar estas distribuciones es fundamental para el análisis estadístico aplicado.
Objetivos de la Clase
- Comprender y aplicar la distribución Bernoulli
- Entender el proceso Bernoulli como secuencia de ensayos independientes
- Trabajar con la distribución Binomial: función de probabilidad, esperanza y varianza
- Aplicar la distribución Geométrica para contar hasta el primer éxito
- Utilizar la distribución Binomial Negativa para contar hasta el r-ésimo éxito
- Aplicar la distribución Hipergeométrica para muestreo sin reemplazo
- Comprender y usar la distribución de Poisson para eventos raros
1. Distribución Bernoulli
1.1 Definición y Contexto
Definición - Distribución Bernoulli
Una variable aleatoria X tiene distribución Bernoulli si solo tiene dos valores posibles: 0 y 1. La función de probabilidad de una variable aleatoria Bernoulli está dada por:
p^x (1-p)^{1-x} & \text{si } x \in \{0, 1\} \\ 0 & \text{si } x \notin \{0, 1\} \end{cases}$$ donde $p \in (0, 1)$ se denomina **parámetro** de la distribución.
Notación:
Interpretación:
- representa un “éxito” (ocurre con probabilidad )
- representa un “fracaso” (ocurre con probabilidad )
Contexto de aplicación:
- Lanzamiento de una moneda (cara/sello)
- Éxito/fracaso de un experimento
- Sí/No en una encuesta
- Defectuoso/No defectuoso en control de calidad
1.2 Esperanza de Bernoulli
Teorema - Esperanza de Bernoulli
Si , entonces:
Demostración:
∎
1.3 Ejemplo 1: Esperanza de Bernoulli
Problema: Demuestre que si , entonces .
Solución
Ya demostrado arriba. La interpretación es que en promedio, la variable Bernoulli toma el valor p, que es precisamente la probabilidad de éxito.
2. Proceso Bernoulli
2.1 Definición
Definición - Proceso Bernoulli
Considere una secuencia infinita de variables aleatorias Bernoulli(p), tales que los eventos , son independientes. Esta secuencia se denomina proceso Bernoulli.
Notación: ,
donde “iid” significa “independientes e idénticamente distribuidas” (independent and identically distributed).
Interpretación: Es una secuencia de ensayos repetidos del mismo experimento, donde:
- Cada ensayo tiene solo dos resultados posibles (éxito/fracaso)
- La probabilidad de éxito es constante en todos los ensayos
- Los ensayos son independientes entre sí
Ejemplos:
- Lanzamientos repetidos de una moneda
- Inspección secuencial de productos en una línea de producción
- Preguntar a personas sucesivas su opinión (sí/no)
3. Distribución Binomial
3.1 Definición y Contexto
Definición - Distribución Binomial
Considere un proceso Bernoulli con . Sea , la variable que cuenta el número de éxitos en las primeras n realizaciones del proceso. Se dice que es una variable aleatoria con distribución Binomial con parámetros y .
Notación:
Parámetros:
- : número de ensayos
- : probabilidad de éxito en cada ensayo
Condiciones para aplicar Binomial:
- Número fijo de ensayos (n)
- Cada ensayo tiene solo dos resultados (éxito/fracaso)
- Probabilidad de éxito constante (p)
- Ensayos independientes
3.2 Función de Probabilidad
Teorema - Función de Probabilidad Binomial
Si , entonces:
\binom{n}{x} p^x (1-p)^{n-x} & \text{si } x \in \{0, 1, ..., n\} \\ 0 & \text{si } x \notin \{0, 1, ..., n\} \end{cases}$$ donde $\binom{n}{x} = \frac{n!}{x!(n-x)!}$ es el coeficiente binomial.
3.3 Ejemplo 2: Demostración de la Fórmula Binomial
Problema: Demuestre que si , entonces para .
Solución
Queremos calcular donde cuenta el número de éxitos.
Paso 1: Consideremos una secuencia específica con exactamente x éxitos. Por ejemplo, las primeras x variables son 1 y las restantes son 0:
La probabilidad de esta secuencia específica, por independencia, es:
Paso 2: ¿Cuántas secuencias diferentes tienen exactamente x éxitos?
Necesitamos elegir qué x posiciones (de las n totales) tendrán los éxitos. Esto se puede hacer de maneras diferentes.
Paso 3: Como todas las secuencias con x éxitos tienen la misma probabilidad , y hay de tales secuencias:
∎
3.4 Esperanza y Varianza de la Binomial
Teorema - Momentos de la Binomial
Si , entonces:
3.5 Ejemplo 3: Demostración de Esperanza y Varianza
Problema: Demuestre que si , entonces y .
Solución
Demostración de E(X):
Como donde :
Por linealidad de la esperanza:
∎
Demostración de Var(X):
Primero, para una Bernoulli:
Como los son independientes:
∎
Propiedad Clave
La varianza de la suma de variables independientes es la suma de las varianzas. Esta propiedad se usó en la demostración anterior.
4. Distribución Geométrica
4.1 Definición y Contexto
Definición - Distribución Geométrica
Considere un proceso Bernoulli de parámetro . Sea X el número de ensayos Bernoulli hasta que se observa el primer éxito. Se dice que X sigue una distribución Geométrica de parámetro p, y su función de probabilidad está dada por:
p(1-p)^{x-1} & \text{si } x \in \{1, 2, 3, ...\} \\ 0 & \text{si } x \notin \{1, 2, 3, ...\} \end{cases}$$
Notación:
Interpretación: X cuenta cuántos ensayos necesitamos realizar hasta obtener el primer éxito.
Cuidado con Definiciones Alternativas
Algunos textos y paquetes computacionales definen una variable aleatoria Geométrica como aquella que cuenta el número de fracasos antes del primer éxito. En ese caso, X tomaría valores en y la fórmula sería .
Contexto de aplicación:
- ¿Cuántas veces debo lanzar un dado hasta obtener un 6?
- ¿Cuántos productos debo inspeccionar hasta encontrar uno defectuoso?
- ¿Cuántas personas debo preguntar hasta encontrar una que apoye mi propuesta?
4.2 Derivación de la Fórmula
Razonamiento: Para que X = x (necesitemos x ensayos), debemos:
- Tener x-1 fracasos seguidos: probabilidad
- Seguido de un éxito en el ensayo x: probabilidad
Por independencia:
4.3 Esperanza y Varianza
Teorema - Momentos de la Geométrica
Si , entonces:
Interpretación de E(X): Si la probabilidad de éxito es p, en promedio necesitamos ensayos para obtener el primer éxito.
Ejemplo: Si (20% de éxito), entonces ensayos en promedio.
5. Distribución Binomial Negativa
5.1 Definición y Contexto
Definición - Distribución Binomial Negativa
Considere un proceso Bernoulli con parámetro . Sea X el número de ensayos hasta que ocurran los primeros r éxitos. Se dice que X sigue una distribución Binomial Negativa con parámetros , y su función de probabilidad está dada por:
\binom{x-1}{r-1} p^r (1-p)^{x-r} & \text{si } x \in \{r, r+1, r+2, ...\} \\ 0 & \text{si } x \notin \{r, r+1, r+2, ...\} \end{cases}$$
Notación:
Parámetros:
- : número de éxitos deseados
- : probabilidad de éxito en cada ensayo
Cuidado con Definiciones Alternativas
Algunos textos definen la Binomial Negativa como el número de fracasos antes del r-ésimo éxito. En ese caso, X tomaría valores en .
Relación con la Geométrica: La distribución Geométrica es un caso especial de la Binomial Negativa con :
5.2 Derivación de la Fórmula
Razonamiento: Para que X = x (necesitemos x ensayos para r éxitos):
- En los primeros x-1 ensayos debe haber exactamente r-1 éxitos
- El ensayo x debe ser un éxito (el r-ésimo)
5.3 Esperanza y Varianza
Teorema - Momentos de la Binomial Negativa
Si , entonces:
Interpretación: En promedio, necesitamos ensayos para obtener r éxitos.
5.4 Ejemplo 4: Aplicación de Binomial Negativa
Problema: Usted dejará de ir al estadio si su equipo pierde tres o más veces en el campeonato de apertura. Si la probabilidad que tiene su equipo de ganar un partido es constante e igual a 0.8, y los resultados de los diferentes partidos son independientes, ¿cuál es la probabilidad de que usted alcance a ir a 4 partidos?
Solución
Traducción del problema:
- Dejamos de ir después de la tercera derrota
- Queremos saber: ¿cuál es la probabilidad de ver exactamente 4 partidos?
Planteamiento:
- Sea X = número de partidos hasta obtener 3 derrotas
- “Éxito” = derrota del equipo, con probabilidad
- Queremos que X = 4 (en 4 partidos ocurran las 3 derrotas)
Entonces
Cálculo:
Respuesta: La probabilidad de que alcance a ir a exactamente 4 partidos es 0.0192 o 1.92%.
Clave del Problema
Identificar qué es “éxito” en el contexto del problema. Aquí, el “éxito” es una derrota del equipo, no una victoria. Esto es contra-intuitivo pero correcto para aplicar la fórmula.
6. Distribución Hipergeométrica
6.1 Definición y Contexto
Definición - Distribución Hipergeométrica
Una variable aleatoria X tiene distribución Hipergeométrica con parámetros N, n y r si su función de probabilidad es:
donde:
- N: Tamaño de la población
- n: Tamaño de la muestra
- r: Número de elementos en la población con cierta característica
- X: Número de elementos en la muestra con esa característica
Notación:
Contexto: Muestreo sin reemplazo de una población finita.
Diferencia con Binomial:
- Binomial: Muestreo con reemplazo (probabilidad constante)
- Hipergeométrica: Muestreo sin reemplazo (probabilidad cambia)
6.2 Derivación de la Fórmula
Razonamiento combinatorio:
-
Total de maneras de seleccionar n elementos de N:
-
Maneras de seleccionar x elementos “exitosos” de los r disponibles:
-
Maneras de seleccionar n-x elementos “no exitosos” de los N-r disponibles:
Por el principio de conteo:
6.3 Ejemplo 5: Accidentes Laborales
Problema: En una gran empresa, el año pasado ocurrieron 7,000 accidentes, de los cuales 520 tuvieron resultado de muerte. Si se seleccionan 30 de estos accidentes de manera aleatoria, ¿cuál es la probabilidad de que entre ellos haya exactamente uno con resultado de muerte?
Solución
Identificación de parámetros:
- (total de accidentes)
- (accidentes con muerte)
- (tamaño de la muestra)
- = número de accidentes con muerte en la muestra
- Queremos calcular
Entonces
Cálculo:
Cálculo numérico (usando software):
Respuesta: La probabilidad de que haya exactamente un accidente con muerte en la muestra es aproximadamente 0.337 o 33.7%.
Aproximación Binomial
Cuando es grande y es pequeño (digamos < 0.05), la distribución Hipergeométrica puede aproximarse por una Binomial con parámetros y :
En este caso: , así que la aproximación sería buena.
7. Distribución de Poisson
7.1 Contexto y Motivación
La distribución de Poisson modela el número de eventos que ocurren en un intervalo continuo de tiempo o espacio, cuando:
- Los eventos ocurren de manera independiente
- La tasa de ocurrencia es constante
- No pueden ocurrir dos eventos simultáneamente
Ejemplos:
- Número de llamadas que llegan a un call center en una hora
- Número de accidentes laborales en una fábrica por mes
- Número de partículas emitidas por una sustancia radiactiva en un segundo
- Número de errores tipográficos en una página
7.2 Definición
Definición - Distribución de Poisson
X es una variable aleatoria con distribución de Poisson si toma valores en , y su función de probabilidad está dada por:
\frac{\lambda^x e^{-\lambda}}{x!} & \text{si } x \in \{0, 1, 2, ...\} \\ 0 & \text{si } x \notin \{0, 1, 2, ...\} \end{cases}$$ con $\lambda \in \mathbb{R}^+$.
Notación:
Parámetro:
- : tasa de ocurrencia de eventos por unidad de tiempo/espacio
7.3 Proceso de Poisson
Consideremos una variable aleatoria X que cuenta el número de eventos ocurridos en un intervalo de tiempo continuo de largo 1. Suponemos que:
- La tasa de ocurrencia de eventos por unidad de tiempo se mantiene constante ()
- No pueden ocurrir dos eventos exactamente en el mismo instante
Bajo estas condiciones, X sigue una distribución de Poisson con parámetro .
Generalización
Si X es el número de eventos en un intervalo de longitud t, entonces:
Es decir, el parámetro escala linealmente con la longitud del intervalo.
7.4 Esperanza y Varianza
Teorema - Momentos de Poisson
Si , entonces:
Propiedad única: Para Poisson, la esperanza y la varianza son iguales y ambas valen .
7.5 Ejemplo 6: Accidentes Laborales
Problema: En una gran empresa, se sabe que los accidentes laborales ocurren según un proceso de Poisson de tasa 7,300 accidentes al año. El trabajo de cada día se divide en turnos de 8 horas cada uno. ¿Cuál es la probabilidad de que durante el último turno hayan ocurrido no más de 2 accidentes?
Solución
Paso 1: Convertir la tasa a la unidad de tiempo apropiada
- Tasa anual: accidentes/año
- Duración de un turno: 8 horas
Primero, tasa por hora:
Luego, tasa en 8 horas:
Paso 2: Plantear el problema
Sea X = número de accidentes en un turno
Entonces
Queremos calcular
Paso 3: Calcular las probabilidades
Paso 4: Sumar
Respuesta: La probabilidad de que ocurran no más de 2 accidentes en el turno es aproximadamente 0.0382 o 3.82%.
Uso de Software
En la práctica, estos cálculos se realizan usando software estadístico (R, Python, Excel, etc.) que tienen funciones incorporadas para distribuciones de probabilidad.
7.6 Aproximación de Binomial por Poisson
Aproximación Binomial → Poisson
Cuando es grande, es pequeño, y es moderado, la distribución Binomial puede aproximarse por una Poisson:
Regla práctica: La aproximación es buena si , , y .
Ejemplo: Si y , entonces:
8. Resumen de Distribuciones
Tabla Comparativa de Distribuciones Discretas
Distribución Notación Valores Contexto Bernoulli Un ensayo éxito/fracaso Binomial # éxitos en n ensayos Geométrica # ensayos hasta 1er éxito Bin. Negativa # ensayos hasta r éxitos Hipergeom. Muestreo sin reemplazo Poisson # eventos en intervalo
🎯 Conceptos Clave para Repasar
Resumen de Conceptos
- Bernoulli: Un solo ensayo con dos resultados, parámetro p
- Binomial: Suma de n Bernoulli independientes, cuenta éxitos
- Geométrica: Ensayos hasta el primer éxito, “falta de memoria”
- Binomial Negativa: Ensayos hasta el r-ésimo éxito, generaliza Geométrica
- Hipergeométrica: Muestreo sin reemplazo, población finita
- Poisson: Eventos raros en tiempo/espacio continuo,
- Aproximaciones: Binomial → Poisson cuando n grande y p pequeño
- Hipergeométrica → Binomial cuando N grande y n/N pequeño
🚨 Errores Comunes
Error 1: Confundir cuándo usar cada distribución
- Incorrecto: Usar Binomial para muestreo sin reemplazo de población pequeña
- Correcto: Usar Hipergeométrica para muestreo sin reemplazo, Binomial para con reemplazo
Error 2: Olvidar las condiciones de independencia
- Incorrecto: Aplicar Binomial cuando los ensayos no son independientes
- Correcto: Verificar independencia antes de aplicar Binomial, Geométrica o Binomial Negativa
Error 3: Confundir la definición de "éxito"
- Incorrecto: Asumir que “éxito” es siempre algo positivo
- Correcto: “Éxito” es el evento de interés (puede ser negativo, como un defecto)
Error 4: Usar mal los parámetros de Geométrica
- Incorrecto: Pensar que Geométrica cuenta desde 0
- Correcto: En nuestra definición, Geométrica cuenta desde 1 (incluye el éxito)
Error 5: Olvidar convertir unidades en Poisson
- Incorrecto: Usar anual para calcular probabilidad en un día
- Correcto: Ajustar a la unidad de tiempo del problema:
📝 Ejercicios Propuestos
Ejercicios de Práctica
Binomial: Se lanza una moneda 10 veces. Sea X el número de caras. Calcule: a) b) c) y
Geométrica: La probabilidad de que una máquina produzca una pieza defectuosa es 0.1. a) ¿Cuál es la probabilidad de que la primera pieza defectuosa sea la quinta inspeccionada? b) ¿Cuántas piezas se espera inspeccionar hasta encontrar una defectuosa?
Binomial Negativa: Con la misma máquina del ejercicio anterior: a) ¿Cuál es la probabilidad de necesitar inspeccionar exactamente 20 piezas para encontrar 3 defectuosas? b) ¿Cuántas piezas se espera inspeccionar para encontrar 3 defectuosas?
Hipergeométrica: Un lote contiene 100 artículos, de los cuales 15 son defectuosos. Si se seleccionan 10 al azar sin reemplazo: a) ¿Cuál es la probabilidad de encontrar exactamente 2 defectuosos? b) ¿Cuál es el número esperado de defectuosos en la muestra?
Poisson: Las llamadas llegan a un call center a razón de 20 por hora. a) ¿Cuál es la probabilidad de que lleguen exactamente 5 llamadas en 15 minutos? b) ¿Cuál es la probabilidad de que no llegue ninguna llamada en 5 minutos?
Aproximaciones: a) Use Poisson para aproximar y calcule b) ¿Cuándo es apropiada esta aproximación?
📚 Referencias
Lectura Principal
- Introducción a la Estadística - Clase 7
- Clase7_Pizarra_2025-02.pdf
Ejercicios de Repaso
Enlaces Relacionados
- Clase-06-Variables-Aleatorias-Discretas - Clase anterior
- Clase-08-Variables-Continuas - Clase siguiente
- Distribucion-Binomial
- Distribucion-Poisson
- Proceso-Bernoulli
Sugerencia de Estudio
Memorice las condiciones de aplicación de cada distribución antes que las fórmulas. Muchos errores vienen de aplicar la distribución incorrecta. Haga una tabla resumen con: nombre, contexto, parámetros, E(X), Var(X). Practique identificando qué distribución usar en problemas verbales. Las fórmulas se pueden consultar, pero entender cuándo aplicar cada una es fundamental. Para Poisson, siempre verifique que las unidades de coincidan con el intervalo de interés.
✅ Checklist de Estudio
Lista de Verificación
- Entiendo Bernoulli como caso base de variables dicotómicas
- Sé identificar cuándo aplicar Binomial y puedo calcular probabilidades
- Comprendo que Binomial cuenta éxitos en n ensayos fijos
- Puedo usar las fórmulas y para Binomial
- Entiendo que Geométrica cuenta hasta el primer éxito
- Sé que para Geométrica
- Comprendo que Binomial Negativa generaliza Geométrica a r éxitos
- Sé distinguir cuándo usar Hipergeométrica vs Binomial (con/sin reemplazo)
- Entiendo el proceso de Poisson y puedo ajustar a diferentes unidades
- Sé que para Poisson,
- Puedo aplicar aproximaciones (Binomial → Poisson)
- Sé usar software para calcular probabilidades de estas distribuciones
🏷️ Tags
estadistica distribuciones-discretas bernoulli binomial geometrica binomial-negativa hipergeometrica poisson proceso-bernoulli aproximaciones clase-7 eyp1016