Clase 7: Distribuciones de Probabilidad Discretas

📚 Introducción

En esta clase estudiaremos las distribuciones de probabilidad discretas más importantes y utilizadas en estadística. Estas distribuciones son modelos matemáticos que describen fenómenos aleatorios específicos que aparecen frecuentemente en la práctica. Cada distribución tiene su propio contexto de aplicación, función de probabilidad característica, y fórmulas para su esperanza y varianza. Dominar estas distribuciones es fundamental para el análisis estadístico aplicado.

Objetivos de la Clase

  • Comprender y aplicar la distribución Bernoulli
  • Entender el proceso Bernoulli como secuencia de ensayos independientes
  • Trabajar con la distribución Binomial: función de probabilidad, esperanza y varianza
  • Aplicar la distribución Geométrica para contar hasta el primer éxito
  • Utilizar la distribución Binomial Negativa para contar hasta el r-ésimo éxito
  • Aplicar la distribución Hipergeométrica para muestreo sin reemplazo
  • Comprender y usar la distribución de Poisson para eventos raros

1. Distribución Bernoulli

1.1 Definición y Contexto

Definición - Distribución Bernoulli

Una variable aleatoria X tiene distribución Bernoulli si solo tiene dos valores posibles: 0 y 1. La función de probabilidad de una variable aleatoria Bernoulli está dada por:

p^x (1-p)^{1-x} & \text{si } x \in \{0, 1\} \\ 0 & \text{si } x \notin \{0, 1\} \end{cases}$$ donde $p \in (0, 1)$ se denomina **parámetro** de la distribución.

Notación:

Interpretación:

  • representa un “éxito” (ocurre con probabilidad )
  • representa un “fracaso” (ocurre con probabilidad )

Contexto de aplicación:

  • Lanzamiento de una moneda (cara/sello)
  • Éxito/fracaso de un experimento
  • Sí/No en una encuesta
  • Defectuoso/No defectuoso en control de calidad

1.2 Esperanza de Bernoulli

Teorema - Esperanza de Bernoulli

Si , entonces:

Demostración:

1.3 Ejemplo 1: Esperanza de Bernoulli

Problema: Demuestre que si , entonces .

Solución

Ya demostrado arriba. La interpretación es que en promedio, la variable Bernoulli toma el valor p, que es precisamente la probabilidad de éxito.


2. Proceso Bernoulli

2.1 Definición

Definición - Proceso Bernoulli

Considere una secuencia infinita de variables aleatorias Bernoulli(p), tales que los eventos , son independientes. Esta secuencia se denomina proceso Bernoulli.

Notación: ,

donde “iid” significa “independientes e idénticamente distribuidas” (independent and identically distributed).

Interpretación: Es una secuencia de ensayos repetidos del mismo experimento, donde:

  • Cada ensayo tiene solo dos resultados posibles (éxito/fracaso)
  • La probabilidad de éxito es constante en todos los ensayos
  • Los ensayos son independientes entre sí

Ejemplos:

  • Lanzamientos repetidos de una moneda
  • Inspección secuencial de productos en una línea de producción
  • Preguntar a personas sucesivas su opinión (sí/no)

3. Distribución Binomial

3.1 Definición y Contexto

Definición - Distribución Binomial

Considere un proceso Bernoulli con . Sea , la variable que cuenta el número de éxitos en las primeras n realizaciones del proceso. Se dice que es una variable aleatoria con distribución Binomial con parámetros y .

Notación:

Parámetros:

  • : número de ensayos
  • : probabilidad de éxito en cada ensayo

Condiciones para aplicar Binomial:

  1. Número fijo de ensayos (n)
  2. Cada ensayo tiene solo dos resultados (éxito/fracaso)
  3. Probabilidad de éxito constante (p)
  4. Ensayos independientes

3.2 Función de Probabilidad

Teorema - Función de Probabilidad Binomial

Si , entonces:

\binom{n}{x} p^x (1-p)^{n-x} & \text{si } x \in \{0, 1, ..., n\} \\ 0 & \text{si } x \notin \{0, 1, ..., n\} \end{cases}$$ donde $\binom{n}{x} = \frac{n!}{x!(n-x)!}$ es el coeficiente binomial.

3.3 Ejemplo 2: Demostración de la Fórmula Binomial

Problema: Demuestre que si , entonces para .

Solución

Queremos calcular donde cuenta el número de éxitos.

Paso 1: Consideremos una secuencia específica con exactamente x éxitos. Por ejemplo, las primeras x variables son 1 y las restantes son 0:

La probabilidad de esta secuencia específica, por independencia, es:

Paso 2: ¿Cuántas secuencias diferentes tienen exactamente x éxitos?

Necesitamos elegir qué x posiciones (de las n totales) tendrán los éxitos. Esto se puede hacer de maneras diferentes.

Paso 3: Como todas las secuencias con x éxitos tienen la misma probabilidad , y hay de tales secuencias:

3.4 Esperanza y Varianza de la Binomial

Teorema - Momentos de la Binomial

Si , entonces:

3.5 Ejemplo 3: Demostración de Esperanza y Varianza

Problema: Demuestre que si , entonces y .

Solución

Demostración de E(X):

Como donde :

Por linealidad de la esperanza:

Demostración de Var(X):

Primero, para una Bernoulli:

Como los son independientes:

Propiedad Clave

La varianza de la suma de variables independientes es la suma de las varianzas. Esta propiedad se usó en la demostración anterior.


4. Distribución Geométrica

4.1 Definición y Contexto

Definición - Distribución Geométrica

Considere un proceso Bernoulli de parámetro . Sea X el número de ensayos Bernoulli hasta que se observa el primer éxito. Se dice que X sigue una distribución Geométrica de parámetro p, y su función de probabilidad está dada por:

p(1-p)^{x-1} & \text{si } x \in \{1, 2, 3, ...\} \\ 0 & \text{si } x \notin \{1, 2, 3, ...\} \end{cases}$$

Notación:

Interpretación: X cuenta cuántos ensayos necesitamos realizar hasta obtener el primer éxito.

Cuidado con Definiciones Alternativas

Algunos textos y paquetes computacionales definen una variable aleatoria Geométrica como aquella que cuenta el número de fracasos antes del primer éxito. En ese caso, X tomaría valores en y la fórmula sería .

Contexto de aplicación:

  • ¿Cuántas veces debo lanzar un dado hasta obtener un 6?
  • ¿Cuántos productos debo inspeccionar hasta encontrar uno defectuoso?
  • ¿Cuántas personas debo preguntar hasta encontrar una que apoye mi propuesta?

4.2 Derivación de la Fórmula

Razonamiento: Para que X = x (necesitemos x ensayos), debemos:

  • Tener x-1 fracasos seguidos: probabilidad
  • Seguido de un éxito en el ensayo x: probabilidad

Por independencia:

4.3 Esperanza y Varianza

Teorema - Momentos de la Geométrica

Si , entonces:

Interpretación de E(X): Si la probabilidad de éxito es p, en promedio necesitamos ensayos para obtener el primer éxito.

Ejemplo: Si (20% de éxito), entonces ensayos en promedio.


5. Distribución Binomial Negativa

5.1 Definición y Contexto

Definición - Distribución Binomial Negativa

Considere un proceso Bernoulli con parámetro . Sea X el número de ensayos hasta que ocurran los primeros r éxitos. Se dice que X sigue una distribución Binomial Negativa con parámetros , y su función de probabilidad está dada por:

\binom{x-1}{r-1} p^r (1-p)^{x-r} & \text{si } x \in \{r, r+1, r+2, ...\} \\ 0 & \text{si } x \notin \{r, r+1, r+2, ...\} \end{cases}$$

Notación:

Parámetros:

  • : número de éxitos deseados
  • : probabilidad de éxito en cada ensayo

Cuidado con Definiciones Alternativas

Algunos textos definen la Binomial Negativa como el número de fracasos antes del r-ésimo éxito. En ese caso, X tomaría valores en .

Relación con la Geométrica: La distribución Geométrica es un caso especial de la Binomial Negativa con :

5.2 Derivación de la Fórmula

Razonamiento: Para que X = x (necesitemos x ensayos para r éxitos):

  • En los primeros x-1 ensayos debe haber exactamente r-1 éxitos
  • El ensayo x debe ser un éxito (el r-ésimo)

5.3 Esperanza y Varianza

Teorema - Momentos de la Binomial Negativa

Si , entonces:

Interpretación: En promedio, necesitamos ensayos para obtener r éxitos.

5.4 Ejemplo 4: Aplicación de Binomial Negativa

Problema: Usted dejará de ir al estadio si su equipo pierde tres o más veces en el campeonato de apertura. Si la probabilidad que tiene su equipo de ganar un partido es constante e igual a 0.8, y los resultados de los diferentes partidos son independientes, ¿cuál es la probabilidad de que usted alcance a ir a 4 partidos?

Solución

Traducción del problema:

  • Dejamos de ir después de la tercera derrota
  • Queremos saber: ¿cuál es la probabilidad de ver exactamente 4 partidos?

Planteamiento:

  • Sea X = número de partidos hasta obtener 3 derrotas
  • “Éxito” = derrota del equipo, con probabilidad
  • Queremos que X = 4 (en 4 partidos ocurran las 3 derrotas)

Entonces

Cálculo:

Respuesta: La probabilidad de que alcance a ir a exactamente 4 partidos es 0.0192 o 1.92%.

Clave del Problema

Identificar qué es “éxito” en el contexto del problema. Aquí, el “éxito” es una derrota del equipo, no una victoria. Esto es contra-intuitivo pero correcto para aplicar la fórmula.


6. Distribución Hipergeométrica

6.1 Definición y Contexto

Definición - Distribución Hipergeométrica

Una variable aleatoria X tiene distribución Hipergeométrica con parámetros N, n y r si su función de probabilidad es:

donde:

  • N: Tamaño de la población
  • n: Tamaño de la muestra
  • r: Número de elementos en la población con cierta característica
  • X: Número de elementos en la muestra con esa característica

Notación:

Contexto: Muestreo sin reemplazo de una población finita.

Diferencia con Binomial:

  • Binomial: Muestreo con reemplazo (probabilidad constante)
  • Hipergeométrica: Muestreo sin reemplazo (probabilidad cambia)

6.2 Derivación de la Fórmula

Razonamiento combinatorio:

  • Total de maneras de seleccionar n elementos de N:

  • Maneras de seleccionar x elementos “exitosos” de los r disponibles:

  • Maneras de seleccionar n-x elementos “no exitosos” de los N-r disponibles:

Por el principio de conteo:

6.3 Ejemplo 5: Accidentes Laborales

Problema: En una gran empresa, el año pasado ocurrieron 7,000 accidentes, de los cuales 520 tuvieron resultado de muerte. Si se seleccionan 30 de estos accidentes de manera aleatoria, ¿cuál es la probabilidad de que entre ellos haya exactamente uno con resultado de muerte?

Solución

Identificación de parámetros:

  • (total de accidentes)
  • (accidentes con muerte)
  • (tamaño de la muestra)
  • = número de accidentes con muerte en la muestra
  • Queremos calcular

Entonces

Cálculo:

Cálculo numérico (usando software):

Respuesta: La probabilidad de que haya exactamente un accidente con muerte en la muestra es aproximadamente 0.337 o 33.7%.

Aproximación Binomial

Cuando es grande y es pequeño (digamos < 0.05), la distribución Hipergeométrica puede aproximarse por una Binomial con parámetros y :

En este caso: , así que la aproximación sería buena.


7. Distribución de Poisson

7.1 Contexto y Motivación

La distribución de Poisson modela el número de eventos que ocurren en un intervalo continuo de tiempo o espacio, cuando:

  • Los eventos ocurren de manera independiente
  • La tasa de ocurrencia es constante
  • No pueden ocurrir dos eventos simultáneamente

Ejemplos:

  • Número de llamadas que llegan a un call center en una hora
  • Número de accidentes laborales en una fábrica por mes
  • Número de partículas emitidas por una sustancia radiactiva en un segundo
  • Número de errores tipográficos en una página

7.2 Definición

Definición - Distribución de Poisson

X es una variable aleatoria con distribución de Poisson si toma valores en , y su función de probabilidad está dada por:

\frac{\lambda^x e^{-\lambda}}{x!} & \text{si } x \in \{0, 1, 2, ...\} \\ 0 & \text{si } x \notin \{0, 1, 2, ...\} \end{cases}$$ con $\lambda \in \mathbb{R}^+$.

Notación:

Parámetro:

  • : tasa de ocurrencia de eventos por unidad de tiempo/espacio

7.3 Proceso de Poisson

Consideremos una variable aleatoria X que cuenta el número de eventos ocurridos en un intervalo de tiempo continuo de largo 1. Suponemos que:

  1. La tasa de ocurrencia de eventos por unidad de tiempo se mantiene constante ()
  2. No pueden ocurrir dos eventos exactamente en el mismo instante

Bajo estas condiciones, X sigue una distribución de Poisson con parámetro .

Generalización

Si X es el número de eventos en un intervalo de longitud t, entonces:

Es decir, el parámetro escala linealmente con la longitud del intervalo.

7.4 Esperanza y Varianza

Teorema - Momentos de Poisson

Si , entonces:

Propiedad única: Para Poisson, la esperanza y la varianza son iguales y ambas valen .

7.5 Ejemplo 6: Accidentes Laborales

Problema: En una gran empresa, se sabe que los accidentes laborales ocurren según un proceso de Poisson de tasa 7,300 accidentes al año. El trabajo de cada día se divide en turnos de 8 horas cada uno. ¿Cuál es la probabilidad de que durante el último turno hayan ocurrido no más de 2 accidentes?

Solución

Paso 1: Convertir la tasa a la unidad de tiempo apropiada

  • Tasa anual: accidentes/año
  • Duración de un turno: 8 horas

Primero, tasa por hora:

Luego, tasa en 8 horas:

Paso 2: Plantear el problema

Sea X = número de accidentes en un turno

Entonces

Queremos calcular

Paso 3: Calcular las probabilidades

Paso 4: Sumar

Respuesta: La probabilidad de que ocurran no más de 2 accidentes en el turno es aproximadamente 0.0382 o 3.82%.

Uso de Software

En la práctica, estos cálculos se realizan usando software estadístico (R, Python, Excel, etc.) que tienen funciones incorporadas para distribuciones de probabilidad.

7.6 Aproximación de Binomial por Poisson

Aproximación Binomial → Poisson

Cuando es grande, es pequeño, y es moderado, la distribución Binomial puede aproximarse por una Poisson:

Regla práctica: La aproximación es buena si , , y .

Ejemplo: Si y , entonces:


8. Resumen de Distribuciones

Tabla Comparativa de Distribuciones Discretas

DistribuciónNotaciónValoresContexto
BernoulliUn ensayo éxito/fracaso
Binomial# éxitos en n ensayos
Geométrica# ensayos hasta 1er éxito
Bin. Negativa# ensayos hasta r éxitos
Hipergeom.Muestreo sin reemplazo
Poisson# eventos en intervalo

🎯 Conceptos Clave para Repasar

Resumen de Conceptos

  1. Bernoulli: Un solo ensayo con dos resultados, parámetro p
  2. Binomial: Suma de n Bernoulli independientes, cuenta éxitos
  3. Geométrica: Ensayos hasta el primer éxito, “falta de memoria”
  4. Binomial Negativa: Ensayos hasta el r-ésimo éxito, generaliza Geométrica
  5. Hipergeométrica: Muestreo sin reemplazo, población finita
  6. Poisson: Eventos raros en tiempo/espacio continuo,
  7. Aproximaciones: Binomial → Poisson cuando n grande y p pequeño
  8. Hipergeométrica → Binomial cuando N grande y n/N pequeño

🚨 Errores Comunes

Error 1: Confundir cuándo usar cada distribución

  • Incorrecto: Usar Binomial para muestreo sin reemplazo de población pequeña
  • Correcto: Usar Hipergeométrica para muestreo sin reemplazo, Binomial para con reemplazo

Error 2: Olvidar las condiciones de independencia

  • Incorrecto: Aplicar Binomial cuando los ensayos no son independientes
  • Correcto: Verificar independencia antes de aplicar Binomial, Geométrica o Binomial Negativa

Error 3: Confundir la definición de "éxito"

  • Incorrecto: Asumir que “éxito” es siempre algo positivo
  • Correcto: “Éxito” es el evento de interés (puede ser negativo, como un defecto)

Error 4: Usar mal los parámetros de Geométrica

  • Incorrecto: Pensar que Geométrica cuenta desde 0
  • Correcto: En nuestra definición, Geométrica cuenta desde 1 (incluye el éxito)

Error 5: Olvidar convertir unidades en Poisson

  • Incorrecto: Usar anual para calcular probabilidad en un día
  • Correcto: Ajustar a la unidad de tiempo del problema:

📝 Ejercicios Propuestos

Ejercicios de Práctica

  1. Binomial: Se lanza una moneda 10 veces. Sea X el número de caras. Calcule: a) b) c) y

  2. Geométrica: La probabilidad de que una máquina produzca una pieza defectuosa es 0.1. a) ¿Cuál es la probabilidad de que la primera pieza defectuosa sea la quinta inspeccionada? b) ¿Cuántas piezas se espera inspeccionar hasta encontrar una defectuosa?

  3. Binomial Negativa: Con la misma máquina del ejercicio anterior: a) ¿Cuál es la probabilidad de necesitar inspeccionar exactamente 20 piezas para encontrar 3 defectuosas? b) ¿Cuántas piezas se espera inspeccionar para encontrar 3 defectuosas?

  4. Hipergeométrica: Un lote contiene 100 artículos, de los cuales 15 son defectuosos. Si se seleccionan 10 al azar sin reemplazo: a) ¿Cuál es la probabilidad de encontrar exactamente 2 defectuosos? b) ¿Cuál es el número esperado de defectuosos en la muestra?

  5. Poisson: Las llamadas llegan a un call center a razón de 20 por hora. a) ¿Cuál es la probabilidad de que lleguen exactamente 5 llamadas en 15 minutos? b) ¿Cuál es la probabilidad de que no llegue ninguna llamada en 5 minutos?

  6. Aproximaciones: a) Use Poisson para aproximar y calcule b) ¿Cuándo es apropiada esta aproximación?


📚 Referencias

Lectura Principal

Ejercicios de Repaso

Enlaces Relacionados


Sugerencia de Estudio

Memorice las condiciones de aplicación de cada distribución antes que las fórmulas. Muchos errores vienen de aplicar la distribución incorrecta. Haga una tabla resumen con: nombre, contexto, parámetros, E(X), Var(X). Practique identificando qué distribución usar en problemas verbales. Las fórmulas se pueden consultar, pero entender cuándo aplicar cada una es fundamental. Para Poisson, siempre verifique que las unidades de coincidan con el intervalo de interés.


✅ Checklist de Estudio

Lista de Verificación

  • Entiendo Bernoulli como caso base de variables dicotómicas
  • Sé identificar cuándo aplicar Binomial y puedo calcular probabilidades
  • Comprendo que Binomial cuenta éxitos en n ensayos fijos
  • Puedo usar las fórmulas y para Binomial
  • Entiendo que Geométrica cuenta hasta el primer éxito
  • Sé que para Geométrica
  • Comprendo que Binomial Negativa generaliza Geométrica a r éxitos
  • Sé distinguir cuándo usar Hipergeométrica vs Binomial (con/sin reemplazo)
  • Entiendo el proceso de Poisson y puedo ajustar a diferentes unidades
  • Sé que para Poisson,
  • Puedo aplicar aproximaciones (Binomial → Poisson)
  • Sé usar software para calcular probabilidades de estas distribuciones

🏷️ Tags

estadistica distribuciones-discretas bernoulli binomial geometrica binomial-negativa hipergeometrica poisson proceso-bernoulli aproximaciones clase-7 eyp1016