Clase 4: Probabilidad Condicional e Independencia
📚 Introducción
Esta clase introduce uno de los conceptos más profundos y útiles de la teoría de probabilidades: la probabilidad condicional. Aprenderemos cómo actualizar nuestras creencias probabilísticas cuando obtenemos nueva información, un concepto fundamental en estadística inferencial, aprendizaje automático y toma de decisiones.
Objetivos de la Clase
- Comprender el concepto de probabilidad condicional
- Aplicar el principio multiplicativo para probabilidades
- Definir y verificar independencia entre eventos
- Usar el Teorema de Probabilidad Total
- Aplicar el Teorema de Bayes
- Representar problemas mediante árboles de probabilidad
1. Motivación: El Problema de los Dos Dados
1.1 Situación Sin Información Adicional
Problema Inicial
Experimento: Lanzar dos veces un dado, registrando cada vez el número que muestra su cara superior.
Pregunta: ¿Cuál es la probabilidad de que la suma de las caras sea igual a 8?
Solución:
- Espacio muestral: con
- Evento: con
- Probabilidad:
1.2 Situación Con Información Adicional
Problema Con Condición
Nueva información: Se nos informa que el primer dado mostró un número par.
Pregunta: ¿Cuál es ahora la probabilidad de que la suma sea 8?
Análisis intuitivo:
Nuevo espacio reducido: Solo consideramos casos donde el primer dado es par con
Casos favorables dentro de : → 3 casos
Probabilidad condicional:
Observación Clave
La información adicional cambió la probabilidad de a . Este es el concepto de probabilidad condicional.
2. Definición Formal de Probabilidad Condicional
2.1 Definición
Definición - Probabilidad Condicional
La probabilidad condicional de un evento , dado que ha ocurrido un evento con , se define como:
Se lee: “probabilidad de dado ” o “probabilidad de condicionado en “
2.2 Interpretación
Interpretación Geométrica
- es la probabilidad de restringida al espacio
- Estamos “reduciendo” nuestro espacio muestral de a
- Solo consideramos los casos en que ocurrió
- De esos casos, calculamos qué proporción satisface

2.3 Verificación del Ejemplo
Verificación con la Definición Formal
Para el ejemplo de los dados:
- : suma es 8
- : primer dado es par
Cálculo directo:
Aplicando la definición: ✓
¡Coincide con nuestro cálculo intuitivo!
3. Propiedades de la Probabilidad Condicional
3.1 es una Medida de Probabilidad
Teorema - Probabilidad Condicional como Medida
Para cualquier evento con , la función definida en la σ-álgebra es una medida de probabilidad. Es decir, cumple:
No negatividad: para todo
Normalización:
σ-aditividad: Para eventos disjuntos :
3.2 Propiedades Derivadas
Propiedades de Probabilidad Condicional
Para todo evento con :
Acotación:
Complemento:
Vacío:
Inclusión-Exclusión:
4. Principio Multiplicativo para Probabilidades
4.1 Para Dos Eventos
Teorema - Regla del Producto (2 eventos)
De la definición de probabilidad condicional se desprende que:
(siempre que las probabilidades involucradas estén definidas)
4.2 Para Eventos
Teorema - Regla del Producto (General)
Para una colección de eventos :
Es decir:
5. Independencia de Eventos
5.1 Motivación Intuitiva
Pregunta Fundamental
¿Cuándo la ocurrencia de un evento no afecta la probabilidad de otro evento ?
Intuitivamente, cuando:
Es decir, saber que ocurrió no cambia nuestra creencia sobre .
5.2 Definición de Independencia
Definición - Eventos Independientes
Dos eventos y se dicen independientes si se cumple cualquiera de las siguientes condiciones equivalentes:
(cuando )
(cuando )
⭐ (definición estándar)
La tercera forma es la más útil y no requiere que las probabilidades sean positivas.
Notación
Escribimos para denotar que y son independientes.
5.3 Demostración de Equivalencia
Demostración de la Equivalencia
(1) ⇒ (3):
- Si
- Por definición de probabilidad condicional:
- Sustituyendo: ✓
(3) ⇒ (1):
- Si y
- Por definición:
- Sustituyendo: ✓
La equivalencia con (2) es análoga.
5.4 Ejemplo de Independencia
Ejercicio 5: Lanzamiento de Moneda
Experimento: Lanzar dos veces una moneda equilibrada
Eventos:
- : Se obtiene cara en el primer lanzamiento
- : Se obtiene cara en el segundo lanzamiento
- : Se obtiene solamente una cara en los dos lanzamientos
Espacio muestral: con probabilidades cada uno
Análisis de independencia:
- y :
- ¿Independientes? ✓
- SÍ son independientes
- y :
- ¿Independientes? ✓
- SÍ son independientes
- y :
- ¿Independientes? ✓
- SÍ son independientes
- , y mutuamente:
- NO son mutuamente independientes
Independencia de a Pares vs Mutua
Este ejemplo muestra que la independencia de a pares NO implica independencia mutua.
5.5 Independencia Mutua
Definición - Independencia Mutua
Los eventos se dicen mutuamente independientes si y solo si, para toda subcolección de tamaño , se cumple:
Esto requiere verificar ecuaciones para eventos.
6. Teorema de Probabilidad Total
6.1 Motivación: El Caso de Alicia
Ejemplo Motivador: Test Médico de Alicia
Situación: Alicia recibió un resultado positivo en un test para cierta enfermedad.
Información del test:
Sensibilidad (detecta enfermedad si la hay): 95%
Especificidad (indica negativo si no hay enfermedad): 90%
Por lo tanto:
Prevalencia (proporción de mujeres de su edad con la enfermedad): 0.1%
Pregunta inicial: ¿Cuál es la probabilidad de obtener un resultado positivo?
6.2 Análisis con Diagrama
Visualización del Problema
Definamos:
- : la persona está enferma
- : el test indica positivo
Queremos calcular
Observación clave: puede ocurrir de dos maneras disjuntas:
- Test positivo Y enferma:
- Test positivo Y no enferma:
Por lo tanto:
6.3 Partición del Espacio Muestral
Definición - Partición
Una colección de eventos forma una partición de si:
Son disjuntos dos a dos: para todo
Cubren todo :
Ejemplo de Partición
En el caso de Alicia:
- : está enferma
- : no está enferma
Claramente es una partición de .
6.4 Teorema de Probabilidad Total
Teorema - Probabilidad Total
Sea una partición de con para todo . Entonces, para cualquier evento :
Demostración:
- Como es partición:
- Por distributividad:
- Los eventos son disjuntos dos a dos
- Por σ-aditividad:
- Por regla del producto:
- Por lo tanto: □
6.5 Aplicación al Caso de Alicia
Solución: Probabilidad de Test Positivo
Datos:
Aplicando el teorema:
Interpretación: Aproximadamente el 10% de las mujeres de la edad de Alicia tendrán un test positivo.
7. Teorema de Bayes
7.1 La Pregunta Más Importante
Pregunta de Alicia
Contexto: Alicia ya sabe que su test fue positivo.
Pregunta crucial: ¿Cuál es la probabilidad de que realmente tenga la enfermedad, dado que el test fue positivo?
Es decir, queremos calcular:
Observación: Esto es el “reverso” de que conocemos.
7.2 Derivación del Teorema de Bayes
Derivación
Por definición de probabilidad condicional:
Por regla del producto:
Por el Teorema de Probabilidad Total:
Sustituyendo:
7.3 Teorema de Bayes
Teorema de Bayes
Sea una partición de con para todo . Entonces, para cualquier evento con :
para .
Nomenclatura Bayesiana
- : probabilidad a priori (antes de observar )
- : probabilidad a posteriori (después de observar )
- : verosimilitud (likelihood)
7.4 Solución del Caso de Alicia
¿Alicia Tiene la Enfermedad?
Datos previos:
- (calculado antes)
Aplicando Bayes:
Conclusión Sorprendente realmente tenga la enfermedad es menos del 1%.
A pesar de que el test fue positivo, la probabilidad de que Alicia
Razón: La enfermedad es muy rara (prevalencia 0.1%), por lo que hay muchos más falsos positivos que verdaderos positivos.
8. Representación con Árboles de Probabilidad
8.1 Árbol para el Caso de Alicia
Diagrama de Árbol
0.95 → A (test +) [Correcto] 0.001 ↗ E (enf.) ↘ 0.05 → A^c (test -) 0.10 → A (test +) [Falso +] 0.999 ↗ E^c (sana) ↘ 0.90 → A^c (test -)Probabilidades en las ramas finales:
8.2 Ventajas de los Árboles
Utilidad de los Árboles de Probabilidad
- Visualización clara de todos los escenarios posibles
- Cálculo directo de probabilidades conjuntas (multiplicando a lo largo de las ramas)
- Identificación fácil de particiones del espacio muestral
- Aplicación intuitiva del Teorema de Probabilidad Total (sumar ramas que terminan en el mismo evento)
9. Ejemplo Adicional: Red de Comunicación
9.1 Planteamiento del Problema
Ejercicio 8: Red con Transmisor, Módem y PC
Descripción: Una red consta de un transmisor, un módem y un PC.
Datos:
- Transmisor:
- Módem (recibe con error por interferencia):
- Módem → PC:
9.2 Árbol de Probabilidad
Diagrama Completo
0.98 → PC recibe 1 0.95 ↗ M recibe 1 ↘ 0.02 → PC recibe 0 0.56 T envía 1 ↗ 0.98 → PC recibe 1 0.05 M recibe 0 ↘ 0.02 → PC recibe 0 0.02 → PC recibe 1 0.09 ↗ M recibe 1 ↘ 0.98 → PC recibe 0 0.44 T envía 0 ↗ 0.06 → PC recibe 1 0.91 M recibe 0 ↘ 0.94 → PC recibe 0
9.3 Preguntas
a) Probabilidad de que el módem envíe un 0 al PC
Eventos:
- : módem envía 0 al PC
- : transmisor envía 0
- : transmisor envía 1
Solución (Teorema de Probabilidad Total):
Necesitamos calcular y :
Para :
- Si T envió 0, M recibe 0 con prob. 0.91 y luego envía 0 con prob. 0.94
- O M recibe 1 con prob. 0.09 y luego envía 0 con prob. 0.02
Para :
- Si T envió 1, M recibe 1 con prob. 0.95 y luego envía 0 con prob. 0.02
- O M recibe 0 con prob. 0.05 y luego envía 0 con prob. 0.94
Resultado final:
b) Dado que el módem envió 1, ¿cuál es la probabilidad de que el transmisor haya enviado 0?
Aplicar Teorema de Bayes:
Primero calculamos
Y
Resultado:
10. Resumen de Conceptos
Puntos Clave de la Clase
Probabilidad Condicional:
- Actualiza probabilidades con nueva información
Independencia:
- La ocurrencia de uno no afecta al otro
Regla del Producto:
Teorema de Probabilidad Total: Descompone usando una partición
Teorema de Bayes: Invierte condicionamiento
Árboles de Probabilidad: Herramienta visual para problemas complejos
🎯 Conceptos Clave para Repasar
- Probabilidad condicional como probabilidad en un espacio reducido
- Independencia y sus diferentes caracterizaciones
- Independencia de a pares vs independencia mutua
- Partición del espacio muestral
- Teorema de Bayes como inversión del condicionamiento
- Verosimilitud vs probabilidad a priori vs probabilidad a posteriori
📖 Términos Importantes
- Probabilidad-Condicional
- Independencia-de-Eventos
- Regla-del-Producto
- Partición-del-Espacio-Muestral
- Teorema-de-Probabilidad-Total
- Teorema-de-Bayes
- Árbol-de-Probabilidad
- Sensibilidad-y-Especificidad
🔗 Conexiones con Otras Clases
- Clase 2: Clase-02-Experimentos-Aleatorios - Espacios de probabilidad
- Clase 3: Clase-03-Técnicas-de-Conteo - Cálculo de probabilidades conjuntas
- Futuras clases: Inferencia estadística y aprendizaje bayesiano