Clase 4: Probabilidad Condicional e Independencia

📚 Introducción

Esta clase introduce uno de los conceptos más profundos y útiles de la teoría de probabilidades: la probabilidad condicional. Aprenderemos cómo actualizar nuestras creencias probabilísticas cuando obtenemos nueva información, un concepto fundamental en estadística inferencial, aprendizaje automático y toma de decisiones.

Objetivos de la Clase

  • Comprender el concepto de probabilidad condicional
  • Aplicar el principio multiplicativo para probabilidades
  • Definir y verificar independencia entre eventos
  • Usar el Teorema de Probabilidad Total
  • Aplicar el Teorema de Bayes
  • Representar problemas mediante árboles de probabilidad

1. Motivación: El Problema de los Dos Dados

1.1 Situación Sin Información Adicional

Problema Inicial

Experimento: Lanzar dos veces un dado, registrando cada vez el número que muestra su cara superior.

Pregunta: ¿Cuál es la probabilidad de que la suma de las caras sea igual a 8?

Solución:

  • Espacio muestral: con
  • Evento: con
  • Probabilidad:

1.2 Situación Con Información Adicional

Problema Con Condición

Nueva información: Se nos informa que el primer dado mostró un número par.

Pregunta: ¿Cuál es ahora la probabilidad de que la suma sea 8?

Análisis intuitivo:

  • Nuevo espacio reducido: Solo consideramos casos donde el primer dado es par con

  • Casos favorables dentro de : → 3 casos

  • Probabilidad condicional:

Observación Clave

La información adicional cambió la probabilidad de a . Este es el concepto de probabilidad condicional.


2. Definición Formal de Probabilidad Condicional

2.1 Definición

Definición - Probabilidad Condicional

La probabilidad condicional de un evento , dado que ha ocurrido un evento con , se define como:

Se lee: “probabilidad de dado ” o “probabilidad de condicionado en

2.2 Interpretación

Interpretación Geométrica

  • es la probabilidad de restringida al espacio
  • Estamos “reduciendo” nuestro espacio muestral de a
  • Solo consideramos los casos en que ocurrió
  • De esos casos, calculamos qué proporción satisface

2.3 Verificación del Ejemplo

Verificación con la Definición Formal

Para el ejemplo de los dados:

  • : suma es 8
  • : primer dado es par

Cálculo directo:

Aplicando la definición:

¡Coincide con nuestro cálculo intuitivo!


3. Propiedades de la Probabilidad Condicional

3.1 es una Medida de Probabilidad

Teorema - Probabilidad Condicional como Medida

Para cualquier evento con , la función definida en la σ-álgebra es una medida de probabilidad. Es decir, cumple:

  1. No negatividad: para todo

  2. Normalización:

  3. σ-aditividad: Para eventos disjuntos :

3.2 Propiedades Derivadas

Propiedades de Probabilidad Condicional

Para todo evento con :

  1. Acotación:

  2. Complemento:

  3. Vacío:

  4. Inclusión-Exclusión:


4. Principio Multiplicativo para Probabilidades

4.1 Para Dos Eventos

Teorema - Regla del Producto (2 eventos)

De la definición de probabilidad condicional se desprende que:

(siempre que las probabilidades involucradas estén definidas)

4.2 Para Eventos

Teorema - Regla del Producto (General)

Para una colección de eventos :

Es decir:


5. Independencia de Eventos

5.1 Motivación Intuitiva

Pregunta Fundamental

¿Cuándo la ocurrencia de un evento no afecta la probabilidad de otro evento ?

Intuitivamente, cuando:

Es decir, saber que ocurrió no cambia nuestra creencia sobre .

5.2 Definición de Independencia

Definición - Eventos Independientes

Dos eventos y se dicen independientes si se cumple cualquiera de las siguientes condiciones equivalentes:

  1. (cuando )

  2. (cuando )

  3. (definición estándar)

La tercera forma es la más útil y no requiere que las probabilidades sean positivas.

Notación

Escribimos para denotar que y son independientes.

5.3 Demostración de Equivalencia

Demostración de la Equivalencia

(1) ⇒ (3):

  • Si
  • Por definición de probabilidad condicional:
  • Sustituyendo:

(3) ⇒ (1):

  • Si y
  • Por definición:
  • Sustituyendo:

La equivalencia con (2) es análoga.

5.4 Ejemplo de Independencia

Ejercicio 5: Lanzamiento de Moneda

Experimento: Lanzar dos veces una moneda equilibrada

Eventos:

  • : Se obtiene cara en el primer lanzamiento
  • : Se obtiene cara en el segundo lanzamiento
  • : Se obtiene solamente una cara en los dos lanzamientos

Espacio muestral: con probabilidades cada uno

Análisis de independencia:

  1. y :
    • ¿Independientes?
    • SÍ son independientes
  2. y :
    • ¿Independientes?
    • SÍ son independientes
  3. y :
    • ¿Independientes?
    • SÍ son independientes
  4. , y mutuamente:
    • NO son mutuamente independientes

Independencia de a Pares vs Mutua

Este ejemplo muestra que la independencia de a pares NO implica independencia mutua.

5.5 Independencia Mutua

Definición - Independencia Mutua

Los eventos se dicen mutuamente independientes si y solo si, para toda subcolección de tamaño , se cumple:

Esto requiere verificar ecuaciones para eventos.


6. Teorema de Probabilidad Total

6.1 Motivación: El Caso de Alicia

Ejemplo Motivador: Test Médico de Alicia

Situación: Alicia recibió un resultado positivo en un test para cierta enfermedad.

Información del test:

  • Sensibilidad (detecta enfermedad si la hay): 95%

  • Especificidad (indica negativo si no hay enfermedad): 90%

    Por lo tanto:

  • Prevalencia (proporción de mujeres de su edad con la enfermedad): 0.1%

Pregunta inicial: ¿Cuál es la probabilidad de obtener un resultado positivo?

6.2 Análisis con Diagrama

Visualización del Problema

Definamos:

  • : la persona está enferma
  • : el test indica positivo

Queremos calcular

Observación clave: puede ocurrir de dos maneras disjuntas:

  1. Test positivo Y enferma:
  2. Test positivo Y no enferma:

Por lo tanto:

6.3 Partición del Espacio Muestral

Definición - Partición

Una colección de eventos forma una partición de si:

  1. Son disjuntos dos a dos: para todo

  2. Cubren todo :

Ejemplo de Partición

En el caso de Alicia:

  • : está enferma
  • : no está enferma

Claramente es una partición de .

6.4 Teorema de Probabilidad Total

Teorema - Probabilidad Total

Sea una partición de con para todo . Entonces, para cualquier evento :

Demostración:

  • Como es partición:
  • Por distributividad:
  • Los eventos son disjuntos dos a dos
  • Por σ-aditividad:
  • Por regla del producto:
  • Por lo tanto:

6.5 Aplicación al Caso de Alicia

Solución: Probabilidad de Test Positivo

Datos:

Aplicando el teorema:

Interpretación: Aproximadamente el 10% de las mujeres de la edad de Alicia tendrán un test positivo.


7. Teorema de Bayes

7.1 La Pregunta Más Importante

Pregunta de Alicia

Contexto: Alicia ya sabe que su test fue positivo.

Pregunta crucial: ¿Cuál es la probabilidad de que realmente tenga la enfermedad, dado que el test fue positivo?

Es decir, queremos calcular:

Observación: Esto es el “reverso” de que conocemos.

7.2 Derivación del Teorema de Bayes

Derivación

Por definición de probabilidad condicional:

Por regla del producto:

Por el Teorema de Probabilidad Total:

Sustituyendo:

7.3 Teorema de Bayes

Teorema de Bayes

Sea una partición de con para todo . Entonces, para cualquier evento con :

para .

Nomenclatura Bayesiana

  • : probabilidad a priori (antes de observar )
  • : probabilidad a posteriori (después de observar )
  • : verosimilitud (likelihood)

7.4 Solución del Caso de Alicia

¿Alicia Tiene la Enfermedad?

Datos previos:

  • (calculado antes)

Aplicando Bayes:

Conclusión Sorprendente realmente tenga la enfermedad es menos del 1%.

A pesar de que el test fue positivo, la probabilidad de que Alicia

Razón: La enfermedad es muy rara (prevalencia 0.1%), por lo que hay muchos más falsos positivos que verdaderos positivos.


8. Representación con Árboles de Probabilidad

8.1 Árbol para el Caso de Alicia

Diagrama de Árbol

                         0.95 → A  (test +)  [Correcto]
             0.001    ↗
           E (enf.)  
                     ↘  0.05 → A^c (test -)
                         
                         0.10 → A  (test +)  [Falso +]
             0.999    ↗
           E^c (sana) 
                     ↘  0.90 → A^c (test -)

Probabilidades en las ramas finales:

8.2 Ventajas de los Árboles

Utilidad de los Árboles de Probabilidad

  1. Visualización clara de todos los escenarios posibles
  2. Cálculo directo de probabilidades conjuntas (multiplicando a lo largo de las ramas)
  3. Identificación fácil de particiones del espacio muestral
  4. Aplicación intuitiva del Teorema de Probabilidad Total (sumar ramas que terminan en el mismo evento)

9. Ejemplo Adicional: Red de Comunicación

9.1 Planteamiento del Problema

Ejercicio 8: Red con Transmisor, Módem y PC

Descripción: Una red consta de un transmisor, un módem y un PC.

Datos:

  1. Transmisor:
  2. Módem (recibe con error por interferencia):
  3. Módem → PC:

9.2 Árbol de Probabilidad

Diagrama Completo

                                     0.98 → PC recibe 1
                         0.95 ↗  M recibe 1 
                              ↘     0.02 → PC recibe 0
           0.56    
      T envía 1
                              ↗     0.98 → PC recibe 1
                         0.05      M recibe 0
                              ↘     0.02 → PC recibe 0


                                     0.02 → PC recibe 1
                         0.09 ↗  M recibe 1
                              ↘     0.98 → PC recibe 0
           0.44    
      T envía 0
                              ↗     0.06 → PC recibe 1
                         0.91      M recibe 0
                              ↘     0.94 → PC recibe 0

9.3 Preguntas

a) Probabilidad de que el módem envíe un 0 al PC

Eventos:

  • : módem envía 0 al PC
  • : transmisor envía 0
  • : transmisor envía 1

Solución (Teorema de Probabilidad Total):

Necesitamos calcular y :

Para :

  • Si T envió 0, M recibe 0 con prob. 0.91 y luego envía 0 con prob. 0.94
  • O M recibe 1 con prob. 0.09 y luego envía 0 con prob. 0.02

Para :

  • Si T envió 1, M recibe 1 con prob. 0.95 y luego envía 0 con prob. 0.02
  • O M recibe 0 con prob. 0.05 y luego envía 0 con prob. 0.94

Resultado final:

b) Dado que el módem envió 1, ¿cuál es la probabilidad de que el transmisor haya enviado 0?

Aplicar Teorema de Bayes:

Primero calculamos

Y

Resultado:


10. Resumen de Conceptos

Puntos Clave de la Clase

  1. Probabilidad Condicional:

    • Actualiza probabilidades con nueva información
  2. Independencia:

    • La ocurrencia de uno no afecta al otro
  3. Regla del Producto:

  4. Teorema de Probabilidad Total: Descompone usando una partición

  5. Teorema de Bayes: Invierte condicionamiento

  6. Árboles de Probabilidad: Herramienta visual para problemas complejos


🎯 Conceptos Clave para Repasar

  1. Probabilidad condicional como probabilidad en un espacio reducido
  2. Independencia y sus diferentes caracterizaciones
  3. Independencia de a pares vs independencia mutua
  4. Partición del espacio muestral
  5. Teorema de Bayes como inversión del condicionamiento
  6. Verosimilitud vs probabilidad a priori vs probabilidad a posteriori

📖 Términos Importantes


🔗 Conexiones con Otras Clases