Clase 1: Introducción a la Estadística - The Lady Tasting Tea

📚 Introducción

Esta primera clase introduce los conceptos fundamentales del diseño experimental y el pensamiento estadístico a través de una historia fascinante que dio origen a la estadística moderna. Estudiaremos cómo Ronald Fisher revolucionó el método científico al proponer evaluar afirmaciones a través de evidencia cuantificable.

Objetivos de la Clase

  • Comprender la historia que dio origen al diseño experimental
  • Entender cómo evaluar afirmaciones mediante experimentos controlados
  • Aprender a calcular probabilidades en experimentos simples
  • Introducir los conceptos de hipótesis nula y alternativa
  • Comprender el concepto de significancia estadística

1. The Lady Tasting Tea

1.1 La Historia que Cambió la Ciencia

Contexto Histórico

Era una tarde de verano en Cambridge, Inglaterra, a finales de 1920. Un grupo de académicos y sus esposas se reunían para el té de la tarde en un jardín. Una de las señoras afirmó que “el té sabe diferente dependiendo de si la leche ha sido servida antes del té en la taza, o si el té ha sido servido antes que la leche”.

Ronald Aylmer Fisher (más tarde, Sir Fisher), uno de los fundadores de la estadística moderna, sugirió una idea revolucionaria: evaluar dicha afirmación a través de evidencia experimental.

Importancia Histórica

Este momento aparentemente trivial dio origen al diseño experimental moderno, una metodología que transformaría la ciencia del siglo XX.


2. Diseño del Experimento

2.1 Propuesta de Fisher

Diseño Experimental

Fisher propuso el siguiente experimento:

  1. Preparación: Preparar 8 tazas de té con leche

    • En 4 tazas: el té se sirve primero (T)
    • En 4 tazas: la leche se sirve primero (L)
  2. Presentación: Presentar las 8 tazas en orden aleatorio

  3. Tarea: La señora debe identificar el orden de preparación de cada taza

  4. Información previa: Se le informa que hay exactamente 4 tazas de cada tipo

2.2 Preguntas Clave del Experimento

Al diseñar este experimento, debemos responder:

  1. ¿Cuántos aciertos serán suficientes para convencernos de su habilidad?
  2. ¿Puede un total de coincidencias haber ocurrido por azar?
  3. ¿Cuál es la probabilidad de que ello ocurra por azar?

3. Modelamiento Probabilístico

3.1 Supuesto de Elección Aleatoria

Modelo Probabilístico

Hipótesis Nula: Si Lady T. toma la decisión sin conocimiento real, podemos modelar el problema como:

  • Tenemos 8 tazas totales
  • En 4 de ellas se ha vertido el té primero
  • Lady T. escoge aleatoriamente 4 tazas y declara que en ellas se vertió el té primero
  • Objetivo: Calcular la probabilidad de acertar las 4 tazas correctas por puro azar

3.2 Espacio Muestral

Definimos:

El tamaño del espacio muestral es:


4. Cálculo de Probabilidades

4.1 Probabilidad de 8 Aciertos

Caso 1: Acertar las 8 Tazas

Pregunta: ¿Cuál es la probabilidad de acertar todas las tazas por puro azar?

Solución:

  • Total de formas de escoger 4 tazas de 8:
  • Formas de acertar exactamente las 4 correctas: 1

Conclusión evidencia fuerte de que puede distinguir.

La probabilidad de acertar todas las tazas por puro azar es muy baja (1.4%). Si Lady T. acierta todas, tenemos

4.2 Probabilidad de 6 Aciertos

Caso 2: Acertar 6 Tazas (permitir 2 errores)

Pregunta: ¿Cuál es la probabilidad de acertar exactamente 6 tazas por azar?

Análisis: Si acierta exactamente 6 tazas, significa:

  • Acierta 3 de las 4 tazas “té primero”
  • Acierta 3 de las 4 tazas “leche primero”

Cálculo:

  • Formas de escoger 3 correctas de 4 tazas T:
  • Formas de escoger 1 incorrecta de 4 tazas L:

Conclusión

La probabilidad de acertar 6 tazas por azar es 23%, demasiado alta. No es evidencia suficiente de que puede distinguir.

4.3 Tabla de Probabilidades

Número de AciertosProbabilidadInterpretación
81.4%Evidencia muy fuerte
623%Evidencia insuficiente
4---Puro azar

5. Conceptos Estadísticos Fundamentales

5.1 Hipótesis Nula y Alternativa

Definiciones

Hipótesis Nula (): Lady T. no puede distinguir entre las preparaciones (elección aleatoria)

Hipótesis Alternativa (): Lady T. sí puede distinguir entre las preparaciones

5.2 Significancia del Test

Nivel de Significancia

Fisher determinó que 8 coincidencias serían evidencia suficiente porque:

  • La probabilidad de ocurrir por azar es solo 1.4%
  • Estamos dispuestos a aceptar máximo un ~1.5% de probabilidad de error

Este umbral de decisión se llama nivel de significancia del test.

5.3 Región de Rechazo

Región de Rechazo de H_0

Decidimos rechazar la hipótesis nula (concluir que sí puede distinguir) si y solo si:

  • Acierta las 8 tazas

Esto corresponde a la región de rechazo de la hipótesis nula.


6. Principios del Diseño Experimental

6.1 Ideas Clave

Principios Fundamentales de Fisher

  1. Definición de hipótesis: Hipótesis nula y alternativa claras
  2. Diseño del experimento: Procedimiento controlado para dirimir entre ellas
  3. Nivel de significancia: ¿Cuál es la máxima probabilidad de error que permitiremos?
  4. Región de rechazo: Determinación de qué resultados se considerarán evidencia suficiente
  5. Aleatorización: Presentación en orden aleatorio para evitar sesgos

6.2 ¿Qué Pasó en Realidad?

El Resultado del Experimento

¿Cuál fue el resultado real de este experimento en esa tarde de verano?

Lady T. acertó todas las 8 tazas, demostrando que efectivamente podía distinguir entre las dos preparaciones.


7. Aplicación Moderna: Experimento de Mascarillas

7.1 Contexto del Estudio

Estudio Científico Moderno

Título: “Un experimento de clusters aleatorizados de mascarillas de tela comparadas con mascarillas quirúrgicas en trabajadores de la salud”

Autores: MacIntyre, C.R. et al. (2015)

Objetivo: Comparar la eficacia de mascarillas de tela versus mascarillas quirúrgicas

7.2 Diseño del Experimento

Metodología

Diseño: 14 hospitales asignados aleatoriamente a tres grupos:

  • Grupo 1: Mascarillas de tela
  • Grupo 2: Mascarillas quirúrgicas
  • Grupo 3: Control

Duración: 4 semanas

Variables medidas (variables aleatorias):

  1. Enfermedad respiratoria clínica
  2. Enfermedad tipo influenza
  3. Infección respiratoria viral (confirmada por laboratorio)

7.3 Resultados del Estudio

Resultados Principales

  1. Tasas de infección más altas al utilizar mascarillas de tela
  2. Tasa de enfermedad tipo influenza significativamente más alta en el grupo con mascarillas de tela
  3. Riesgo relativo: 13 veces mayor comparado con mascarillas médicas
  4. Intervalo de 95% de confianza para el riesgo relativo: [1.69, 100.007]

7.4 Conclusiones del Estudio

Implicaciones

El estudio determinó que:

  • Las mascarillas de tela no son recomendables para trabajadores de la salud
  • Posibles causas: retención de humedad, reutilización, poca capacidad de filtro
  • Se requiere más investigación para otros contextos

8. Resumen de Conceptos

Puntos Clave de la Clase

  1. Diseño Experimental: La historia de Lady Tasting Tea dio origen al diseño experimental moderno

  2. Probabilidad y Azar: Usamos probabilidades para evaluar si un resultado podría ocurrir por azar

  3. Hipótesis Estadísticas:

    • : Hipótesis nula (no hay efecto)
    • : Hipótesis alternativa (sí hay efecto)
  4. Significancia: Determinamos un umbral de probabilidad para rechazar

  5. Evidencia: Los resultados con baja probabilidad bajo constituyen evidencia para


🎯 Conceptos Clave para Repasar

  1. Diseño experimental: Metodología para evaluar afirmaciones científicas
  2. Hipótesis nula: Supuesto de “no efecto” o “azar”
  3. Nivel de significancia: Probabilidad máxima de error que aceptamos
  4. Región de rechazo: Conjunto de resultados que nos llevan a rechazar
  5. Aleatorización: Presentación aleatoria para evitar sesgos
  6. Combinatoria: Cálculo de para determinar probabilidades

📖 Términos Importantes


🔗 Conexiones con Otras Clases