Clase 1: Introducción a la Estadística - The Lady Tasting Tea

📚 Introducción

Esta primera clase introduce los conceptos fundamentales del diseño experimental y el pensamiento estadístico a través de una historia fascinante que dio origen a la estadística moderna. Estudiaremos cómo Ronald Fisher revolucionó el método científico al proponer evaluar afirmaciones a través de evidencia cuantificable.

Objetivos de la Clase

Comprender la historia que dio origen al diseño experimental
Entender cómo evaluar afirmaciones mediante experimentos controlados
Aprender a calcular probabilidades en experimentos simples
Introducir los conceptos de hipótesis nula y alternativa
Comprender el concepto de significancia estadística

1. The Lady Tasting Tea

1.1 La Historia que Cambió la Ciencia

Contexto Histórico

Era una tarde de verano en Cambridge, Inglaterra, a finales de 1920. Un grupo de académicos y sus esposas se reunían para el té de la tarde en un jardín. Una de las señoras afirmó que “el té sabe diferente dependiendo de si la leche ha sido servida antes del té en la taza, o si el té ha sido servido antes que la leche”.

Ronald Aylmer Fisher (más tarde, Sir Fisher), uno de los fundadores de la estadística moderna, sugirió una idea revolucionaria: evaluar dicha afirmación a través de evidencia experimental.

Importancia Histórica

Este momento aparentemente trivial dio origen al diseño experimental moderno, una metodología que transformaría la ciencia del siglo XX.

2. Diseño del Experimento

2.1 Propuesta de Fisher

Diseño Experimental

Fisher propuso el siguiente experimento:

Preparación: Preparar 8 tazas de té con leche

En 4 tazas: el té se sirve primero (T)

En 4 tazas: la leche se sirve primero (L)

Presentación: Presentar las 8 tazas en orden aleatorio

Tarea: La señora debe identificar el orden de preparación de cada taza

Información previa: Se le informa que hay exactamente 4 tazas de cada tipo

2.2 Preguntas Clave del Experimento

Al diseñar este experimento, debemos responder:

¿Cuántos aciertos serán suficientes para convencernos de su habilidad?
¿Puede un total de coincidencias haber ocurrido por azar?
¿Cuál es la probabilidad de que ello ocurra por azar?

3. Modelamiento Probabilístico

3.1 Supuesto de Elección Aleatoria

Modelo Probabilístico

Hipótesis Nula: Si Lady T. toma la decisión sin conocimiento real, podemos modelar el problema como:

Tenemos 8 tazas totales

En 4 de ellas se ha vertido el té primero

Lady T. escoge aleatoriamente 4 tazas y declara que en ellas se vertió el té primero

Objetivo: Calcular la probabilidad de acertar las 4 tazas correctas por puro azar

3.2 Espacio Muestral

Definimos:

$Ω = todas las formas posibles de escoger 4 tazas de 8$

El tamaño del espacio muestral es:

$∣Ω∣ = (4 8) = \frac{8 !}{4 ! \cdot 4 !} = \frac{8 \cdot 7 \cdot 6 \cdot 5}{4 \cdot 3 \cdot 2 \cdot 1} = 70$

4. Cálculo de Probabilidades

4.1 Probabilidad de 8 Aciertos

Caso 1: Acertar las 8 Tazas

Pregunta: ¿Cuál es la probabilidad de acertar todas las tazas por puro azar?

Solución:

Total de formas de escoger 4 tazas de 8: $(4 8) = 70$

Formas de acertar exactamente las 4 correctas: 1

$P (8 aciertos por azar) = \frac{1}{70} = \frac{1}{( 4 8 )} \approx 0.014 = 1.4%$

Conclusión evidencia fuerte de que puede distinguir.

La probabilidad de acertar todas las tazas por puro azar es muy baja (1.4%). Si Lady T. acierta todas, tenemos

4.2 Probabilidad de 6 Aciertos

Caso 2: Acertar 6 Tazas (permitir 2 errores)

Pregunta: ¿Cuál es la probabilidad de acertar exactamente 6 tazas por azar?

Análisis: Si acierta exactamente 6 tazas, significa:

Acierta 3 de las 4 tazas “té primero”

Acierta 3 de las 4 tazas “leche primero”

Cálculo:

Formas de escoger 3 correctas de 4 tazas T: $(3 4) = 4$

Formas de escoger 1 incorrecta de 4 tazas L: $(1 4) = 4$

$P (6 aciertos) = \frac{( 3 4 ) \cdot ( 1 4 )}{( 4 8 )} = \frac{4 \cdot 4}{70} = \frac{16}{70} \approx 0.23 = 23%$

Conclusión

La probabilidad de acertar 6 tazas por azar es 23%, demasiado alta. No es evidencia suficiente de que puede distinguir.

4.3 Tabla de Probabilidades

Número de Aciertos	Probabilidad	Interpretación
8	1.4%	Evidencia muy fuerte
6	23%	Evidencia insuficiente
4	---	Puro azar

5. Conceptos Estadísticos Fundamentales

5.1 Hipótesis Nula y Alternativa

Definiciones

Hipótesis Nula ( $H_{0}$ ): Lady T. no puede distinguir entre las preparaciones (elección aleatoria)

Hipótesis Alternativa ( $H_{1}$ ): Lady T. sí puede distinguir entre las preparaciones

5.2 Significancia del Test

Nivel de Significancia

Fisher determinó que 8 coincidencias serían evidencia suficiente porque:

La probabilidad de ocurrir por azar es solo 1.4%

Estamos dispuestos a aceptar máximo un ~1.5% de probabilidad de error

Este umbral de decisión se llama nivel de significancia del test.

5.3 Región de Rechazo

Región de Rechazo de $H_0$

Decidimos rechazar la hipótesis nula (concluir que sí puede distinguir) si y solo si:

Acierta las 8 tazas

Esto corresponde a la región de rechazo de la hipótesis nula.

6. Principios del Diseño Experimental

6.1 Ideas Clave

Principios Fundamentales de Fisher

Definición de hipótesis: Hipótesis nula y alternativa claras

Diseño del experimento: Procedimiento controlado para dirimir entre ellas

Nivel de significancia: ¿Cuál es la máxima probabilidad de error que permitiremos?

Región de rechazo: Determinación de qué resultados se considerarán evidencia suficiente

Aleatorización: Presentación en orden aleatorio para evitar sesgos

6.2 ¿Qué Pasó en Realidad?

El Resultado del Experimento

¿Cuál fue el resultado real de este experimento en esa tarde de verano?

Lady T. acertó todas las 8 tazas, demostrando que efectivamente podía distinguir entre las dos preparaciones.

7. Aplicación Moderna: Experimento de Mascarillas

7.1 Contexto del Estudio

Estudio Científico Moderno

Título: “Un experimento de clusters aleatorizados de mascarillas de tela comparadas con mascarillas quirúrgicas en trabajadores de la salud”

Autores: MacIntyre, C.R. et al. (2015)

Objetivo: Comparar la eficacia de mascarillas de tela versus mascarillas quirúrgicas

7.2 Diseño del Experimento

Metodología

Diseño: 14 hospitales asignados aleatoriamente a tres grupos:

Grupo 1: Mascarillas de tela

Grupo 2: Mascarillas quirúrgicas

Grupo 3: Control

Duración: 4 semanas

Variables medidas (variables aleatorias):

Enfermedad respiratoria clínica

Enfermedad tipo influenza

Infección respiratoria viral (confirmada por laboratorio)

7.3 Resultados del Estudio

Resultados Principales

Tasas de infección más altas al utilizar mascarillas de tela

Tasa de enfermedad tipo influenza significativamente más alta en el grupo con mascarillas de tela

Riesgo relativo: 13 veces mayor comparado con mascarillas médicas

Intervalo de 95% de confianza para el riesgo relativo: [1.69, 100.007]

7.4 Conclusiones del Estudio

Implicaciones

El estudio determinó que:

Las mascarillas de tela no son recomendables para trabajadores de la salud

Posibles causas: retención de humedad, reutilización, poca capacidad de filtro

Se requiere más investigación para otros contextos

8. Resumen de Conceptos

Puntos Clave de la Clase

Diseño Experimental: La historia de Lady Tasting Tea dio origen al diseño experimental moderno

Probabilidad y Azar: Usamos probabilidades para evaluar si un resultado podría ocurrir por azar

Hipótesis Estadísticas:

$H_{0}$ : Hipótesis nula (no hay efecto)

$H_{1}$ : Hipótesis alternativa (sí hay efecto)

Significancia: Determinamos un umbral de probabilidad para rechazar $H_{0}$

Evidencia: Los resultados con baja probabilidad bajo $H_{0}$ constituyen evidencia para $H_{1}$

🎯 Conceptos Clave para Repasar

Diseño experimental: Metodología para evaluar afirmaciones científicas
Hipótesis nula: Supuesto de “no efecto” o “azar”
Nivel de significancia: Probabilidad máxima de error que aceptamos
Región de rechazo: Conjunto de resultados que nos llevan a rechazar $H_{0}$
Aleatorización: Presentación aleatoria para evitar sesgos
Combinatoria: Cálculo de $(k n)$ para determinar probabilidades

📖 Términos Importantes

🔗 Conexiones con Otras Clases

Clase 2: Clase-02-Experimentos-Aleatorios - Formalización de espacios muestrales
Clase 3: Clase-03-Técnicas-de-Conteo - Herramientas para calcular probabilidades
Clase 4: Clase-04-Probabilidad-Condicional - Refinamiento del análisis probabilístico

Sebastian's Notes

Explorador

1) Intro - The Lady Tasting Tea

Clase 1: Introducción a la Estadística - The Lady Tasting Tea

📚 Introducción

Objetivos de la Clase

1. The Lady Tasting Tea

1.1 La Historia que Cambió la Ciencia

2. Diseño del Experimento

2.1 Propuesta de Fisher

2.2 Preguntas Clave del Experimento

3. Modelamiento Probabilístico

3.1 Supuesto de Elección Aleatoria

3.2 Espacio Muestral

4. Cálculo de Probabilidades

4.1 Probabilidad de 8 Aciertos

4.2 Probabilidad de 6 Aciertos

4.3 Tabla de Probabilidades

5. Conceptos Estadísticos Fundamentales

5.1 Hipótesis Nula y Alternativa

5.2 Significancia del Test

5.3 Región de Rechazo

6. Principios del Diseño Experimental

6.1 Ideas Clave

6.2 ¿Qué Pasó en Realidad?

7. Aplicación Moderna: Experimento de Mascarillas

7.1 Contexto del Estudio

7.2 Diseño del Experimento

7.3 Resultados del Estudio

7.4 Conclusiones del Estudio

8. Resumen de Conceptos

🎯 Conceptos Clave para Repasar

📖 Términos Importantes

🔗 Conexiones con Otras Clases

Vista Gráfica

Tabla de Contenidos

Retroenlaces