Clase 1: Introducción a la Estadística - The Lady Tasting Tea
📚 Introducción
Esta primera clase introduce los conceptos fundamentales del diseño experimental y el pensamiento estadístico a través de una historia fascinante que dio origen a la estadística moderna. Estudiaremos cómo Ronald Fisher revolucionó el método científico al proponer evaluar afirmaciones a través de evidencia cuantificable.
Objetivos de la Clase
- Comprender la historia que dio origen al diseño experimental
- Entender cómo evaluar afirmaciones mediante experimentos controlados
- Aprender a calcular probabilidades en experimentos simples
- Introducir los conceptos de hipótesis nula y alternativa
- Comprender el concepto de significancia estadística
1. The Lady Tasting Tea
1.1 La Historia que Cambió la Ciencia
Contexto Histórico
Era una tarde de verano en Cambridge, Inglaterra, a finales de 1920. Un grupo de académicos y sus esposas se reunían para el té de la tarde en un jardín. Una de las señoras afirmó que “el té sabe diferente dependiendo de si la leche ha sido servida antes del té en la taza, o si el té ha sido servido antes que la leche”.
Ronald Aylmer Fisher (más tarde, Sir Fisher), uno de los fundadores de la estadística moderna, sugirió una idea revolucionaria: evaluar dicha afirmación a través de evidencia experimental.

Importancia Histórica
Este momento aparentemente trivial dio origen al diseño experimental moderno, una metodología que transformaría la ciencia del siglo XX.
2. Diseño del Experimento
2.1 Propuesta de Fisher
Diseño Experimental
Fisher propuso el siguiente experimento:
Preparación: Preparar 8 tazas de té con leche
- En 4 tazas: el té se sirve primero (T)
- En 4 tazas: la leche se sirve primero (L)
Presentación: Presentar las 8 tazas en orden aleatorio
Tarea: La señora debe identificar el orden de preparación de cada taza
Información previa: Se le informa que hay exactamente 4 tazas de cada tipo
2.2 Preguntas Clave del Experimento
Al diseñar este experimento, debemos responder:
- ¿Cuántos aciertos serán suficientes para convencernos de su habilidad?
- ¿Puede un total de coincidencias haber ocurrido por azar?
- ¿Cuál es la probabilidad de que ello ocurra por azar?
3. Modelamiento Probabilístico
3.1 Supuesto de Elección Aleatoria
Modelo Probabilístico
Hipótesis Nula: Si Lady T. toma la decisión sin conocimiento real, podemos modelar el problema como:
- Tenemos 8 tazas totales
- En 4 de ellas se ha vertido el té primero
- Lady T. escoge aleatoriamente 4 tazas y declara que en ellas se vertió el té primero
- Objetivo: Calcular la probabilidad de acertar las 4 tazas correctas por puro azar
3.2 Espacio Muestral
Definimos:
El tamaño del espacio muestral es:
4. Cálculo de Probabilidades
4.1 Probabilidad de 8 Aciertos
Caso 1: Acertar las 8 Tazas
Pregunta: ¿Cuál es la probabilidad de acertar todas las tazas por puro azar?
Solución:
- Total de formas de escoger 4 tazas de 8:
- Formas de acertar exactamente las 4 correctas: 1
Conclusión evidencia fuerte de que puede distinguir.
La probabilidad de acertar todas las tazas por puro azar es muy baja (1.4%). Si Lady T. acierta todas, tenemos
4.2 Probabilidad de 6 Aciertos
Caso 2: Acertar 6 Tazas (permitir 2 errores)
Pregunta: ¿Cuál es la probabilidad de acertar exactamente 6 tazas por azar?
Análisis: Si acierta exactamente 6 tazas, significa:
- Acierta 3 de las 4 tazas “té primero”
- Acierta 3 de las 4 tazas “leche primero”
Cálculo:
- Formas de escoger 3 correctas de 4 tazas T:
- Formas de escoger 1 incorrecta de 4 tazas L:
Conclusión
La probabilidad de acertar 6 tazas por azar es 23%, demasiado alta. No es evidencia suficiente de que puede distinguir.
4.3 Tabla de Probabilidades
| Número de Aciertos | Probabilidad | Interpretación |
|---|---|---|
| 8 | 1.4% | Evidencia muy fuerte |
| 6 | 23% | Evidencia insuficiente |
| 4 | --- | Puro azar |
5. Conceptos Estadísticos Fundamentales
5.1 Hipótesis Nula y Alternativa
Definiciones
Hipótesis Nula (): Lady T. no puede distinguir entre las preparaciones (elección aleatoria)
Hipótesis Alternativa (): Lady T. sí puede distinguir entre las preparaciones
5.2 Significancia del Test
Nivel de Significancia
Fisher determinó que 8 coincidencias serían evidencia suficiente porque:
- La probabilidad de ocurrir por azar es solo 1.4%
- Estamos dispuestos a aceptar máximo un ~1.5% de probabilidad de error
Este umbral de decisión se llama nivel de significancia del test.
5.3 Región de Rechazo
Región de Rechazo de
H_0Decidimos rechazar la hipótesis nula (concluir que sí puede distinguir) si y solo si:
- Acierta las 8 tazas
Esto corresponde a la región de rechazo de la hipótesis nula.
6. Principios del Diseño Experimental
6.1 Ideas Clave
Principios Fundamentales de Fisher
- Definición de hipótesis: Hipótesis nula y alternativa claras
- Diseño del experimento: Procedimiento controlado para dirimir entre ellas
- Nivel de significancia: ¿Cuál es la máxima probabilidad de error que permitiremos?
- Región de rechazo: Determinación de qué resultados se considerarán evidencia suficiente
- Aleatorización: Presentación en orden aleatorio para evitar sesgos
6.2 ¿Qué Pasó en Realidad?
El Resultado del Experimento
¿Cuál fue el resultado real de este experimento en esa tarde de verano?
Lady T. acertó todas las 8 tazas, demostrando que efectivamente podía distinguir entre las dos preparaciones.
7. Aplicación Moderna: Experimento de Mascarillas
7.1 Contexto del Estudio
Estudio Científico Moderno
Título: “Un experimento de clusters aleatorizados de mascarillas de tela comparadas con mascarillas quirúrgicas en trabajadores de la salud”
Autores: MacIntyre, C.R. et al. (2015)
Objetivo: Comparar la eficacia de mascarillas de tela versus mascarillas quirúrgicas
7.2 Diseño del Experimento
Metodología
Diseño: 14 hospitales asignados aleatoriamente a tres grupos:
- Grupo 1: Mascarillas de tela
- Grupo 2: Mascarillas quirúrgicas
- Grupo 3: Control
Duración: 4 semanas
Variables medidas (variables aleatorias):
- Enfermedad respiratoria clínica
- Enfermedad tipo influenza
- Infección respiratoria viral (confirmada por laboratorio)
7.3 Resultados del Estudio
Resultados Principales
- Tasas de infección más altas al utilizar mascarillas de tela
- Tasa de enfermedad tipo influenza significativamente más alta en el grupo con mascarillas de tela
- Riesgo relativo: 13 veces mayor comparado con mascarillas médicas
- Intervalo de 95% de confianza para el riesgo relativo: [1.69, 100.007]
7.4 Conclusiones del Estudio
Implicaciones
El estudio determinó que:
- Las mascarillas de tela no son recomendables para trabajadores de la salud
- Posibles causas: retención de humedad, reutilización, poca capacidad de filtro
- Se requiere más investigación para otros contextos
8. Resumen de Conceptos
Puntos Clave de la Clase
Diseño Experimental: La historia de Lady Tasting Tea dio origen al diseño experimental moderno
Probabilidad y Azar: Usamos probabilidades para evaluar si un resultado podría ocurrir por azar
Hipótesis Estadísticas:
- : Hipótesis nula (no hay efecto)
- : Hipótesis alternativa (sí hay efecto)
Significancia: Determinamos un umbral de probabilidad para rechazar
Evidencia: Los resultados con baja probabilidad bajo constituyen evidencia para
🎯 Conceptos Clave para Repasar
- Diseño experimental: Metodología para evaluar afirmaciones científicas
- Hipótesis nula: Supuesto de “no efecto” o “azar”
- Nivel de significancia: Probabilidad máxima de error que aceptamos
- Región de rechazo: Conjunto de resultados que nos llevan a rechazar
- Aleatorización: Presentación aleatoria para evitar sesgos
- Combinatoria: Cálculo de para determinar probabilidades
📖 Términos Importantes
- Diseño-Experimental
- Hipótesis-Nula
- Hipótesis-Alternativa
- Nivel-de-Significancia
- Test-Estadístico
- Región-de-Rechazo
- Aleatorización
- Coeficiente-Binomial
🔗 Conexiones con Otras Clases
- Clase 2: Clase-02-Experimentos-Aleatorios - Formalización de espacios muestrales
- Clase 3: Clase-03-Técnicas-de-Conteo - Herramientas para calcular probabilidades
- Clase 4: Clase-04-Probabilidad-Condicional - Refinamiento del análisis probabilístico