Clase 39: Aplicaciones a Modelos Lineales
📚 Introducción
Una tarea común en ciencia e ingeniería es analizar y entender relaciones entre diferentes cantidades que varían. Esta sección describe una variedad de situaciones en las que los datos se emplean para construir o comprobar una fórmula que predice el valor de una variable como función de otras variables. En cada caso, el reto será equivalente a resolver un problema de mínimos cuadrados.
Para facilitar la aplicación del análisis a problemas reales que encontrará en sus actividades profesionales, se elige la notación que comúnmente se utiliza en el análisis estadístico de datos científicos y de ingeniería. En vez de escribir Ax = b, se escribe Xβ = y, donde X es la matriz de diseño, β es el vector de parámetros y y es el vector de observaciones.
Objetivos de la Clase
- Comprender la formulación de la recta de regresión de mínimos cuadrados
- Dominar el cálculo de los coeficientes de regresión β₀ y β₁
- Aplicar la técnica de desviación media para simplificar cálculos
- Interpretar el significado de residuos y error de mínimos cuadrados
- Construir modelos lineales a partir de datos experimentales
- Entender las ecuaciones normales en el contexto de regresión
1. Rectas de Mínimos Cuadrados
1.1 Planteamiento del Problema
La relación más sencilla entre dos variables x y y es la ecuación lineal y = β₀ + β₁x.¹ Con frecuencia los datos experimentales generan los puntos (x₁, y₁),…, (xₙ, yₙ) que, cuando se grafican, parecen estar cerca de una recta. Se desea determinar los parámetros β₀ y β₁ para hacer que la recta esté lo más “cerca” posible de dichos puntos.
Visualización del Problema
Suponga que β₀ y β₁ están fijos, y considere la recta y = β₀ + β₁x de la figura 1. Para cada dato (xⱼ, yⱼ) existe un punto (xⱼ, β₀ + β₁xⱼ) sobre la recta con la misma coordenada x. Por otro lado, yⱼ es el valor observado de y, y β₀ + β₁xⱼ es el valor predicho para y (determinado por la recta). La diferencia entre los valores observado y predicho para y se llama residuo.
1.2 Definición de Residuo
Existen varias maneras de medir qué tan “cerca” está la recta respecto de los datos. La elección habitual (sobre todo porque los cálculos matemáticos son sencillos) es sumar los cuadrados de los residuos. La recta de mínimos cuadrados es la recta y = β₀ + β₁x que minimiza la suma de los cuadrados de los residuos.
Definición - Recta de Mínimos Cuadrados
La recta de regresión de mínimos cuadrados de y sobre x es la recta y = β₀ + β₁x que minimiza la suma de los cuadrados de los residuos. Los coeficientes β₀, β₁ de la recta son los coeficientes de regresión.
1.3 Formulación Matricial
Si los puntos de los datos estuvieran sobre una recta, los parámetros β₀ y β₁ satisfarían las ecuaciones:
Este sistema se puede representar como:
Conexión con Mínimos Cuadrados
Desde luego, si los puntos de datos no están sobre una recta, entonces no existen parámetros β₀, β₁ para los cuales los valores predichos de y en Xβ sean iguales a los valores observados de y en y, y Xβ = y no tiene solución. Este es un problema de mínimos cuadrados, Ax = b, ¡con diferente notación!
2. Solución mediante Ecuaciones Normales
2.1 Derivación de las Ecuaciones Normales
El cuadrado de la distancia entre los vectores Xβ y y es precisamente la suma de los cuadrados de los residuos. El β que minimiza esta suma también minimiza la distancia entre Xβ y y. Calcular la solución de mínimos cuadrados de Xβ = y equivale a encontrar el vector β que determina la recta de mínimos cuadrados de la figura 1.
Interpretación Geométrica
Calcular la solución de mínimos cuadrados de Xβ** = y equivale a encontrar el vector β que determina la recta de mínimos cuadrados de la figura 1**.
El β̂ que minimiza la suma de los cuadrados de los residuos también minimiza la distancia entre Xβ y y, y por lo tanto a toda W. La descomposición deseada de y es:
donde ŷ = Xβ̂ está en Col X y y - ŷ es ortogonal a Col X.
3. Ejemplo Resuelto Completo
3.1 Planteamiento
Ejemplo 1:
Encuentre la ecuación y = β₀ + β₁x de la recta de mínimos cuadrados que mejor se ajuste a los puntos de datos (2, 1), (5, 2), (7, 3) y (8, 3).
Solución:
Utilice las coordenadas x de los datos para construir la matriz de diseño X en la ecuación (1) y las coordenadas y para construir el vector de observaciones y:
3.2 Cálculo de las Ecuaciones Normales
Para la solución de mínimos cuadrados de Xβ = y, obtenga las ecuaciones normales (con la nueva notación):
Es decir, calcule:
Las ecuaciones normales son:
3.3 Solución del Sistema
Pueden utilizarse operaciones de fila para resolver este sistema, pero como XᵀX es de 2 × 2 e invertible, tal vez sea más rápido calcular:
y luego resolver XᵀXβ = Xᵀy como:
De manera que la recta de mínimos cuadrados tiene la ecuación:
Véase la figura 2.
4. Técnica de Desviación Media
4.1 Simplificación de Cálculos
Una práctica común, antes de calcular la recta de mínimos cuadrados, consiste en calcular el promedio x̄ de los valores x originales y formar una nueva variable x* = x - x̄. Se dice que los nuevos datos x quedan en su forma de desviación media. En este caso, las dos columnas de la matriz de diseño serán ortogonales. Se simplifica la solución de las ecuaciones normales, justo como en el ejemplo 4 de la sección 6.5. Véanse los ejercicios 17 y 18.
Ventaja de la Desviación Media
Cuando se usa la forma de desviación media, las columnas de la matriz de diseño X son ortogonales, lo que simplifica enormemente los cálculos de las ecuaciones normales. Esto es especialmente útil en cálculos manuales.
4.2 Ejemplo de Aplicación
Ejemplo de Desviación Media
Para los datos del Ejemplo 1, calcule:
Entonces la variable transformada es:
Los nuevos puntos serían:
- (2 - 5.5, 1) = (-3.5, 1)
- (5 - 5.5, 2) = (-0.5, 2)
- (7 - 5.5, 3) = (1.5, 3)
- (8 - 5.5, 3) = (2.5, 3)
Con estos datos, la matriz de diseño tendría columnas ortogonales, simplificando los cálculos.
5. Residuos y Error de Mínimos Cuadrados
5.1 Cálculo del Error
Ejemplo 2: Para los datos del Ejemplo 1, calcule los residuos y el error de mínimos cuadrados.
Solución:
Los valores predichos usando la recta y = (2/7) + (5/14)x son:
Para x = 2: ŷ₁ = 2/7 + (5/14)(2) = 2/7 + 10/14 = 4/7 + 10/14 = 18/14 ≈ 1.29 Para x = 5: ŷ₂ = 2/7 + (5/14)(5) = 2/7 + 25/14 = 4/14 + 25/14 = 29/14 ≈ 2.07 Para x = 7: ŷ₃ = 2/7 + (5/14)(7) = 2/7 + 35/14 = 4/14 + 35/14 = 39/14 ≈ 2.79 Para x = 8: ŷ₄ = 2/7 + (5/14)(8) = 2/7 + 40/14 = 4/14 + 40/14 = 44/14 ≈ 3.14
Los residuos son:
El error de mínimos cuadrados es:
6. Extensión a Modelos Más Generales
6.1 Ajuste de Polinomios
El análisis precedente para ajustar una recta a los datos puede extenderse fácilmente al problema de ajustar un polinomio de grado mayor a los datos. Por ejemplo, para ajustar un cuadrático y = β₀ + β₁x + β₂x² a puntos (x₁, y₁),…, (xₙ, yₙ), se construye la matriz de diseño:
y se resuelve el problema de mínimos cuadrados Xβ = y usando las ecuaciones normales.
6.2 Regresión Múltiple
Más generalmente, se pueden ajustar modelos de la forma:
donde y depende de múltiples variables x₁, x₂,…, xₖ. Esto se conoce como regresión lineal múltiple y también se resuelve mediante mínimos cuadrados con las ecuaciones normales XᵀXβ = Xᵀy.
🎯 Conceptos Clave para Repasar
Resumen de Conceptos
- Recta de Regresión: y = β₀ + β₁x que minimiza suma de cuadrados de residuos
- Residuo: Diferencia entre valor observado y predicho: yⱼ - (β₀ + β₁xⱼ)
- Matriz de Diseño: X con columnas [1, x₁,…, xₙ]ᵀ para rectas
- Vector de Parámetros: β = [β₀, β₁]ᵀ contiene coeficientes de regresión
- Ecuaciones Normales: XᵀXβ̂ = Xᵀy determina coeficientes óptimos
- Desviación Media: x* = x - x̄ ortogonaliza columnas de X
- Error de Mínimos Cuadrados: ||y - Xβ̂|| mide bondad del ajuste
- Extensibilidad: El método funciona para polinomios y regresión múltiple
🚨 Errores Comunes
Error 1: Confundir columnas de la matriz de diseño
- Incorrecto: Poner valores de y en la matriz X
- Correcto: X tiene una columna de unos (para β₀) y columna de valores x (para β₁)
Error 2: No calcular el promedio correctamente para desviación media
- Problema: x̄ = (x₁ + x₂ + … + xₙ)/n, no olvidar dividir por n
- Consecuencia: Si x̄ es incorrecto, la ortogonalidad no se logra
Error 3: Usar valores predichos en lugar de observados
- Incorrecto: Residuo = β₀ + β₁xⱼ - yⱼ
- Correcto: Residuo = yⱼ - (β₀ + β₁xⱼ)
Error 4: Olvidar la columna de unos en X
- Problema: Si X solo tiene [x₁,…, xₙ]ᵀ, no se puede calcular β₀
- Solución: La primera columna de X debe ser [1, 1,…, 1]ᵀ
Error 5: Pensar que la recta pasa exactamente por los puntos
- Realidad: La recta de mínimos cuadrados minimiza distancias, generalmente no pasa exactamente por ningún punto
- Excepción: Solo si todos los puntos ya están alineados
📝 Ejercicios Propuestos
Ejercicios Nivel Básico (1-8)
Cálculo de rectas de mínimos cuadrados
- Para conjuntos pequeños de datos (3-4 puntos), construya la matriz X y el vector y
- Calcule XᵀX y Xᵀy
- Resuelva las ecuaciones normales para encontrar β̂
- Escriba la ecuación de la recta de mínimos cuadrados
- Grafique los datos y la recta
Ejercicios Nivel Intermedio (9-18)
Desviación media y análisis de residuos
- Calcule el promedio x̄ y transforme los datos a forma de desviación media
- Verifique que las columnas de X son ortogonales en forma de desviación media
- Compare la eficiencia de cálculo con y sin desviación media
- Calcule residuos y error de mínimos cuadrados
- Interprete el significado del error en el contexto del problema
Ejercicios Nivel Avanzado (19-25)
Extensiones y aplicaciones
- Ajuste polinomios cuadráticos y = β₀ + β₁x + β₂x² a datos
- Implemente regresión lineal múltiple con 2-3 variables predictoras
- Compare diferentes modelos usando el error de mínimos cuadrados
- Analice la validez de supuestos en modelos de regresión
📚 Referencias
Lectura Principal
- Sección 6.6: Aplicaciones a modelos lineales, págs. 368-370
Enlaces Relacionados
- 38) Problemas de Mínimos Cuadrados - Teoría general
- 36) Proyecciones Ortogonales - Fundamento geométrico
- Recta-Regresion
- Ecuaciones-Normales
- Regresion-Lineal
- Desviacion-Media
Aplicaciones Prácticas
Campos de Aplicación
Estadística: Análisis de regresión, inferencia estadística, intervalos de confianza
Ingeniería: Ajuste de modelos experimentales, calibración de sensores, análisis de datos
Economía: Modelos econométricos, predicción de series temporales
Ciencias Naturales: Ajuste de leyes físicas a datos experimentales, modelos de crecimiento
Machine Learning: Regresión lineal como modelo básico, base para modelos más complejos
Sugerencia de Estudio
La regresión lineal por mínimos cuadrados es probablemente la aplicación más importante del álgebra lineal en estadística y ciencias aplicadas. Entiende bien la notación: X es la matriz de diseño, β son los parámetros a estimar, e y son las observaciones. Las ecuaciones normales XᵀXβ̂ = Xᵀy son la misma AᵀAx̂ = Aᵀb de la clase anterior, solo con notación diferente. Practica construyendo la matriz X correctamente - es fácil equivocarse al principio. La técnica de desviación media es muy útil para cálculos manuales, pero en la práctica computacional moderna generalmente se usa factorización QR para mayor estabilidad numérica.
✅ Checklist de Estudio
Lista de Verificación
- Comprendo qué es un residuo y cómo se calcula
- Puedo construir la matriz de diseño X correctamente
- Sé plantear las ecuaciones normales XᵀXβ̂ = Xᵀy
- Puedo resolver para encontrar β₀ y β₁
- Sé escribir la ecuación de la recta de mínimos cuadrados
- Comprendo la técnica de desviación media y cuándo usarla
- Puedo calcular residuos y el error de mínimos cuadrados
- Entiendo la interpretación geométrica: ŷ = Xβ̂ es proyección de y
- Sé extender el método a polinomios de grado mayor
- Comprendo la conexión con el problema general de mínimos cuadrados
🏷️ Tags
algebra-lineal regresion-lineal minimos-cuadrados recta-regresion ecuaciones-normales modelo-lineal estadistica analisis-datos clase-39 clase capitulo-6