Clase 38: Problemas de Mínimos Cuadrados

📚 Introducción

El ejemplo introductorio a este capítulo describió un enorme problema del tipo Ax = b que no tuvo solución. En las aplicaciones son frecuentes los sistemas inconsistentes, aunque por lo general no aparecen matrices de coeficientes tan grandes. Cuando se pide una solución y esta no existe, lo mejor que se puede hacer es encontrar una x tal que x esté lo más cerca posible de b.

Piense que Ax es una aproximación a b. Cuanto menor sea la distancia entre b y Ax, dada por ||b - Ax||, mucho mejor será la aproximación. El problema general de mínimos cuadrados consiste en encontrar una x que haga a ||b - Ax|| tan pequeña como sea posible. El adjetivo “mínimos cuadrados” se origina en el hecho de que ||b - Ax|| es la raíz cuadrada de una suma de cuadrados.

El aspecto más importante del problema de mínimos cuadrados es que sin importar cuál x se seleccione, el vector Ax necesariamente estará en el espacio columna, Col A. Así que se busca un vector que haga que Ax̂ sea el punto en Col A más cercano a b.

Objetivos de la Clase

  • Comprender la definición y formulación del problema de mínimos cuadrados
  • Dominar la solución mediante ecuaciones normales AᵀAx̂ = Aᵀb
  • Aplicar el teorema de la mejor aproximación a sistemas inconsistentes
  • Calcular errores de mínimos cuadrados
  • Resolver problemas mediante factorización QR cuando sea apropiado

1. Definición del Problema de Mínimos Cuadrados

1.1 Planteamiento Geométrico

Definición - Solución de Mínimos Cuadrados

Si A es de m × n y b está en ℝᵐ, una solución de mínimos cuadrados de Ax = b es un en ℝⁿ tal que:

para toda x en ℝⁿ.

Interpretación Geométrica

Si b resulta estar en Col A, entonces b es para alguna , y tal es una “solución de mínimos cuadrados”. (Desde luego, si b resulta estar en Col A, entonces b es Ax̂ para alguna , y tal es una “solución de mínimos cuadrados”).

1.2 Visualización del Problema

El aspecto más importante del problema de mínimos cuadrados es que sin importar cuál x se seleccione, el vector Ax necesariamente estará en el espacio columna, Col A. Así que se busca un vector que haga que Ax̂ sea el punto en Col A más cercano a b. Véase la figura 1.

Observación Clave

El vector b está más cerca de que de x para otra x.


2. Solución del Problema General de Mínimos Cuadrados

2.1 Aplicación del Teorema de la Mejor Aproximación

Con base en los y y b anteriores, aplique el teorema de la mejor aproximación que se expuso en la sección 6.3 al subespacio Col A. Sea:

Como está en el espacio columna de A, la ecuación Ax̂ = es consistente, y existe una en ℝⁿ tal que:

Como es el punto en Col A más cercano a b, un vector es una solución de mínimos cuadrados de Ax = b si y solo si satisface la ecuación (1). Tal en ℝⁿ es una lista de pesos para construir a partir de las columnas de A. Véase la figura 2. [Existen muchas soluciones de la ecuación (1) si tiene variables libres].

2.2 Ecuaciones Normales

El conjunto de soluciones de mínimos cuadrados de Ax = b coincide con el conjunto no vacío de soluciones de las ecuaciones normales AᵀAx̂ = Aᵀb.

Teorema 13 - Caracterización de Soluciones de Mínimos Cuadrados

El conjunto de soluciones de mínimos cuadrados de Ax = b coincide con el conjunto no vacío de soluciones de las ecuaciones normales:

2.3 Demostración del Teorema 13

Demostración

Como ya se mostró antes, el conjunto de soluciones de mínimos cuadrados es no vacío y cada solución de mínimos cuadrados satisface las ecuaciones normales.

A la inversa, suponga que satisface AᵀA = Aᵀb. Entonces, satisface la ecuación (2) anterior, lo que demuestra que b - A es ortogonal a las filas de Aᵀ y, por lo tanto, ortogonal a las columnas de A. Como las columnas de A generan Col A, entonces el vector b - A es ortogonal a todo elemento de Col A. Si aj es cualquier columna de A, entonces:

Como las columnas de A generan Col A, entonces el vector b - A es ortogonal a todo elemento de Col A. Por consiguiente, la ecuación:

es una descomposición de b en la suma de un vector en Col A y de un vector ortogonal a Col A. Por la singularidad de la descomposición ortogonal, A debe ser la proyección ortogonal de b sobre Col A. Es decir, A = , y es una solución de mínimos cuadrados.


3. Ejemplos Resueltos

3.1 Ejemplo Básico con Sistema 3×2

Ejemplo 1: Encuentre una solución de mínimos cuadrados del sistema inconsistente Ax = b para

Solución:

Para emplear las ecuaciones normales (3), calcule:

Entonces, la ecuación AᵀAx = Aᵀb se convierte en:

Pueden utilizarse operaciones de fila para resolver este sistema, pero como AᵀA es de 2 × 2 e invertible, tal vez sea más rápido calcular:

y luego resolver AᵀAx = Aᵀb como:

En muchos cálculos, AᵀA es invertible, pero este no siempre es el caso. El siguiente ejemplo implica a una matriz A como las que suelen presentarse en estadística, en problemas de análisis de varianza.

3.2 Ejemplo con Variables Libres

Ejemplo 2: Encuentre una solución de mínimos cuadrados de Ax = b para

Solución:

Calcule:

La matriz aumentada para AᵀAx = Aᵀb es:

La solución general es x₁ = 3 - x₄, x₂ = -5 + x₄, x₃ = -2 + x₄, con x₃ libre. Así, la solución general de mínimos cuadrados de Ax = b tiene la forma:


4. Condiciones para Unicidad de la Solución

4.1 Criterios de Invertibilidad

El siguiente teorema brinda útiles criterios para determinar cuándo existe solamente una solución de mínimos cuadrados de Ax = b. (Desde luego, la proyección ortogonal siempre es única).

Teorema 14 - Unicidad de la Solución de Mínimos Cuadrados

Sea A una matriz de m × n. Los siguientes enunciados son lógicamente equivalentes:

a) La ecuación Ax = b tiene una solución de mínimos cuadrados única para cada b en ℝᵐ.

b) Las columnas de A son linealmente independientes.

c) La matriz AᵀA es invertible.

Cuando estos enunciados son verdaderos, la solución de mínimos cuadrados está dada por:

Observación sobre la Fórmula (4)

La fórmula (4) para es útil sobre todo para fines teóricos y cálculos a mano cuando AᵀA es una matriz invertible de 2 × 2.


5. Cálculo del Error de Mínimos Cuadrados

5.1 Definición del Error

Cuando se usa una solución de mínimos cuadrados para producir A como una aproximación a b, entonces la distancia de b a A se llama el error de mínimos cuadrados de esta aproximación.

Ejemplo 3: Dados A y b como en el ejemplo 1, determine el error de mínimos cuadrados en la solución de mínimos cuadrados de Ax = b.

Solución:

A partir del ejemplo 1:

Por lo tanto,

El error de mínimos cuadrados es √84. Para cualquier x en ℝ², la distancia entre b y el vector Ax es al menos √84. Véase la figura 3. Observe que la solución de mínimos cuadrados no se presenta en la figura.

Interpretación Geométrica

El error de mínimos cuadrados es √84. Para cualquier x en ℝ², la distancia entre b y x es al menos √84. Véase la figura 3. Observe que la solución de mínimos cuadrados no se presenta en la figura.


6. Cálculos Alternativos con Factorización QR

6.1 Simplificación mediante Bases Ortonormales

El siguiente ejemplo muestra cómo encontrar una solución de mínimos cuadrados de Ax = b cuando las columnas de A son ortogonales. Con frecuencia tales matrices se presentan en problemas de regresión lineal, como los que se analizarán en la siguiente sección.

Ejemplo 4: Encuentre una solución de mínimos cuadrados de Ax = b para

Solución:

Como las columnas a₁ y a₂ de A son ortogonales, la proyección ortogonal de b sobre Col A está dada por:

Ahora que se conoce , se puede resolver A = . Pero esto es trivial, porque ya se sabe que los pesos a colocar sobre las columnas de A producen . A partir de la ecuación (5) es claro que:

6.2 Uso de la Factorización QR

Teorema 15 - Solución mediante Factorización QR

Dada una matriz A de m × n, con columnas linealmente independientes, sea A = QR una factorización QR de A como en el teorema 12. Entonces, para cada b en ℝᵐ, la ecuación Ax = b tiene una solución de mínimos cuadrados única, dada por:

Demostración

Sea = R⁻¹Qᵀb. Entonces,

De acuerdo con el teorema 12, las columnas de Q forman una base ortonormal para Col A. Por lo tanto, según el teorema 10, QQᵀb es la proyección ortogonal de b sobre Col A. Así, = , lo que muestra que es una solución de mínimos cuadrados de Ax = b. La unicidad de se deduce del teorema 14.

6.3 Nota Numérica sobre Ecuación (7)

Nota Numérica

Como en el teorema 15, R es triangular superior, entonces se debería calcular como la solución exacta de la ecuación:

Es mucho más rápido resolver (7), por sustitución hacia atrás o mediante operaciones de fila, que calcular R⁻¹ y utilizar la ecuación (6).

Ejemplo 5: Encuentre la solución de mínimos cuadrados de Ax = b para

Solución:

La factorización QR de A se obtiene como en la sección 6.4:

Luego,

La solución de mínimos cuadrados satisface Rx = Qᵀb; es decir,

Esta ecuación se resuelve fácilmente y conduce a = .


🎯 Conceptos Clave para Repasar

Resumen de Conceptos

  1. Problema de Mínimos Cuadrados: Minimizar ||b - Ax|| cuando Ax = b es inconsistente
  2. Solución de Mínimos Cuadrados: que minimiza ||b - Ax||
  3. Ecuaciones Normales: AᵀA = Aᵀb caracteriza soluciones de mínimos cuadrados
  4. Proyección Ortogonal: = A es proy_Col A b
  5. Unicidad: Solución única ⟺ columnas de A linealmente independientes ⟺ AᵀA invertible
  6. Fórmula Explícita: = (AᵀA)⁻¹Aᵀb cuando AᵀA es invertible
  7. Error de Mínimos Cuadrados: ||b - A||
  8. Factorización QR: = R⁻¹Qᵀb proporciona método numéricamente estable

🚨 Errores Comunes

Error 1: Confundir solución exacta con solución de mínimos cuadrados

  • Incorrecto: Pensar que A = b exactamente
  • Correcto: A = donde es la proyección de b sobre Col A

Error 2: No verificar si AᵀA es invertible

  • Problema: Intentar usar (AᵀA)⁻¹ cuando las columnas de A son linealmente dependientes
  • Solución: Verificar rango de A o resolver el sistema AᵀA = Aᵀb directamente

Error 3: Calcular R⁻¹ innecesariamente

  • Ineficiente: Usar = R⁻¹Qᵀb calculando la inversa
  • Eficiente: Resolver R = Qᵀb por sustitución hacia atrás

Error 4: Confundir con

  • Incorrecto: es la solución de mínimos cuadrados
  • Correcto: es la solución de mínimos cuadrados; = A es la proyección de b

Error 5: Pensar que el error es cero

  • Problema: Asumir que ||b - A|| = 0 automáticamente
  • Realidad: El error solo es cero si b ∈ Col A (sistema consistente)

📝 Ejercicios Propuestos

Ejercicios Nivel Básico (1-8)

Cálculos directos de mínimos cuadrados

  1. Para matrices pequeñas A (2×2, 3×2), calcule AᵀA y Aᵀb
  2. Resuelva las ecuaciones normales AᵀA = Aᵀb
  3. Verifique que minimiza ||b - Ax||
  4. Calcule el error de mínimos cuadrados ||b - A||

Ejercicios Nivel Intermedio (9-16)

Problemas con variables libres y aplicaciones

  1. Encuentre la solución general de mínimos cuadrados cuando AᵀA no es invertible
  2. Determine si las columnas de A son linealmente independientes
  3. Use columnas ortogonales para simplificar cálculos
  4. Aplique el Teorema 14 para verificar unicidad

Ejercicios Nivel Avanzado (17-25)

Factorización QR y análisis teórico

  1. Use factorización QR para resolver problemas de mínimos cuadrados
  2. Compare eficiencia: ecuaciones normales vs factorización QR
  3. Demuestre propiedades del error de mínimos cuadrados
  4. Analice estabilidad numérica de diferentes métodos

📚 Referencias

Lectura Principal

  • Sección 6.5: Problemas de mínimos cuadrados, págs. 360-365

Enlaces Relacionados

Conexión con Temas Futuros

Anticipando Regresión Lineal

El problema de mínimos cuadrados es fundamental para la regresión lineal y el ajuste de curvas. En la siguiente clase veremos cómo encontrar la recta (o curva polinomial) que mejor se ajusta a un conjunto de datos experimentales. Esto tiene aplicaciones directas en estadística, ingeniería, ciencias experimentales, y machine learning.


Sugerencia de Estudio

El problema de mínimos cuadrados es uno de los más importantes en álgebra lineal aplicada. La clave es entender la geometría: estamos proyectando b sobre Col A para encontrar la mejor aproximación posible. Las ecuaciones normales AᵀA = Aᵀb son la herramienta algebraica que hace esto posible. Practica con ejemplos donde AᵀA es invertible (más simple) antes de abordar casos con variables libres. La factorización QR proporciona un método numéricamente más estable, especialmente importante en aplicaciones computacionales donde los errores de redondeo pueden acumularse.


✅ Checklist de Estudio

Lista de Verificación

  • Comprendo qué significa minimizar ||b - Ax||
  • Puedo plantear las ecuaciones normales AᵀA = Aᵀb
  • Sé calcular AᵀA y Aᵀb para matrices concretas
  • Puedo resolver las ecuaciones normales
  • Entiendo cuándo la solución de mínimos cuadrados es única (Teorema 14)
  • Puedo usar la fórmula = (AᵀA)⁻¹Aᵀb cuando aplica
  • Sé calcular el error de mínimos cuadrados ||b - A||
  • Comprendo la interpretación geométrica: = A es proy_Col A b
  • Puedo usar factorización QR para resolver mínimos cuadrados
  • Entiendo por qué resolver R = Qᵀb es más eficiente que calcular R⁻¹

🏷️ Tags

algebra-lineal minimos-cuadrados ecuaciones-normales proyeccion-ortogonal factorizacion-qr regresion-lineal aproximacion clase-38 clase capitulo-6