Clase 43: Descomposición en Valores Singulares (DVS/SVD)
📚 Introducción
La Descomposición en Valores Singulares (DVS o SVD por sus siglas en inglés: Singular Value Decomposition) es una de las factorizaciones matriciales más importantes y versátiles del álgebra lineal. A diferencia de la diagonalización estándar que solo funciona para matrices cuadradas, la DVS se puede aplicar a cualquier matriz de m × n, sea cuadrada o rectangular.
La DVS tiene aplicaciones fundamentales en compresión de datos, reducción de dimensionalidad (PCA), procesamiento de imágenes, sistemas de recomendación, análisis de datos, procesamiento de señales, machine learning, y muchas otras áreas. Es la base matemática detrás de técnicas como análisis de componentes principales y aproximaciones de rango bajo.
Objetivos de la Clase
- Comprender la definición de valores singulares
- Dominar la construcción de la descomposición en valores singulares
- Entender la relación con valores propios y formas cuadráticas
- Aplicar DVS a problemas de aproximación y compresión
- Interpretar geométricamente la DVS
- Calcular la DVS de matrices rectangulares
1. Valores Singulares y su Definición
1.1 Motivación Geométrica
Transformación de la Esfera Unitaria
Sea A una matriz de m × n. La transformación lineal x ↦ Ax mapea la esfera unitaria {x : ||x|| = 1} en ℝⁿ sobre una elipse en ℝᵐ.
Los valores singulares de A miden las longitudes de los semiejes de esta elipse. El valor singular más grande σ₁ es la longitud máxima que A puede estirar un vector unitario:
Ejemplo Visual: Transformación ℝ³ → ℝ²
Sea A = . La transformación A mapea la esfera unitaria en ℝ³ sobre una elipse en ℝ².
Efecto:
- Los vectores en ciertas direcciones se estiran más que en otras
- Los valores singulares σ₁ y σ₂ son las longitudes de los semiejes mayor y menor de la elipse
1.2 Definición Algebraica
Definición - Valores Singulares
Sea A una matriz de m × n. Los valores singulares de A son las raíces cuadradas de los valores propios de AᵀA:
Por convención, se ordenan de mayor a menor:
Conexión con Formas Cuadráticas
La cantidad ||Ax||² se puede escribir como:
Esto es una forma cuadrática con matriz AᵀA (que es simétrica). Por el teorema de los ejes principales, existe un cambio de variable ortogonal que la convierte en suma de cuadrados.
2. El Teorema de la Descomposición en Valores Singulares
2.1 Enunciado del Teorema Principal
Teorema 10 - Descomposición en Valores Singulares
Sea A una matriz de m × n con rango r. Entonces existe una matriz Σ de m × n como la de la ecuación (3) para la cual las entradas diagonales en D son los primeros r valores singulares de A, σ₁ ≥ σ₂ ≥ ··· ≥ σᵣ > 0, y existen una matriz ortogonal U de m × m y una matriz ortogonal V de n × n tales que:
donde la matriz Σ tiene la forma:
con D una matriz diagonal r × r con entradas σ₁,…, σᵣ.
Componentes de la DVS
- U: Matriz ortogonal m × m cuyascolumnas son los vectores singulares izquierdos de A
- Σ: Matriz “diagonal” m × n con los valores singulares en la diagonal
- V: Matriz ortogonal n × n cuyas columnas son los vectores singulares derechos de A
2.2 Construcción Paso a Paso
Proceso de Construcción de la DVS
Paso 1: Encontrar una diagonalización ortogonal de AᵀA
- Calcular AᵀA (matriz simétrica n × n)
- Encontrar valores propios λ₁ ≥ λ₂ ≥ ··· ≥ λₙ de AᵀA
- Encontrar vectores propios ortonormales v₁,…, vₙ de AᵀA
Paso 2: Obtener V y Σ
- V = [v₁ v₂ ··· vₙ] (matriz ortogonal n × n)
- Valores singulares: σᵢ = √λᵢ para i = 1,…, r
- Construir Σ con σ₁,…, σᵣ en la diagonal
Paso 3: Construir U
- Para i = 1,…, r: calcular uᵢ = (1/σᵢ)Avᵢ
- Extender {u₁,…, uᵣ} a base ortonormal de ℝᵐ
- U = [u₁ u₂ ··· uₘ]
3. Ejemplos Completos
3.1 Ejemplo Fundamental
Ejemplo 1: DVS de matriz 2×3
Sea A = . Encuentre la descomposición en valores singulares.
Paso 1: Calcular AᵀA
Paso 2: Valores propios de AᵀA
Los valores propios de AᵀA son: λ₁ = 360, λ₂ = 90, λ₃ = 0
Paso 3: Valores singulares
Paso 4: Vectores propios ortonormales de AᵀA
Paso 5: Construir V
Paso 6: Construir Σ
Como A es 2×3 y tiene rango 2:
Paso 7: Construir U
Por lo tanto:
Descomposición completa:
3.2 Ejemplo con Matriz Cuadrada
Ejemplo 2: DVS de matriz 3×3 con un valor singular cero
Sea A = . Encuentre la DVS.
Paso 1: Calcular AᵀA
Paso 2: Valores propios y vectores propios
Los valores propios de AᵀA son λ₁ = 4 y λ₂ = 1, con vectores propios unitarios:
Paso 3: Valores singulares
Paso 4: Construir V
Paso 5: Construir U (primeras dos columnas)
Necesitamos u₃ ortogonal a u₁ y u₂ (puede calcularse con producto cruz o Gram-Schmidt).
4. Bases y Subespacios Fundamentales
4.1 Teorema de las Bases
Teorema 9 - Bases Ortogonales de los Cuatro Subespacios
Suponga que {v₁,…, vₙ} es una base ortonormal para ℝⁿ que consiste en vectores propios de AᵀA, arreglados de tal forma que los valores propios correspondientes de AᵀA satisfacen λ₁ ≥ ··· ≥ λₙ, y suponga que A tiene r valores singulares diferentes de cero. Entonces:
- {Av₁,…, Avᵣ} es una base ortogonal para Col A
- {vᵣ₊₁,…, vₙ} es una base ortogonal para Nul A
- rango A = r
Conexión con Subespacios Fundamentales
La DVS proporciona bases ortonormales para los cuatro subespacios fundamentales:
- Col A (espacio columna): Primeras r columnas de U
- Nul Aᵀ (espacio nulo izquierdo): Últimas m - r columnas de U
- Fila A (espacio fila): Primeras r columnas de V
- Nul A (espacio nulo): Últimas n - r columnas de V
5. Aplicaciones de la DVS
5.1 Aproximación de Rango Bajo
Mejor Aproximación de Rango k
Si A tiene DVS A = UΣVᵀ, entonces la mejor aproximación de A por una matriz de rango k (para k < r) es:
Esta aproximación minimiza ||A - B|| sobre todas las matrices B de rango k.
Aplicación: Compresión de Imágenes
Una imagen en escala de grises es una matriz A. Para comprimir:
- Calcular DVS: A = UΣVᵀ
- Retener solo los k valores singulares más grandes
- Aproximar: A ≈ Aₖ = σ₁u₁v₁ᵀ + ··· + σₖuₖvₖᵀ
Almacenamiento: En lugar de m×n elementos, solo se almacenan k(m + n + 1) elementos.
5.2 Análisis de Componentes Principales (PCA)
PCA mediante DVS
Para reducir dimensionalidad de datos:
- Centrar los datos (restar media de cada variable)
- Calcular DVS de la matriz de datos
- Las columnas de V son las componentes principales
- Proyectar datos sobre las primeras k componentes
5.3 Pseudoinversa de Moore-Penrose
Definición - Pseudoinversa
Si A = UΣVᵀ con r valores singulares no nulos, la pseudoinversa de A es:
donde Σ⁺ se obtiene transponiendo Σ y reemplazando cada valor singular no nulo σᵢ por 1/σᵢ.
Propiedad: x̂ = A⁺b minimiza ||Ax - b|| (solución de mínimos cuadrados).
6. Interpretación Geométrica
6.1 Descomposición como Producto de Transformaciones
Interpretación Geométrica de A = UΣVᵀ
La transformación Ax = UΣVᵀx se puede ver como composición de tres transformaciones:
- Vᵀ: Rotación/reflexión en ℝⁿ (cambio a ejes principales)
- Σ: Escalamiento por los valores singulares σᵢ
- U: Rotación/reflexión en ℝᵐ
Efecto: Toda transformación lineal A se descompone en rotación → escalamiento → rotación.
🎯 Conceptos Clave
Resumen
- Valores Singulares: σᵢ = √λᵢ donde λᵢ son valores propios de AᵀA
- DVS: A = UΣVᵀ con U, V ortogonales
- Construcción: Diagonalizar AᵀA, construir V, luego U = AV Σ⁻¹
- Aplicaciones: Compresión, PCA, mínimos cuadrados, aproximación de rango bajo
- Geometría: Mapeo de esfera a elipse, escalamiento según σᵢ
- Bases: DVS proporciona bases para los cuatro subespacios
🏷️ Tags
algebra-lineal dvs svd valores-singulares descomposicion-matricial pca compresion aproximacion clase-43 capitulo-7