Singulärwertzerlegung

Singulärwertzerlegung am Beispiel einer zweidimensionalen, reellen Scherung M {\displaystyle M} : Diese Transformation verzerrt den blauen Einheitskreis oben links zur Ellipse rechts oben im Bild. M {\displaystyle M} kann zerlegt werden in zwei Drehungen U {\displaystyle U} und V {\displaystyle V^{*}} sowie eine Dehnung/Stauchung Σ {\displaystyle \Sigma } entlang der Koordinatenachsen. Die Singulärwerte σ 1 {\displaystyle \sigma _{1}} und σ 2 {\displaystyle \sigma _{2}} sind die Längen der großen bzw. kleinen Halbachse der Ellipse. Die genauen Werte für dieses Beispiel finden sich in der Bildbeschreibung.

Eine Singulärwertzerlegung (engl. Singular Value Decomposition; abgekürzt SWZ oder SVD) einer Matrix bezeichnet deren Darstellung als Produkt dreier spezieller Matrizen. Daraus kann man die Singulärwerte der Matrix ablesen. Diese charakterisieren, ähnlich den Eigenwerten, Eigenschaften der Matrix. Singulärwertzerlegungen existieren für jede Matrix – auch für nichtquadratische Matrizen.

Definition

Als Singulärwertzerlegung einer komplexen m × n {\displaystyle m\times n} -Matrix M {\displaystyle M} mit Rang r {\displaystyle r} m i n { m , n } {\displaystyle \mathrm {min} \{m,n\}} bezeichnet man ein Produkt der Gestalt

M = U Σ V , {\displaystyle M=U\Sigma V^{*},}

wobei

  • U {\displaystyle U} eine unitäre m × m {\displaystyle m\times m} -Matrix ist,
  • V {\displaystyle V^{*}} die Adjungierte einer unitären n × n {\displaystyle n\times n} -Matrix V {\displaystyle V} und
  • Σ {\displaystyle \Sigma } eine reelle m × n {\displaystyle m\times n} -Matrix der Gestalt
Σ = ( σ 1 0 σ r 0 0 ) {\displaystyle \Sigma =\left({\begin{array}{ccc|ccc}\sigma _{1}&&&&\vdots &\\&\ddots &&\cdots &0&\cdots \\&&\sigma _{r}&&\vdots &\\\hline &\vdots &&&\vdots &\\\cdots &0&\cdots &\cdots &0&\cdots \\&\vdots &&&\vdots &\\\end{array}}\right)}
mit σ 1 σ r > 0 {\displaystyle \sigma _{1}\geq \dotsb \geq \sigma _{r}>0} ist.

Die positiven Diagonaleinträge σ i , i = 1 , , r {\displaystyle \sigma _{i},i=1,\dotsc ,r} von Σ {\displaystyle \Sigma } heißen Singulärwerte von M {\displaystyle M} .[1] Die Singulärwerte und damit auch die Matrix Σ {\displaystyle \Sigma } sind durch M {\displaystyle M} bis auf die Reihenfolge eindeutig bestimmt. Die Spaltenvektoren u i , i = 1 , , m {\displaystyle u_{i},i=1,\dotsc ,m} von U {\displaystyle U} heißen Links-Singulärvektoren, die Spaltenvektoren v i , i = 1 , , n {\displaystyle v_{i},i=1,\dotsc ,n} von V {\displaystyle V} heißen Rechts-Singulärvektoren (zum Index i {\displaystyle i} ) der Matrix M {\displaystyle M} . Weder U {\displaystyle U} noch V {\displaystyle V} sind eindeutig bestimmt.

Eigenschaften

Jede Matrix besitzt mindestens eine Singulärwertzerlegung. Bei einer reellen Matrix können die Matrizen U {\displaystyle U} und V {\displaystyle V} der Zerlegung reell gewählt werden.

Wegen

M M = ( V Σ T U ) ( U Σ V ) = V Σ T Σ V {\displaystyle M^{*}\cdot M=\left(V\Sigma ^{T}U^{*}\right)\cdot \left(U\Sigma V^{*}\right)=V\Sigma ^{T}\Sigma V^{*}}

ist M M {\displaystyle M^{*}M} ähnlich zu Σ T Σ {\displaystyle \Sigma ^{T}\Sigma } . Damit sind die Singulärwerte der Matrix M {\displaystyle M} gleich den Quadratwurzeln aus den positiven Eigenwerten von M M {\displaystyle M^{*}M} . Daher ist die Spektralnorm von M {\displaystyle M} gleich dem größten Singulärwert σ 1 {\displaystyle \sigma _{1}} , M 2 = σ 1 {\displaystyle \left\|M\right\|_{2}=\sigma _{1}} . Weiterhin ist die Frobeniusnorm die euklidische Norm des Vektors der Singulärwerte, M F = [ σ i ] i = 1 r 2 {\displaystyle \left\|M\right\|_{F}=\left\|[\sigma _{i}]_{i=1}^{r}\right\|_{2}} .

Einsetzen und Nachrechnen zeigt, dass sich die Pseudoinverse (bei Invertierbarkeit die Inverse) zu M {\displaystyle M} aus

M + = V Σ + U {\displaystyle M^{+}=V\Sigma ^{+}U^{*}}

mit

( Σ + ) i j = { 1 σ i , falls   i = j r , 0 sonst {\displaystyle (\Sigma ^{+})_{ij}={\begin{cases}{\frac {1}{\sigma _{i}}},&{\text{falls}}\ i=j\leq r,\\0&{\text{sonst}}\end{cases}}}

ergibt. Somit sind die Singulärwerte der Inversen zu M {\displaystyle M} genau 1 σ i {\displaystyle {\tfrac {1}{\sigma _{i}}}} , und die auf die Spektralnorm bezogene Konditionszahl von M {\displaystyle M} ergibt sich zu κ 2 ( M ) = σ 1 σ n {\displaystyle \kappa _{2}(M)={\tfrac {\sigma _{1}}{\sigma _{n}}}} .

Da unitäre Transformationen den Betrag der Determinante nicht ändern, gilt

| det ( M ) | = i = 1 r σ i , {\displaystyle \left|\det(M)\right|=\prod _{i=1}^{r}\sigma _{i},}

falls M {\displaystyle M} eine quadratische Matrix mit det ( M ) 0 {\displaystyle \det(M)\neq 0} ist.

Es gilt

M v i = σ i u i {\displaystyle Mv_{i}=\sigma _{i}u_{i}}

und

M T u i = σ i v i  für  i = 1 , , min ( m , n ) , {\displaystyle M^{T}u_{i}=\sigma _{i}v_{i}\quad {\text{ für }}i=1,\dotsc ,\min(m,n),}

d. h., die Paare aus Singulärwert und Singulärvektoren kennzeichnen Längenänderung und Richtung im Bildraum durch die lineare Transformation M {\displaystyle M} bzw. M T {\displaystyle M^{T}} , jeweils auf den Vektoren eines Orthonormalsystems im Urbildraum.

Ökonomische Variante der Singulärwertzerlegung

Sei

M = U Σ V {\displaystyle M=U\Sigma V^{*}}

die Singulärwertzerlegung einer m × n {\displaystyle m\times n} -Matrix M {\displaystyle M} .

Im Falle m < n {\displaystyle m<n} gibt es eine „ökonomische Variante“ der Singulärwertzerlegung der Gestalt

M = U Σ m V m {\displaystyle M=U\Sigma _{m}V_{m}^{*}} .

Hierbei ist V m {\displaystyle V_{m}} diejenige n × m {\displaystyle n\times m} -Matrix, deren Spalten aus den ersten m {\displaystyle m} Spalten von V {\displaystyle V} bestehen, und Σ m {\displaystyle \Sigma _{m}} besteht aus den ersten m {\displaystyle m} Spalten von Σ {\displaystyle \Sigma } .

Analog ist die ökonomische Variante im Falle m > n {\displaystyle m>n} wie folgt gegeben:

M = U n Σ n V , {\displaystyle M=U_{n}\Sigma _{n}V^{*},}

wobei U n {\displaystyle U_{n}} die ersten n {\displaystyle n} Spalten von U {\displaystyle U} enthält und Σ n {\displaystyle \Sigma _{n}} die ersten n {\displaystyle n} Zeilen von Σ {\displaystyle \Sigma } .

Viele Programmierbibliotheken für lineare Algebra können nur letztere Variante berechnen; für m × n {\displaystyle m\times n} -Matrizen mit m < n {\displaystyle m<n} kann man die Singulärwertzerlegung (in ersterer Variante) dann durch Transposition bzw. Adjunktion erreichen:

M = V m Σ m U {\displaystyle M^{*}=V_{m}\Sigma _{m}^{\top }U^{*}} .

Numerische Bestimmung der Singulärwertzerlegung

Da die Singulärwerte mit den Eigenwerten der Matrix M M {\displaystyle M^{*}M} zusammenhängen, wäre ein naheliegender Algorithmus zur numerischen Bestimmung einer Singulärwertzerlegung der Matrix die numerische Lösung des symmetrischen Eigenwertproblems zu M M {\displaystyle M^{*}M} . Allerdings ist ein solcher Algorithmus numerisch instabil, da durch das Produkt die Konditionszahl quadriert wird, und zudem aufgrund der benötigten Matrizenprodukte auch sehr aufwendig.

In den 1960er Jahren entwickelte vor allem Gene Golub stabile iterative Algorithmen zur Berechnung einer Singulärwertzerlegung, die direkt die Matrix M {\displaystyle M} transformieren, womit die Zerlegung praktisch nutzbar wurde. Diese gehen von der symmetrischen bzw. selbstadjungierten Blockmatrix

[ 0 M M 0 ] {\displaystyle {\begin{bmatrix}0&M\\M^{\ast }&0\end{bmatrix}}}

aus, deren Eigenwerte die Singulärwerte und deren Negative sowie null sind. Das ursprüngliche Verfahren wurde von ihm 1965 mit William Kahan und ein iteratives 1970 mit Christian Reinsch veröffentlicht. Die Verfahren formen die Matrix zunächst in eine günstigere Gestalt um: Mit Hilfe von orthogonalen Transformationen – etwa Householdertransformationen – wird die Matrix auf Bidiagonalform gebracht. Nach diesem Zwischenschritt erlaubt eine modifizierte Form des QR-Algorithmus eine effiziente numerische Bestimmung der Singulärwerte. Der Aufwand liegt bei ca. 4 3 n 3 + O ( n 2 ) {\displaystyle {\tfrac {4}{3}}n^{3}+{\mathcal {O}}\left(n^{2}\right)} arithmetischen Operationen.

Anwendung

Die Singulärwertzerlegung wird insbesondere in der numerischen Mathematik verwendet. Damit lassen sich beispielsweise fast singuläre lineare Gleichungssysteme im Rahmen rechentechnischer Genauigkeiten passabel lösen.

Die Singulärwertzerlegung ist die wichtigste numerische Methode in der geophysikalischen Inversion, bei der aus an der Erdoberfläche beobachteten geophysikalischen Signalen aus dem Erdinneren die Struktur des letzteren bestimmt werden kann. Besondere Anwendungen sind hier die seismische Tomographie und das Umkehrproblem der Potentialtheorie.

In der Statistik ist die Singulärwertzerlegung der rechnerische Kern der Hauptkomponentenanalyse, dort auch Karhunen-Loève-Transformation genannt.

Einige moderne Bildkompressionsverfahren beruhen auf einem Algorithmus, der das Bild (= Matrix aus Farbwerten) in eine Singulärwertzerlegung überführt, anschließend nur die stark von null verschiedenen Elemente der Matrix Σ {\displaystyle \Sigma } berücksichtigt und dann die zur Rückgewinnung der Matrix erforderlichen Vektoren sowie die verbliebenen Diagonalelemente speichert. Besonders effektiv ist diese Kompression bei bestimmten rechteckigen Mustern und natürlich desto effektiver, je größer (und je quadratähnlicher) das Bild ist. Dies ist eine mögliche Anwendung von Modellreduktion. Das Weglassen von kleinen Singulärwerten ist ein verlustbehaftetes Modellreduktionsverfahren.

In der Teilchenphysik benutzt man die Singulärwertzerlegung, um Massenmatrizen von Dirac-Teilchen zu diagonalisieren. Die Singulärwerte geben die Massen der Teilchen in ihren Masseneigenzuständen an. Aus den Transformationsmatrizen U {\displaystyle U} und V {\displaystyle V} konstruiert man Mischungsmatrizen wie die CKM-Matrix, die ausdrücken, dass die Masseneigenzustände von Teilchen aus einer Mischung von Flavour­eigenzuständen bestehen können.

Die Singulärwertzerlegung ist der Kern der Latent Semantic Analysis, eines Verfahrens des Information Retrieval, das hilft, in großen Textkollektionen latente Konzepte aufzudecken, anhand derer dann z. B. unterschiedlich bezeichnete Informationen zum gleichen Thema gefunden werden können.

In der Regelungstheorie ist Singulärwertzerlegung eine der Grundlagen für die Entwicklung von robusten Reglern.

Siehe auch

Literatur

  • Gene H. Golub, William Kahan: Calculating the singular values and pseudo-inverse of a matrix. In: Journal of the Society for Industrial and Applied Mathematics. Serie B: Numerical Analysis. Band 2, Nummer 2, 1965, S. 205–224, (Online ebenso bei galton.uchicago.edu und bei www3.math.tu-berlin.de.).
  • Gilbert W. Stewart: On the early history of the singular value decomposition. In: SIAM Review. Band 35, Nummer 4, 1993, S. 551–566.
  • Günter Gramlich: Anwendung der Linearen Algebra. Mit MATLAB®. Fachbuchverlag Leipzig im Carl-Hanser-Verlag, München u. a. 2004, ISBN 3-446-22655-9.
  • Peter Deuflhard, Andreas Hohmann: Numerische Mathematik. Band 1: Eine algorithmisch orientierte Einführung. 4., überarbeitete und erweiterte Auflage. Walter de Gruyter, Berlin 2008, ISBN 978-3-11-020354-7.
  • Martin Hermann: Numerische Mathematik. Band 1: Algebraische Probleme. 4., überarbeitete und erweiterte Auflage. Walter de Gruyter, Berlin 2020, ISBN 978-3-11-065665-7.
  • taramath Online-Tool zur Berechnung der Singulärwertzerlegung reeller Matrizen.

Fußnoten

  1. Der größte und kleinste Singulärwert einer quadratischen Matrix wurde Mitte des 20. Jahrhunderts auch als „obere Grenze“ bzw. „untere Grenze“ der Matrix bezeichnet, siehe Grenze (obere u. untere) einer quadratischen Matrix. In: Josef Naas, Hermann Ludwig Schmid: Mathematisches Wörterbuch. Band 1: A – K. 3. Auflage, unveränderter Nachdruck. Akademie-Verlag u. a., Berlin u. a. 1979, ISBN 3-519-02400-4.