Satz von Courant-Fischer

Der Satz von Courant-Fischer (auch Minimum-Maximum-Prinzip) ist ein mathematischer Satz aus der linearen Algebra, der eine variationelle Charakterisierung der Eigenwerte einer symmetrischen oder hermiteschen Matrix ermöglicht. Jeder Eigenwert wird dabei als minimaler beziehungsweise maximaler Rayleigh-Quotient von Vektoren aus Untervektorräumen mit bestimmten Dimensionen dargestellt. Der Satz ist nach den Mathematikern Richard Courant und Ernst Fischer benannt. Er dient unter anderem zur Eigenwertabschätzung und zur Analyse numerischer Eigenwertverfahren.

Satz

Ist A K n × n {\displaystyle A\in {\mathbb {K} }^{n\times n}} eine symmetrische Matrix (falls K = R {\displaystyle {\mathbb {K} }=\mathbb {R} } ) oder hermitesche Matrix (falls K = C {\displaystyle {\mathbb {K} }=\mathbb {C} } ) mit aufsteigend sortierten Eigenwerten λ 1 λ n {\displaystyle \lambda _{1}\leq \ldots \leq \lambda _{n}} und bezeichnet X i {\displaystyle X_{i}} die Menge der i {\displaystyle i} -dimensionalen Untervektorräume von K n {\displaystyle {\mathbb {K} }^{n}} , i = 1 , , n {\displaystyle i=1,\ldots ,n} , dann hat der i {\displaystyle i} -te Eigenwert von A {\displaystyle A} die Darstellung

λ i = min X X i max x X x 0 x , A x x , x = max X X n i + 1 min x X x 0 x , A x x , x {\displaystyle \lambda _{i}=\min _{X\in X_{i}}\max _{x\in X \atop x\neq 0}{\frac {\langle x,Ax\rangle }{\langle x,x\rangle }}=\max _{X\in X_{n-i+1}}\min _{x\in X \atop x\neq 0}{\frac {\langle x,Ax\rangle }{\langle x,x\rangle }}} ,

wobei , {\displaystyle \langle \cdot ,\cdot \rangle } das reelle oder komplexe Standardskalarprodukt ist. Wird der Satz von Courant-Fischer mit absteigend sortierten Eigenwerten angegeben, dann vertauschen sich jeweils Minimum und Maximum.[1]

Anschauliches Beispiel

Der Satz von Courant-Fischer charakterisiert die Eigenwerte einer symmetrischen positiv definiten (3 × 3)-Matrix über Extrempunkte auf einem Ellipsoid

Für eine symmetrische positiv definite ( 3 × 3 ) {\displaystyle (3\times 3)} -Matrix A R 3 × 3 {\displaystyle A\in \mathbb {R} ^{3\times 3}} lässt sich der Satz von Courant-Fischer folgendermaßen veranschaulichen. Da die Eigenwerte von A T A {\displaystyle A^{T}A} die Quadrate der stets positiven Eigenwerte von A {\displaystyle A} sind und x , A T A x = A x , A x {\displaystyle \langle x,A^{T}Ax\rangle =\langle Ax,Ax\rangle } gilt, hat der i {\displaystyle i} -te Eigenwert von A {\displaystyle A} die Darstellung

λ i = min X X i max x X x 0 A x x = min X X i max x X x = 1 A x {\displaystyle \lambda _{i}=\min _{X\in X_{i}}\max _{x\in X \atop x\neq 0}{\frac {\|Ax\|}{\|x\|}}=\min _{X\in X_{i}}\max _{x\in X \atop \|x\|=1}\|Ax\|} ,

wobei {\displaystyle \|\cdot \|} die euklidische Norm ist. Die Menge { A x R 3 x = 1 } {\displaystyle \left\{Ax\in \mathbb {R} ^{3}\mid \|x\|=1\right\}} hat die Form eines Ellipsoids im dreidimensionalen Raum mit den Halbachsen λ 1 {\displaystyle \lambda _{1}} , λ 2 {\displaystyle \lambda _{2}} und λ 3 {\displaystyle \lambda _{3}} . Der Satz von Courant-Fischer charakterisiert nun die Eigenwerte von A {\displaystyle A} über bestimmte Extrempunkte auf diesem Ellipsoid:

  • Für den kleinsten Eigenwert λ 1 {\displaystyle \lambda _{1}} werden alle eindimensionalen Untervektorräume, also alle Ursprungsgeraden, betrachtet. Jede dieser Ursprungsgeraden schneidet das Ellipsoid an zwei diametral gegenüberliegenden Punkten. Von all diesen Punkten wird einer derjenigen mit dem kleinsten Abstand zum Ursprung ausgewählt.
  • Für den zweitkleinsten Eigenwert λ 2 {\displaystyle \lambda _{2}} werden alle zweidimensionalen Untervektorräume, also alle Ursprungsebenen, betrachtet. Jede dieser Ursprungsebenen schneidet das Ellipsoid in einer Ellipse. Auf jeder dieser Ellipsen wird einer der Punkte mit dem größten Abstand zum Ursprung gesucht und von all diesen Punkten einer derjenigen mit dem kleinsten Abstand zum Ursprung ausgewählt.
  • Für den größten Eigenwert λ 3 {\displaystyle \lambda _{3}} wird der ganze Raum betrachtet und einer der Punkte auf dem Ellipsoid mit dem größten Abstand zum Ursprung ausgewählt.

Der Ortsvektor eines auf diese Weise ausgewählten Punkts ist dann ein Eigenvektor der Matrix und die Länge dieses Vektors der zugehörige Eigenwert.

Beweis

Der Satz von Courant-Fischer stellt die Eigenwerte einer symmetrischen oder hermiteschen Matrix als minimale beziehungsweise maximale Rayleigh-Quotienten

R A ( x ) = x , A x x , x {\displaystyle R_{A}(x)={\frac {\langle x,Ax\rangle }{\langle x,x\rangle }}}

dar. Im Folgenden wird eine obere und eine untere Schranke für den ersten Teil der Behauptung ermittelt. Die zweite Gleichung folgt analog durch Betrachtung von A {\displaystyle -A} und der entsprechenden Komplementärräume.

Obere Schranke

Nachdem A {\displaystyle A} symmetrisch oder hermitesch ist, lässt sich eine Orthonormalbasis { x 1 , , x n } {\displaystyle \{x_{1},\ldots ,x_{n}\}} aus Eigenvektoren jeweils zu den Eigenwerten λ 1 , , λ n {\displaystyle \lambda _{1},\ldots ,\lambda _{n}} finden. Bezeichnet

V i = span ( x i , , x n ) {\displaystyle V_{i}=\operatorname {span} (x_{i},\ldots ,x_{n})}

die lineare Hülle derjenigen Eigenvektoren, deren Indizes mindestens i {\displaystyle i} sind. Der Schnitt von V i {\displaystyle V_{i}} mit einem i {\displaystyle i} -dimensionalen Untervektorraum X X i {\displaystyle X\in X_{i}} ist nicht { 0 } {\displaystyle \{0\}} , denn mit der Dimensionsformel gilt

dim ( X V i ) = dim X + dim V i dim ( X + V i ) = i + ( n i + 1 ) dim ( X + V i ) 1 {\displaystyle \dim(X\cap V_{i})=\dim X+\dim V_{i}-\dim(X+V_{i})=i+(n-i+1)-\dim(X+V_{i})\geq 1} .

Daher gibt es einen Vektor v X V i {\displaystyle v\in X\cap V_{i}} mit v 0 {\displaystyle v\neq 0} , der eine Basisdarstellung

v = c i x i + + c n x n {\displaystyle v=c_{i}x_{i}+\ldots +c_{n}x_{n}}

mit Koeffizienten c i , , c n K {\displaystyle c_{i},\ldots ,c_{n}\in {\mathbb {K} }} besitzt. Für einen solchen Vektor v {\displaystyle v} gilt nun

v , A v = λ i c i 2 + + λ n c n 2 λ i ( c i 2 + + c n 2 ) = λ i v , v {\displaystyle \langle v,Av\rangle =\lambda _{i}c_{i}^{2}+\ldots +\lambda _{n}c_{n}^{2}\geq \lambda _{i}(c_{i}^{2}+\ldots +c_{n}^{2})=\lambda _{i}\langle v,v\rangle } .

Für die Vektoren x X {\displaystyle x\in X} eines beliebigen i {\displaystyle i} -dimensionalen Untervektorraums X X i {\displaystyle X\in X_{i}} ist daher der maximale Rayleigh-Quotient R A ( x ) λ i {\displaystyle R_{A}(x)\geq \lambda _{i}} und demnach gilt auch

min X X i max x X x 0 R A ( x ) λ i {\displaystyle \min _{X\in X_{i}}\max _{x\in X \atop x\neq 0}R_{A}(x)\geq \lambda _{i}} .

Untere Schranke

Bezeichne nun

W i = span ( x 1 , , x i ) {\displaystyle W_{i}=\operatorname {span} (x_{1},\ldots ,x_{i})}

die lineare Hülle derjenigen Eigenvektoren, deren Indizes höchstens i {\displaystyle i} sind. Für einen Vektor w W i {\displaystyle w\in W_{i}} mit w 0 {\displaystyle w\neq 0} und der Darstellung

w = c 1 x 1 + + c i x i {\displaystyle w=c_{1}x_{1}+\ldots +c_{i}x_{i}}

gilt nun

w , A w = λ 1 c 1 2 + + λ i c i 2 λ i ( c 1 2 + + c i 2 ) = λ i w , w {\displaystyle \langle w,Aw\rangle =\lambda _{1}c_{1}^{2}+\ldots +\lambda _{i}c_{i}^{2}\leq \lambda _{i}(c_{1}^{2}+\ldots +c_{i}^{2})=\lambda _{i}\langle w,w\rangle } .

Der maximale Rayleigh-Quotient aller Vektoren x W i {\displaystyle x\in W_{i}} ist also R A ( x ) = λ i {\displaystyle R_{A}(x)=\lambda _{i}} und demnach gilt

min X X i max x X x 0 R A ( x ) max x W i x 0 R A ( x ) = λ i {\displaystyle \min _{X\in X_{i}}\max _{x\in X \atop x\neq 0}R_{A}(x)\leq \max _{x\in W_{i} \atop x\neq 0}R_{A}(x)=\lambda _{i}} .

Durch Zusammenfassung der beiden Schranken folgt dann der erste Teil der Behauptung.[1]

Verwendung

Eine direkte Konsequenz aus dem Satz von Courant-Fischer ist die Abschätzung

λ min R A ( x ) λ max {\displaystyle \lambda _{\min }\leq R_{A}(x)\leq \lambda _{\max }}

für den kleinsten und den größten Eigenwert einer symmetrischen oder hermiteschen Matrix A {\displaystyle A} . Gleichheit gilt dabei jeweils genau dann, wenn x {\displaystyle x} ein Eigenvektor zum jeweiligen Eigenwert ist. Der kleinste und der größte Eigenwert können demnach durch Minimierung beziehungsweise Maximierung des Rayleigh-Quotienten ermittelt werden.

Eine weitere Anwendung besteht in numerischen Stabilitätsaussagen für Eigenwertverfahren. Sind A , B K n × n {\displaystyle A,B\in {\mathbb {K} }^{n\times n}} zwei symmetrische oder hermitesche Matrizen mit aufsteigend sortierten Eigenwerten λ 1 ( A ) λ n ( A ) {\displaystyle \lambda _{1}(A)\leq \ldots \leq \lambda _{n}(A)} und λ 1 ( B ) λ n ( B ) {\displaystyle \lambda _{1}(B)\leq \ldots \leq \lambda _{n}(B)} , dann gilt

| λ i ( A ) λ i ( B ) | A B {\displaystyle |\lambda _{i}(A)-\lambda _{i}(B)|\leq \|A-B\|}

für alle i = 1 , , n {\displaystyle i=1,\ldots ,n} , wobei {\displaystyle \|\cdot \|} eine beliebige natürliche Matrixnorm ist. Wird demnach eine Matrix A {\displaystyle A} durch eine Matrix B {\displaystyle B} angenähert (deren Eigenwerte einfacher zu berechnen sind), dann ist der dadurch entstehende Fehler durch die Norm der Differenz der beiden Matrizen beschränkt.[2]

Varianten

Von dem Satz von Courant-Fischer existiert auch folgende Variante zur Darstellung der Singulärwerte einer Matrix. Ist A K m × n {\displaystyle A\in {\mathbb {K} }^{m\times n}} eine (nicht notwendigerweise quadratische) Matrix mit aufsteigend sortierten Singulärwerten σ 1 σ min { m , n } {\displaystyle \sigma _{1}\leq \ldots \leq \sigma _{\min\{m,n\}}} und bezeichnet {\displaystyle \|\cdot \|} die euklidische Norm, dann hat der i {\displaystyle i} -te Singulärwert von A {\displaystyle A} die Darstellung

σ i = min X X i max x X x = 1 A x = max X X n i + 1 min x X x = 1 A x {\displaystyle \sigma _{i}=\min _{X\in X_{i}}\max _{x\in X \atop \|x\|=1}\|Ax\|=\max _{X\in X_{n-i+1}}\min _{x\in X \atop \|x\|=1}\|Ax\|} ,

wobei X i {\displaystyle X_{i}} wieder die Menge der i {\displaystyle i} -dimensionalen Untervektorräume von K n {\displaystyle {\mathbb {K} }^{n}} ist. Dieses Resultat folgt aus dem Satz von Courant-Fischer über die Darstellung der Singulärwerte von A {\displaystyle A} als Wurzeln der Eigenwerte von A H A {\displaystyle A^{H}A} beziehungsweise A A H {\displaystyle AA^{H}} .[3]

Verallgemeinerungen dieser Aussage existieren auch zur Darstellung des Spektrums selbstadjungierter Operatoren auf Hilberträumen, was zum Beispiel beim Rayleigh-Ritz-Prinzip eingesetzt wird.

Siehe auch

Literatur

  • Harry Dym: Linear Algebra in Action. 2. Auflage. American Mathematical Society, 2013, ISBN 978-1-4704-0908-1. 
  • Roger A. Horn: Topics in Matrix Analysis. Cambridge University Press, 1994, ISBN 0-521-46713-6. 
  • Robert Schaback, Holger Wendland: Numerische Mathematik. Springer, 2006, ISBN 978-3-540-26705-8. 

Originalarbeiten

  • Ernst Fischer: Über quadratische Formen mit reellen Koeffizienten. In: Monatshefte für Mathematik und Physik. Band 16, 1905, S. 234–249. 
  • Richard Courant: Über die Eigenwerte bei den Differentialgleichungen der mathematischen Physik. In: Mathematische Zeitschrift. Band 7, Nr. 1–4, 1920, S. 1–57. 

Einzelnachweise

  1. a b Harry Dym: Linear Algebra in Action. 2. Auflage. American Mathematical Society, 2013, S. 224–225. 
  2. Robert Schaback, Holger Wendland: Numerische Mathematik. Springer, 2006, S. 270. 
  3. Roger A. Horn: Topics in Matrix Analysis. Cambridge University Press, 1994, S. 148.