Logarytm macierzy

Logarytm macierzy – inna macierz taka, że wykładnicza macierz drugiej macierzy jest równa oryginalnej macierzy. A zatem jest to uogólnienie logarytmu skalarnego,a w pewnym sensie także odwrotna funkcja macierzy wykładniczej. Nie wszystkie macierze mają logarytm i te macierze, które posiadają logarytm, mogą mieć więcej niż jeden logarytm. Badanie logarytmów macierzy prowadzi do teorii Liego. Od kiedy macierz ma logarytm, jest w grupie Liego i logarytm jest odpowiednim elementem algebry Liego.

Definicja

Wykładnicza forma macierzy A {\displaystyle A} jest określona:

e A n = 0 A n n ! . {\displaystyle e^{\mathbf {A} }\equiv \sum _{n=0}^{\infty }{\frac {\mathbf {A} ^{n}}{n!}}.}

Biorąc pod uwagę macierz B , {\displaystyle B,} macierz A {\displaystyle A} jest logarytmem macierzy B , {\displaystyle B,} jeżeli e A = B . {\displaystyle e^{\mathbf {A} }=B.} Często logarytmy matrycy nie są unikatowe, tak jak logarytmy liczb zespolonych, co wyjaśniono poniżej.

Przykład: Logarytm obrotów w płaszczyźnie

Obroty w płaszczyźnie to prosty przykład. Obrót kąta α {\displaystyle \alpha } wokół macierzy jest reprezentowany przez macierz 2 × 2 {\displaystyle 2\times 2}

A = ( cos ( α ) sin ( α ) sin ( α ) cos ( α ) ) . {\displaystyle A={\begin{pmatrix}\cos(\alpha )-\sin(\alpha )\\\sin(\alpha )\cos(\alpha )\end{pmatrix}}.}

Dla każdej liczby naturalnej n , {\displaystyle n,} macierz

B n = ( α + 2 π n ) ( 0 1 1 0 ) , {\displaystyle B_{n}=(\alpha +2\pi n){\begin{pmatrix}0&-1\\1&0\end{pmatrix}},}

to logarytm macierzy A . {\displaystyle A.} Zatem macierz A {\displaystyle A} ma nieskończenie wiele logarytmów. To wynika z tego, że kąt obrotu jest ustalony tylko do wielokrotności 2 π . {\displaystyle 2\pi .}

W języku teorii Liego obroty macierzy A {\displaystyle A} są elementami grupy Liego SO(2). Odpowiadające im logarytmy B są elementami algebry Liego SO(2), która składa się z wszystkich macierzy skośno-symetrycznych.

Macierz

( 0 1 1 0 ) {\displaystyle {\begin{pmatrix}0&1\\-1&0\end{pmatrix}}}

jest generatorem algebry Liego SO(2).

Czy istnieje?

Pytanie, czy macierz ma logarytm ma najprostszą odpowiedź, gdy rozpatrywana jest w złożonej konfiguracji. Macierz ma logarytm wtedy i tylko wtedy, gdy jest odwracalna. Logarytm nie jest wyjątkowy, ale jeśli matryca nie ma negatywnych rzeczywistych wartości własnych, to ma wyjątkowy logarytm, którego wartości własne zawierają się w klamrze: { z C . | π < Im z < π } . {\displaystyle \{z\in C.|-\pi <\operatorname {Im} z<\pi \}.} Ten logarytm jest znany jako logarytm główny.

Odpowiedź jest bardziej zagmatwana w rzeczywistym otoczeniu. Rzeczywista matryca ma prawdziwa logarytm wtedy i tylko wtedy, gdy jest odwracalna, a każdy blok Jordana należący do ujemnej wartości własnej występuje parzystą liczbę razy. Jeśli odwracalna rzeczywista matryca nie spełnia warunku z bloków Jordana, to ma tylko logarytmy rzeczywiste. To można już zobaczyć w przypadku skalarnym: logarytm z 1 {\displaystyle -1} jest nierzeczywistą liczbą zespoloną. Istnienie logarytmów rzeczywistych macierzy rzeczywistych 2 × 2 {\displaystyle 2\times 2} matryc jest rozważane w dalszej części[potrzebny przypis].

Własności

Jeśli A {\displaystyle A} i B {\displaystyle B} są dodatnio określone oraz A {\displaystyle A} i B {\displaystyle B} są przemienne, czyli A B = B A , {\displaystyle AB=BA,} to

A B = e ln ( A ) + ln ( B ) . {\displaystyle AB=e^{\ln(A)+\ln(B)}.}

Dla każdej odwracalnej macierzy, A 1 = e ln ( A ) . {\displaystyle A^{-1}=e^{-\ln(A)}.}

Obliczanie logarytmu macierzy diagonalnej

Sposób znalezienia ln ( A ) {\displaystyle \ln(A)} diagonalnej macierzy A {\displaystyle A} jest następujący:

  • Znajdź macierz V {\displaystyle V} wektorów własnych A {\displaystyle A} (każda kolumna V {\displaystyle V} jest wektorem własnym A {\displaystyle A} ).
  • Znajdź odwrotność V 1 {\displaystyle V^{-1}} z V . {\displaystyle V.}
  • Niech A = V 1 A V . {\displaystyle A'=V^{-1}AV.}
  • Wtedy A {\displaystyle A'} będzie macierzą diagonalną, której elementy przekątnej są wartościami własnymi macierzy A . {\displaystyle A.}
  • Zamień każdy element przekątnej A {\displaystyle A} na jego logarytmu naturalny, w celu uzyskania ln A . {\displaystyle \ln A'.}
  • Wtedy ln A = V ( ln A ) V 1 . {\displaystyle \ln A=V(\ln A')V^{-1}.}

To, że logarytm A może być macierzą zespoloną, nawet jeśli A jest rzeczywiste, wynika z faktu, że macierz z pozytywnymi i rzeczywistymi wartościami może mieć negatywne lub nawet złożone wartości własne (dotyczy to przykładowo macierzy rotacji). Brak unikatowości logarytmu macierzy wynika z braku jednoznaczności logarytmu liczby zespolonej.

Obliczanie logarytmu niediagonalnej macierzy

Algorytm przedstawiony powyżej nie działa na niediagonalnych macierzach, takich jak

[ 1 1 0 1 ] . {\displaystyle {\begin{bmatrix}1&1\\0&1\end{bmatrix}}.}

Dla takich matryc trzeba znaleźć ich rozkład Jordana i, zamiast obliczania logarytmów elementów przekątnej jak wyżej, trzeba obliczyć logarytm bloków Jordana.

Ten ostatni jest tworzony, dzięki zauważeniu, że można napisać blok Jordan jako

B = ( λ 1 0 0 0 0 λ 1 0 0 0 0 λ 1 0 0 0 0 0 λ 1 0 0 0 0 0 λ ) = λ ( 1 λ 1 0 0 0 0 1 λ 1 0 0 0 0 1 λ 1 0 0 0 0 0 1 λ 1 0 0 0 0 0 1 ) = λ ( I + K ) {\displaystyle B={\begin{pmatrix}\lambda 1&0&0&\cdots &0\\0&\lambda 1&0&\cdots &0\\0&0&\lambda 1\cdots &0\\\vdots &\vdots &\vdots &\ddots &\ddots &\vdots \\0&0&0&0&\lambda 1\\0&0&0&0&0&\lambda \end{pmatrix}}=\lambda {\begin{pmatrix}1&\lambda ^{-1}&0&0&\cdots &0\\0&1&\lambda ^{-1}&0&\cdots &0\\0&0&1&\lambda ^{-1}\cdots &0\\\vdots &\vdots &\vdots &\ddots &\ddots &\vdots \\0&0&0&0&1&\lambda ^{-1}\\0&0&0&0&0&1\end{pmatrix}}=\lambda (I+K)}

gdzie K {\displaystyle K} jest macierzą z zerami na i poniżej głównej przekątnej (liczba λ {\displaystyle \lambda } jest niezerowa z powodu założenia, że macierz którego logarytm próbuje się obliczyć jest odwracalna).

Następnie, dzięki rozwinięciu Mercatora

ln ( 1 + x ) = x x 2 2 + x 3 3 x 4 4 + {\displaystyle \ln(1+x)=x-{\frac {x^{2}}{2}}+{\frac {x^{3}}{3}}-{\frac {x^{4}}{4}}+\cdot }

staje się

ln B = ln ( λ ( I + K ) ) = ln ( λ I ) + ln ( I + K ) = ln ( λ ) I + K K 2 / 2 + K 3 / 3 K 4 / 4 + {\displaystyle \ln B=\ln(\lambda (I+K))=\ln(\lambda I)+\ln(I+K)=\ln(\lambda )I+K-K^{2}/2+K^{3}/3-K^{4}/4+\dots }

To rozwinięcie na ogół nie jest zbieżne dla każdej macierzy K , {\displaystyle K,} ponieważ nie jest zbieżne dla każdej liczby rzeczywistej z wartością bezwzględną większą od jedności, to jednak K {\displaystyle K} jest macierzą nilpotenta, tak więc cykl rzeczywiście ma skończoną liczbę wyrazów ( K m {\displaystyle K^{m}} jest równe zero, jeśli jest wymiarem k {\displaystyle k} ).

Stosując to odkrycie, otrzymujemy

ln [ 1 1 0 1 ] = [ 0 1 0 0 ] . {\displaystyle \ln {\begin{bmatrix}1&1\\0&1\end{bmatrix}}={\begin{bmatrix}0&1\\0&0\end{bmatrix}}.}

Funkcjonalna analiza perspektywiczna

Kwadratowa macierz reprezentuje operator liniowy na przestrzeni euklidesowej R n , {\displaystyle R^{n},} gdzie n {\displaystyle n} jest wymiarem macierzy. Ponieważ taka przestrzeń jest skończenie wymiarowa, operator ten jest faktycznie ograniczony[potrzebny przypis].

Korzystanie z narzędzi holomorficznego rachunku funkcyjnego, biorąc pod uwagę funkcję holomorficzną f ( z ) , {\displaystyle f(z),} określoną na zbiorze otwartym w płaszczyźnie zespolonej i ograniczony operator liniowy T {\displaystyle T} można obliczyć f ( t ) {\displaystyle f(t)} tak długo, jak f ( z ) {\displaystyle f(z)} jest określona na Widmie T . {\displaystyle T.}

Funkcja F ( z ) = ln ( z ) {\displaystyle F(z)=\ln(z)} może być zdefiniowana w dowolnym prostym połączonym zbiorze otwartym w płaszczyźnie zespolonej nie zawierającej początku i jest holomorficzny w takiej domenie. Oznacza to, że można określić ln ( T ) , {\displaystyle \ln(T),} pod warunkiem, że widmo T {\displaystyle T} nie zawiera początku i istnieje ścieżka począwszy od środka do nieskończoności nie przekraczająca spektrum T {\displaystyle T} (na przykład, w przypadku widma z T , {\displaystyle T,} którym jest koło z początkiem wewnątrz koła, jest możliwe określenie ln ( T ) {\displaystyle \ln(T)} ).

Powracając do konkretnego przypadku przestrzeni euklidesowej, widmo operatora liniowego na tej przestrzeni jest zbiorem wartości jej własnych macierzy i jest skończonym zbiorem. Dopóki początek nie jest w widmie (matryca jest odwracalna), jedna macierz wyraźnie spełnia warunek z poprzedniego paragrafu, a w związku z tym oznacza, że teoria ln ( T ) {\displaystyle \ln(T)} jest dobrze zdefiniowana. Brak wyjątkowości logarytmu matrycy, wynika z faktu, że można wybrać więcej niż jedną gałąź logarytmu, która jest zdefiniowana w zbiorze wartości własnych macierzy[potrzebny przypis].

Bibliografia

  • Gantmacher, Felix R.(1959) Teoria matryc 1, Nowy York, Chelsea, s. 239–241.
  • Culver, Walter J. (1966), O istnieniu i unikatowości rzeczywistych logarytmów macierzy, „Proceedings of the American Mathematical Society” 17 (5): s. 1146–1151, doi:10.1090/S0002-9939-1966-0202740-6, ISSN 0002-9939.
  • Higham, Nicholas (2008), Functions of Matrices. Theory and Computation, SIAM, ISBN 978-0-89871-646-7.
  • Engo, Kenth (June 2001), On the BCH-formula in so(3), „BIT Numerical Mathematics” 41 (3): 629-632, doi: 10.1023/A:1021979515229, ISSN 0006-3835.
  • p
  • d
  • e
Niektóre
typy macierzy
Cechy niezależne
od bazy
Cechy zależne
od bazy
Operacje
na macierzach
jednoargumentowe
dwuargumentowe
Niezmienniki
liczbowe
inne
Inne pojęcia