Frobenius-Normalform

Die Frobenius-Normalform (nach Ferdinand Georg Frobenius) oder rationale Normalform einer quadratischen Matrix <math>A</math> mit Einträgen in einem beliebigen Körper <math>K</math> ist eine transformierte Matrix <math>T^{-1}AT</math> (mit invertierbarer Matrix <math>T</math>), die eine spezielle übersichtliche Form hat. „Übersichtlich“ deswegen, weil sich jede Matrix in genau eine Matrix dieser Form transformieren lässt und sich zwei Matrizen daher genau dann ineinander transformieren lassen, wenn sie dieselbe Frobenius-Normalform haben. Wenn das der Fall ist, sagt man auch, die zwei Matrizen seien sich ähnlich, weil sie dieselbe lineare Abbildung bezüglich unterschiedlicher Basen darstellen. Zu jeder linearen Abbildung eines endlichdimensionalen Vektorraums in sich gibt es daher eine Basis, bezüglich welcher sie in Frobenius-Normalform dargestellt wird. Es kann mehrere solche Basen geben, die Transformationsmatrix <math>T</math> ist also nicht eindeutig bestimmt.

Die Frobenius-Normalform lässt sich einerseits als Alternative zur jordanschen Normalform auffassen (die ihrerseits eine Verallgemeinerung der Diagonalform ist), wobei nicht mehr vorausgesetzt werden muss, dass das charakteristische Polynom in Linearfaktoren zerfällt. Andererseits charakterisiert das Lemma von Frobenius zueinander ähnliche Matrizen durch die Elementarteiler ihrer charakteristischen Matrizen und liefert die Frobenius-Normalform als Normalform des Vektorraums unter der Operation eines Polynomrings.

Verallgemeinerung der Diagonalisierung

Wenn eine Matrix <math>A\in K^{n\times n}</math> diagonalisierbar ist, zerfällt ihr charakteristisches Polynom <math>f(x) = {\rm det}(xE-A)</math> in lauter Linearfaktoren <math>(x-\lambda_1)\cdot\ldots\cdot(x-\lambda_n)</math> mit Eigenwerten <math>\lambda_i\in K</math>. Die zugehörigen Eigenvektoren <math>v_i</math> mit <math>(A-\lambda_iE)v_i = 0</math> bilden eine Basis des Vektorraums <math>K^n</math>, in der jeder Basisvektor durch <math>A</math> auf ein Vielfaches von sich abgebildet wird.

Bei einer nicht diagonalisierbaren Matrix <math>A</math> sind nicht genügend Eigenvektoren für eine Basis vorhanden, oder das charakteristische Polynom <math>f = p_1\cdot \ldots\cdot p_l</math> zerfällt in irreduzible Faktoren <math>p_i</math>, die nicht alle Grad 1 haben. Zur Ermittlung der Frobenius-Normalform von <math>A</math> wird dann analog zum letzten Absatz eine Basis aus Vektoren gesucht, die von bestimmten Produkten der irreduziblen Faktoren <math>f_i(A) = p_{j_1}(A)\cdots p_{j_k}(A)</math> etc. zu null gemacht werden. Es zeigt sich, dass dies möglich ist und man schließlich eine Darstellung <math>f = f_1\cdot \ldots\cdot f_m</math> erhält, in der <math>f_1</math> Teiler von <math>f_2</math> ist, <math>f_2</math> Teiler von <math>f_3</math> usw. Zum Faktor <math>f_i(x) = x^d + a_{d-1}x^{d-1} + \cdots + a_0</math> gehören dabei die Basisvektoren <math>(v_i, Av_i, \ldots, A^{d-1}v_i)</math>, deren Teilraum wegen <math>f_i(A)v_i = 0 = (A^d + a_{d-1}A^{d-1} + \cdots + a_0E)v_i</math> von <math>A</math> in sich abgebildet wird und auf dem <math>A</math> bezüglich dieser Basisvektoren durch die Matrix

<math>B_{f_i} = \begin{pmatrix}&&&-a_0\\1&&&-a_1\\&\ddots&&\vdots\\&&1&-a_{d-1}\end{pmatrix}</math>

dargestellt wird (die nicht angegebenen Einträge in dieser sog. Begleitmatrix zum Polynom <math>f_i</math> sind 0). Der gesamte Vektorraum <math>K^n</math> zerfällt in solche <math>A</math>-invarianten Teilräume, und <math>A</math> lässt sich insgesamt durch die Blockdiagonalmatrix

<math>\begin{pmatrix}B_{f_1}&&\\&\ddots&\\&&B_{f_m}\end{pmatrix}</math>

darstellen. Sie ist die Frobenius-Normalform von <math>A</math>.

Ein Nachteil dabei ist, dass die Frobenius-Normalform einer Diagonalmatrix mit Eigenwerten 1 und 2 nicht Diagonalform hat, sondern

<math>B_{x^2-3x+2} = \begin{pmatrix}0&-2\\1&3\end{pmatrix}</math>

ist. Abhilfe schafft hier die Weierstraß-Normalform, in der die Begleitmatrix <math>B_{f_i}</math> in der Blockdiagonalmatrix ersetzt wird durch die Begleitmatrizen der Potenzen verschiedener irreduzibler Faktoren von <math>f_i</math>, also etwa durch

<math>\begin{pmatrix}B_{p_1^2}&\\&B_{p_2}\end{pmatrix},</math>

falls <math>f_i = p_1^2p_2</math> mit <math>p_1\ne p_2</math>. Eine Matrix ist genau dann diagonalisierbar, wenn alle diese Faktoren linear sind und keiner in zweiter oder höherer Potenz vorkommt; also ist dann auch ihre Weierstraß-Normalform eine Diagonalmatrix.

Lemma von Frobenius

Die Menge aller Polynome, das sind Ausdrücke der Form <math>h(x) = a_0 + a_1x + \cdots + a_dx^d</math>, mit Koeffizienten <math>a_i\in K</math>, bildet einen Ring, den sog. Polynomring <math>K[x]</math>. Wenn eine Matrix <math>A\in K^{n\times n}</math> vorgegeben ist, kann man ein Produkt aus Polynom <math>h\in K[x]</math> und Vektor <math>u\in K^n</math> definieren durch <math>h(x)\cdot u = h(A)\cdot u</math>, für das die erwarteten Assoziativ- und Distributivgesetze gelten. Man spricht von einer Operation des Polynomrings auf dem Vektorraum, durch die der Vektorraum <math>K^n</math> zu einem <math>K[x]</math>-Modul <math>\mathcal A</math> wird.

Nach Wahl einer Basis <math>(u_1,\ldots,u_n)</math> von <math>K^n</math> kann man einen <math>K[x]</math>-Modul-Isomorphismus <math>\beta\colon K[x]^n/M\to \mathcal A</math> angeben. Sein Definitionsbereich ist der Faktormodul von <math>K[x]^n</math> modulo <math>M=\langle xE-A\rangle</math>, wobei der Ausdruck in spitzen Klammern (in einer ad hoc gewählten Notation) das Erzeugnis der Spalten der charakteristischen Matrix <math>xE-A</math> bezeichnet. Dieser Isomorphismus überträgt die Operation des Polynomrings, d. h., <math>\beta(hg+M) = h\beta(g+M)</math> für <math>h\in K[x]</math>, <math>g\in K[x]^n</math>, und er ist definiert durch

<math>\beta(\begin{pmatrix}g_1\\ \vdots \\g_n\end{pmatrix}+M) = \sum_{i=1}^n g_i(A)u_i.</math>

Die charakteristische Matrix <math>xE-A \in K[x]^{n\times n}</math> mit Einträgen im Polynomring kann durch den Elementarteileralgorithmus in eine Matrix

<math>P(xE-A)Q = \begin{pmatrix}1&&&&&\\&\ddots&&&&\\&&1&&&\\&&&f_1&&\\&&&&\ddots&\\&&&&&f_m\end{pmatrix}</math>

mit invertierbaren <math>P,Q\in K[x]^{n\times n}</math> überführt werden, wobei <math>f_1</math> Teiler von <math>f_2</math> ist, <math>f_2</math> Teiler von <math>f_3</math> usw., und die Polynome <math>f_i</math> führenden Koeffizienten 1 haben. Diese Polynome heißen die Invariantenteiler der charakteristischen Matrix, die Potenzen der irreduziblen Faktoren der <math>f_i</math> heißen Elementarteiler, und <math>f=f_1\cdot\ldots\cdot f_m</math> ist das charakteristische Polynom von <math>A</math>, denn <math>f=\det(xE-A)=\det(P(xE-A)Q)</math> (die Determinante der charakteristischen Matrix ändert sich nicht bei Multiplikation mit den invertierbaren <math>P</math> und <math>Q</math>). <math>f_m</math> ist das Minimalpolynom von <math>A</math>.

Wegen der Invertierbarkeit von <math>P</math> und <math>Q</math> ist der <math>K[x]</math>-Modul <math>\mathcal A</math> nun nicht nur isomorph (nämlich durch <math>\beta</math>) zu <math>K[x]^n/\langle xE-A\rangle</math>, sondern auch isomorph zu <math>K[x]^n/\langle P(xE-A)Q\rangle</math>. Dieser Faktormodul zerfällt als direkte Summe <math>K[x]/(f_1) \oplus \cdots \oplus K[x]/(f_m)</math>; siehe auch den Satz über invariante Faktoren in endlich erzeugten Moduln über einem Hauptidealring. Die Operation des Polynoms <math>x</math> auf dem direkten Summanden <math>K[x]/(f_i)</math> wird durch die Begleitmatrix <math>B_{f_i}</math> dargestellt, wenn eine Basis <math>(v_i,x\cdot v_i,\ldots) = (v_i, Av_i,\ldots)</math> wie im vorigen Abschnitt gewählt wird, und für die Operation von <math>x</math> bzw. <math>A</math> auf dem ganzen Modul <math>\mathcal A</math> ergibt sich eine Darstellung durch die Frobenius-Normalform.

Ist eine weitere Matrix <math>A'\in K^{n\times n}</math> gegeben, so macht diese <math>K^n</math> zu einem weiteren <math>K[x]</math>-Modul <math>\mathcal A'</math>. Ein Isomorphismus <math>\gamma\colon\mathcal A\to \mathcal A'</math> muss die Operation von <math>K[x]</math> übertragen, also <math>\gamma\circ A=A'\circ\gamma</math>, was bedeutet, dass <math>A'</math> durch die Matrix von <math>\gamma</math> bzgl. der gewählten Basis <math>(u_1,\ldots,u_n)</math> in <math>A</math> transformiert wird. Ähnlichkeit von Matrizen <math>A</math> und <math>A'</math> ist demnach gleichbedeutend mit Isomorphie der zugehörigen <math>K[x]</math>-Moduln <math>\mathcal A</math> und <math>\mathcal A'</math>; und deren oben besprochene Zerlegung in invariante Faktoren hat gezeigt, dass diese Isomorphie genau dann vorliegt, wenn die charakteristischen Matrizen <math>xE-A</math> und <math>xE-A'</math> dieselben Elementarteiler haben. Diese Aussage ist als Lemma von Frobenius bekannt.

Als weitere Folgerung aus dem Gezeigten ergibt sich der Satz von Cayley-Hamilton: Die Operation des charakteristischen Polynoms <math>f</math> macht alle direkten Summanden <math>K[x]/(f_i)</math> zu null, weil alle <math>f_i</math> Teiler von <math>f</math> sind. Deswegen gilt <math>f(A) = 0</math>, d. h. jede quadratische Matrix ist Nullstelle ihres charakteristischen Polynoms.

Literatur

Falko Lorenz: Lineare Algebra II, 3. Auflage