19  Der Satz vom primitiven Element

Ein Porträt von Ferdinand Georg Frobenius (1849-1917).

Ferdinand Georg Frobenius (1849-1917) war ein deutscher Mathematiker. Er beschäftigte sich hauptsächlich mit der Theorie der Gruppen und ihrer Darstellungstheorie. Beispielweise bewies Frobenius 1878 den Satz von Cayley-Hamilton für Matrizen beliebiger Dimension.

19.1 Einfache Erweiterungen und primitive Elemente

  • Sei \(L/K\) eine Körpererweiterung. Wenn \(\exists\ a : L,\ L = K(a)\) gilt, heißt \(L/K\) eine einfache Erweiterung.
  • In dieser Definition ist \(a\) nicht unbedingt algebraisch über \(K\). Zum Beispiel definiert der Körper der rationalen Funktionen mit Koeffizienten in \(K\) eine einfache Erweiterung \(K(X)/K\).
  • Wir werden uns jedoch hautpsächlich für algebraischen Erweiterungen interessieren. Eine einfache algebraische Erweiterung erfüllt \(K(a) = K[a]\) und ist insbesondere eine endliche Erweiterung. Ein Element \(a\) mit \(L = K[a]\) wird primitives Element von \(L\) genannt und ist im Allgemeinen nicht eindeutig bestimmt.

19.2 Separable endliche Erweiterungen

  • Der Satz vom primitiven Element behauptet, dass jede separable endliche Erweiterung einfach ist.

  • Inbesondere ist jede endliche Erweiterung eines Körpers mit Charakteristik Null einfach. Auch so ist jede Erweiterung eines endlinchen Körpers. Der Grund dafür ist, dass Körper mit Charakteristik Null und endliche Körper vollkommene Körper sind: Jede algebraische Erweiterung eines solchen Körpers ist separabel.

    Satz vom primitiven Element. Sei \(L/K\) eine endliche Erweiterung (mit entscheidbarer Gleichheit). Ist \(L/K\) separabel, dann ist \(L/K\) einfach. Das heißt, existiert ein Element \(a : L\) mit \(L = K[a]\).

    Bemerkung. Da \(a\) ein Element von \(L\) ist, ist \(a\) separabel.

19.3 Beweis durch Induktion

  • Erinnern wir uns daran, dass eine endliche Erweiterung von \(K\), ein Körper \(L\) der Gestalt \(L = K[a_1,\ \ldots\ , a_n]\) ist, wobei jedes Element \(a_i : L\) algebraisch über \(K\) ist. Das heißt, \(L\) ist ein Körper, der eine endliche \(K\)-Algebra ist. Der Beweis des Satzes vom primitiven Element lautet durch Induktion auf \(n \geqslant 1\). Wenn \(L = K[x_1]\) , dann ist \(L\) einfach.

  • Nehmen wir nun an, dass, wenn \(L = K[a_1,\ \ldots\ , a_n]\) eine separable Erweiterung ist, dann auch \(a : L\) mit \(L = K[a]\) existiert, und betrachten wir eine separable Erweiterung der Gestalt \(L = K[x_1,\ \ldots\ , x_n, y]\). Sei \(M := K[x_1,\ \ldots\ , x_n] \subseteq L\). Dann gilt \(L = M[y]\) und, per Induktion, existiert \(x \in M\) sodass \(M = K[x]\), somit \(L = K [x, y]\). Es reicht daher den fogenden Satz zu zeigen.

    Satz. Sei \(K\) ein Körper mit entscheidbarer Gleichheit und sei \(M := K[x,y]\) mit \(x, y\) (algebraisch und) separabel über \(K\). Dann existiert \(a : M\), sodass \(M = K[a]\).

19.4 Eine Idee für den Beweis

  • Sei \(n := \dim_K K[x, y]\). Wie zuvor, nehmen wir eine Basis \((v_1,\ \ldots\ , v_n)\) für den \(K\)-Vektorraum \(K[x,y]\), und betrachten wir die Matrizen \(M_x, M_y : \text{Mat}(n \times n, K)\) der Multiplikation mit \(x\) und \(y\) in \(K[x, y]\). Insbesondere gilt \(M_x M_y = M_y M_x\).
  • Da \(x\) und \(y\) separabel sind, sind \(M_x\) und \(M_y\) gleichzeitig diagonalisierbar über einem geeigneten endlichen Erweiterung \(L_{x,y}\) des Körpers \(\mathbf{k}_{x,y}\) ist, wobei \(\mathbf{k}_{x,y} \subseteq K\) der kleinste Teilkörper ist, der die Koeffiziente der Matrizen \(M_x\) und \(M_y\) enthält.
  • Außerdem gilt, für jedes \(z : K[x,y]\) und jedes Polynom \(F : K[X,Y]\), dass \(z = F(x,y)\) äquivalent zu \(M_z = F(M_x, M_y)\) ist. Dies gilt insbesondere für alles \(F : \mathbf{k}_{x,y}[X,Y]\).
  • Dann ist die Idee die folgende: Wenn es ein \(c : \mathbf{k}_{x,y}\) und Polynome \(P, Q : \mathbf{k}_{x,y}[T]\) gibt, sodass \(P(M_x + c M_y) = M_x\) und \(Q(M_x + c M_y) = M_y\) sind, dann gilt \(x = P(x + cy)\) und \(y = Q(x + cy)\), somit \(K[x, y] = K[z]\). Daher ist \(z := x + cy\) ein primitives Element.

19.5 Kann diese Idee funktionieren?

  • Sei \(\lambda_i, \mu_i : L_{x,y}\) und \(A : \text{Mat}(n \times n, L_{x,y})\) mit \(A^{-1} M_x A = \text{Diag}(\lambda_1,\ \ldots\ , \lambda_n)\) und \(A^{-1} M_y A = N_y = \text{Diag}(\mu_1,\ \ldots\ , \mu_n)\).
  • Wir möchten eine diagonale Matrix \(\text{Diag}(\xi_1,\ \ldots\ , \xi_n)\) und Polynome \(P, Q : L_{x,y}[T]\) konstruieren, sodass, für jedes \(i \{1,\ \ldots\ , n\}\), \(P(\xi_i) = \lambda_i\) und \(Q(\xi_i) = \mu_i\) .
  • Dank des Newton-Lagrange Interpolationspolynom, genügt es \((\xi_i)_{1 \leqslant n}\) mit der folgenden Eigenschaft zu definieren: \(\forall\ i, j,\ \big( (\lambda_i \not= \lambda_j \Rightarrow \xi_i \not= \xi_j) \wedge (\mu_i \not= \mu_j \Rightarrow \xi_i \not= \xi_j) \big)\) .
  • Wenn wir nach \(\xi_i\) in der Form \(\xi_i := \lambda_i + c \mu_i\) mit \(c \in \mathbf{k}_{x,y}\) suchen, bemerken wir, dass \[(\lambda_i + c \mu_i = \lambda_j + c \mu_j) \wedge (\mu_i \not= \mu_j) \Rightarrow c = \textstyle \frac{\lambda_j - \lambda_i}{\mu_i - \mu_j}\ .\]
  • Es folgt daraus, dass, wenn \(c \not= \frac{\lambda_j - \lambda_i}{\mu_i - \mu_j}\) ist, dann auch \(\mu_i \not= \mu_j \Rightarrow \lambda_i + c \mu_i \not= \lambda_j + c \mu_j\) gilt, somit \(\lambda_i \not= \lambda_j \Rightarrow \lambda_i + c \mu_i \not= \lambda_j + c \mu_j\) (weil \(\lambda_i + c \mu_i = \lambda_j + c \mu_j \Rightarrow \mu_i = \mu_j \vee c = \frac{\lambda_j - \lambda_i}{\mu_i - \mu_j}\)).

19.6 Körper, die groß genug sind

  • Für die vorherige Idee zu funktionieren, reicht es daher ein Element \(c \in \mathbf{k}_{x,y}\) zu finden, sodass \(\forall\ i, j \in \{1,\ \ldots\ , n\},\ c \not= \textstyle\frac{\lambda_i - \lambda_j}{\mu_i - \mu_j}~.\)
  • Dies gilt, wenn \(\mathbf{k}_{x,y}\) mehr als \(\frac{n(n-1)}{2}\) Elemente hat. Zum Beispiel wird das unbedingt gelten, wenn \(K\) Charakteristik Null hat (oder einfach, wenn \(K\) unendlich ist).
  • Dann finden wir Polynome \(P, Q : L_{x,y}[T]\), sodass \(P(M_x + c M_y) = M_x\) und \(Q(M_x + c M_y) = M_y\) sind. Da die Matrizen \(M_x\) und \(M_y\) , somit auch \(M_z := M_x + c M_y\) , Koeffizienten in \(\mathbf{k}_{x,y}\) haben (weil \(c\) zu \(\mathbf{k}_{x,y}\) gehört!), können wir sogar annehmen, dass \(P\) und \(Q\) Polynome mit Koeffizienten in \(\mathbf{k}_{x,y}\) sind (eine Übung, die nicht so einfach ist).
  • Per Definition ist \(M_z := M_x + c M_y\) diagonalisierbar über \(L_{x,y}\) und gilt, für dasselbe Matrix \(A\) wie zuvor \(A^{-1} M_z A = \text{Diag}(\xi_1,\ \ldots\ , \xi_n)\). Auch ist \(M_z\) die Matrix der Multiplikation mit \(z := x +cy\) im \(K\)-Vektorraum \(K[x,y]\).

19.7 Was passiert mit Körper, die nicht groß genug sind?

  • Der vorherige Beweis ist nicht mehr gültig: Ohne die Eigenschaft, dass \(\xi_i \not= \xi_j\) ist, können wir im Allgemeinen das Newton-Lagrange Interpolationspolynom nicht verwenden, um ein Polynom \(P\) mit \(\forall\ i,\ P(\xi_i) = \lambda_i\) zu bauen.

  • Der Rest des Beweises ist dann wie folgt aufgebaut:

    1. Im Fall, in dem der Körper \(\mathbf{k}_{x,y}\) endlich ist, zeigen wir mit einer anderen Methode, dass es ein Element \(z : \mathbf{k}_{x, y}[x, y]\) und geeignete Polynome \(P, Q : \mathbf{k}_{x,y}[T]\) gibt, sodass \(P(z) = x\) und \(Q(z) = y\) sind. Da \(\mathbf{k}_{x, y} \subseteq K\) ist, gilt \(K[x,y] = K[z]\).
    2. Abschließend zeigen wir, dass die beiden bereits betrachteten Fälle ausreichen, um eine Schlussfolgerung zu ziehen. Genauer gesagt, werden wir zeigen, dass, in unserer Situation, die folgende (nicht ausschließliche) Disjunktion gilt: \[\big(\mathbf{k}_{x,y}\ \text{hat mehr als}\ \textstyle\frac{n(n-1)}{2}\ \text{Elemente, wobei}\ n := \dim_K K[x,y] \big) \vee \big(\mathbf{k}_{x,y}\ \text{endlich}\big).\]

19.8 Endliche Körper

  • Nehmen wir nun an, dass der Körper \(\mathbf{k}_{x,y}\) endlich ist, und zeigen wir, dass es ein Element \(z : \mathbf{k}_{x, y}[x, y]\) und geeignete Polynome \(P, Q : \mathbf{k}_{x,y}[T]\) gibt, sodass \(P(z) = x\) und \(Q(z) = y\) sind. Dazu reicht es zu zeigen, dass \(\mathbf{k}_{x,y}[x,y] = \mathbf{k}_{x,y}[z]\) gilt.

  • Bemerken wir, dass die Algebra \(M := \mathbf{k}_{x,y}[x,y]\) ein Körper ist, weil \(x\) und \(y\) algebraisch über \(\mathbf{k}_{x,y}\) sind. Dann ist die Idee, die Gruppe \(G := \{ a : M\ /\ a \not= 0_M\}\) (mit der Multiplikation von \(M\) als Verknüpfung) zu betrachten. Da \(M\) endlich ist, so auch ist \(G\).

    Lemma. Sei \(M\) ein Körper (nicht unbedingt endlich aber mit entscheidbarer Gleichheit) und sei \(G \subseteq M^\times\) eine Untergruppe von \(M^\times = M \setminus\{0_M\}\). Ist \(G\) endlich, dann ist \(G\) eine zyklische Gruppe. Das heißt, es gibt \(a : M\) und \(N : \mathbb{N}_{>0}\), sodass \(G = \{1_M, a,\ \ldots\ , a^{N-1} \}\) gilt.

19.9 Verwendung des Lemmas

  • In unserer Situation ist die Gruppe \(G := \mathbf{k}_{x,y}[x,y]^{\times}\) endlich, somit auch endlich. Daher existieren \(z : \mathbf{k}_{x,y}[x,y]\) und \(N : \mathbb{N}_{>0}\) , sodass \(\mathbf{k}_{x,y}[x,y]^{\times} = \{1_{\mathbf{k}_{x,y}}, z,\ \ldots\ , z^{N-1}\}\) gilt.
  • Folgt daraus, dass \[\mathbf{k}_{x,y}[x,y] = \big\{0_{\mathbf{k}_{x,y}}, 1_{\mathbf{k}_{x,y}}, z,\ \ldots\ , z^{N - 1}\big\} \subseteq \mathbf{k}_{x,y}[z] \subseteq \mathbf{k}_{x,y}[x,y]\] somit auch \(\mathbf{k}_{x,y}[x,y] = \mathbf{k}_{x,y}[z]\) gilt. Hiermit ist der Beweis des ersten Schritts unseres Ansatzes zum Satz vom primitiven Element abgeschlossen.
  • Bemerkung. Unter dem SAD können wir das vorherige Lemma auf \(M = \mathbb{C}\) anwenden. In diesem Fall, zeigt das Lemma, dass jede endliche Untergruppe \(G\) von \(\mathbb{C}^\times\) aus Einheitswurzeln besteht: \[G = \left\{1_{\mathbb{C}}, e^{i\frac{2\pi}{N}},\ \ldots\ , e^{i(N-1)\frac{2\pi}{N}} \right\}~.\]

19.10 Beweis des Lemmas

  • Sei \(x, y : G\). Da \(G\) endlich ist, haben \(x\) und \(y\) endliche Ordnung. Seien \(m := \text{Ord}_G(x)\) und \(n := \text{Ord}_G(y)\), und sei \(q := kgV(m,n)\) das kleinste gemeinsame Vielfache von \(m\) und \(n\). Insbesondere gilt \(x^q = 1_M\) und \(y^q = 1_M\).
  • Wir können \(q\) als \(q = ab\) schreiben, mit \(a\ |\ n\) , \(b\ |\ m\) und \(ggT(a,b) = 1\). Beweis. Man schreibt \(m = \displaystyle \prod_{p\ :\ \mathbf{P}} p ^ {\nu_p(m)}\) , \(n = \displaystyle \prod_{p\ :\ \mathbf{P}} p ^ {\nu_p(n)}\) , \(q = \displaystyle \prod_{p\ :\ \mathbf{P}} p ^ {\max(\nu_p(m), \nu_p(n))}\), und setzt: \[ a := \prod_{p\ |\ \nu_p(m) < \nu_p(n)} p^{\nu_p(n)}\ \text{und}\ b := \prod_{p\ |\ \nu_p(m) \geqslant \nu_p(n)} p^{\nu_p(m)}, \]
  • Dann gilt \((x^a y^b)^q = (x^q)^a (y^q)b = 1_M\). Zeigen wir nun, dass \(x^a y^b\) Ordnung \(q\) hat.
  • Wenn \((x^a y^b)^i = 1_M\) ist, dann gilt \(x^{ia} = y^{-ib}\), somit \((x^{ia})^a = y^{-iab} = (y^q)^{-i} = 1_M\). Da \(m = \text{Ord}_G(x)\) ist, folgt daraus, dass \(m\ |\ ia^2\), somit \(b\ |\ i a^2\) (denn \(b\ |\ m\)). Aus \(ggT(a,b) = 1\) folgt dann, dass \(b\ |\ i\). In ähnlicher Weise, gilt \(a\ |\ i\) und, aus \(ggT(a,b) = 1\), folgt \(q = ab\ |\ i\) .

19.11 Ende des Beweises des Lemmas

  • Dann hat jedes \(x^a y^b\) Ordung \(q = kgV(m,n)\), wobei \(m := \text{Ord}_G(x)\) und \(n := \text{Ord}_G(y)\).
  • Setzen wir dann \(N := \max_{g\ :\ G} \text{Ord}_G(g)\) und sei \(x\) ein Element von \(G\) mit Ordnung \(N\).
  • Sei \(y : G\) ein beliebiges Element von \(G\) und sei \(s := \text{Ord}_G(y)\). Da \(xy\) Ordnung \(q := kgV(N,s)\) hat, muss (per Maximalität) \(N = kgV(N,s)\) sein. Das heißt, \(s\ |\ N\) und \(y^N = 1_M\) (für alles \(y : G\)). Das heißt, jedes \(y : G\) ist eine Wurzel von \(P := T^N -1_M\). Bemerkung. Wir haben bewiesen, dass jedes Element einer endlichen Gruppe \(G \subset M^\times\) eine Einheitwurzel in \(M\) ist, deren Ordnung ein Teiler von \(N := \max_{g\ :\ G} \text{Ord}_G(g)\) ist.
  • Da das Polynom \(P : M[T]\) hochstens \(N\) verschiedene Wurzeln in \(M\) hat, und alle Elemente in der Teilmenge \(\{1_M, x,\ \ldots\ , x^{N-1} \} \subseteq M\) (paarweise verschiedene) Wurzeln von \(P\) sind, muss jedes Element \(y : G\) zu dieser Teilmenge gehören. Das heißt, existiert ein \(k : \mathbb{N}\) mit \(y = x ^k\). Daher ist \(G = \left< x \right>\) (für jedes \(x\) mit Ordnung \(N\)) und ist \(G\) eine zyklische Gruppe.

19.12 Ende des Beweises des Satzes vom primitiven Element

  • Wir müssen noch einen Beweis für den zweiten Schritt unseres Ansatzes zum Satz vom primitiven Element geben.

  • Dazu genügt es, das folgende Lemma zu zeigen.

    Lemma. Sei \(M\) ein Körper mit entscheidbarer Gleichheit. Sei \(M_0 \subset M\) der Primkörper von \(M\). Nehmen wir an, dass \(M\) endlich erzeugt über \(M_0\) ist. Das heißt, \(M = M_0(x_1,\ \ldots\ , x_n)\) für geeignete Elemente \(x_1,\ \ldots\ , x_n : M\). Dann gilt die folgende Eigenschaft: \[\forall\ j : \mathbb{N}_{>0},\ \big(M\ \text{hat mehr als}\ j\ \text{Elemente} \big) \vee \big(M\ \text{endlich}\big).\]

  • Wenn wir den SAD verwenden, dann hat \(M\), für ein gegebenes \(j : \mathbb{N}_{>0}\) , entweder mehr als \(j\) Elemente oder weniger als \(j\) Elemente, sodass es nichts zu beweisen gibt 🌴 🍸 📻 . Außerdem ist die Annahme, dass \(M\) endlich erzeugt ist, unter dem SAD nicht notwendig.

19.13 Beweis für die vorherige Alternative

  • Sei \(j : \mathbb{N}_{> 0}\). Ohne den SAD können wir die folgende abstrakte Disjunktion über die Mächtigkeit von \(M\) im Allgemeinen nicht beweisen: \((|M| > j) \vee (|M| \leqslant j)\).

  • Wir können allerdings die Teilmenge \(\{0, 1_M, \ \ldots,\ j\} \subset M\) betrachten, wobei \(j = 1_M +\ \ldots\ + 1_M\) (\(j\)-mal). Dann ist die Eigenschaft, dass die Elemente dieser Teilmenge paarweise verschieden sind, entscheidbar.

    • Wenn diese Eigenschaft gilt, besistzt der Körper \(M\) mindestens \(j+1\) Elemente.
    • Nehmen wir nun an, dass diese Eigenschaft nicht gilt. Dann muss der Körper endlich Charackteristik (\(p \leqslant j\)) haben. In diesem Fall ist der Primkörper \(M_0\) endlich (isomorph zu \(\mathbb{Z}/p\mathbb{Z}\)). Unten werden wir diese Situation weiter analysieren.

19.14 Fortführung des Beweises

  • Da \(M\) endlich erzeugt über \(M_0\) ist, existieren Elemente \(x_1,\ \ldots\ , x_n\) in \(M\), sodass \(M = M_0(x_1,\ \ldots\ , x_n)\) gilt. Dies bedeutet, dass jedes Element \(x : M\) der Gestalt \(x = F(x_1,\ \ldots\ , x_n)\) ist, mit \(M_0\) endlich (\(M \simeq \mathbb{Z}/p\mathbb{Z}\)) und \(F : M_0[X_1,\ \ldots\ , X_n]\).

  • Erinnern wir uns an die Frage, die ist, ob \(M\) mehr als \(j\) Elemente hat, oder endlich ist.

  • Sei \(S \subseteq M_0[X_1,\ \ldots\ , X_n]\) die Teilmenge aller Polynomen \(F\) mit \(\forall\ i,\ \deg_{X_i} F \leqslant j\) und sei \(\overline{S} \subseteq M\) die Teilmenge aller Elementen \(x : M\), für die ein \(F \in S\) existiert, sodass \(x = F(x_1,\ \ldots\ , x_n)\) ist. Da \(M_0\) endlich ist, so auch sind \(S\) und \(\overline{S}\).

  • Sei \(q := |\overline{S}|\) die Mächtigkeit von \(\overline{S}\). Dann gilt \((q > j) \vee (q \leqslant j)\) in \(\mathbb{N}_{>0}\).

    • Wenn \(q > j\) ist, hat \(M\) mehr als \(j\) Elemente .
    • Es bleibt noch der Fall zu analysieren, in dem \(q \leqslant j\) ist.

19.15 Ende des Beweises

  • Wir werden zeigen, dass, wenn \(|\overline{S}| \leqslant j\), dann auch gilt, dass für alles \(F : M_0[X_1,\ \ldots\ , X_n],\) ein \(G \in S\) mit \(F(x_1,\ \ldots\ , x_n) = G(x_1,\ \ldots\ , x_n)\) existiert. Da \(S\) endlich ist, impliziert dies, dass \(M\) endlich ist.
  • Schreiben wir \(\displaystyle F(X_1,\ \ldots\ ,X_n) = \sum_{(i_1,\ \ldots\ , i_n)} a_{i_1\ \ldots\ i_n} X_1^{i_1}\ \ldots\ X_n^{i_n}\) (wobei \(\forall\ k,\ i_k \leqslant j\)). Dann gilt \[F(x_1,\ \ldots\ , x_n) = \sum_{(i_1,\ \ldots\ , i_n)} a_{i_1\ \ldots\ i_n} x_1^{i_1}\ \ldots\ x_n^{i_n}\ \text{in}\ M.\]
  • Gilt auch, für alles \(k\), \((x_k = 0_M) \vee (x_k \not= 0_M)\) in \(M\). Wenn \(x_k = 0_M\) ist, gilt \(x_k^{i_k} = x_k^{i'_k}\), wobei \(i'_k := 1 \leqslant j\) ist. Wenn \(x_k \not= 0_M\), betrachten wir die Teilmenge \(\{1_M, x_k,\ \ldots\ , x_k^j\} \subseteq \overline{S}\). Da \(|\overline{S}| \leqslant j\) ist, muss mindestens zwei Elemente dieser Menge gleich sein. Daher hat \(x_k\) Ordnung \(j' \leqslant j\) in \(M^\times\) und gilt \(x_k^{i_k} = x_k^{i'_k}\), wobei \(i'_k := (i_k\ \text{mod}\ j') < j\). Folgt daraus, mit \(G := \sum_{(i_1,\ \ldots\ , i_n)} a_{i_1\ \ldots\ i_n} X_1^{i'_1}\ \ldots\ X_n^{i'_n}\), dass \(G \in S\) und \(F(x_1,\ \ldots\ , x_n) = G(x_1,\ \ldots\ , x_n)\) ist.

19.16 Bemerkungen zum Beweis des Lemmas

  • Die Annahme, dass \(M\) ein Körper ist, der endlich erzeugt über seinem Primkörper \(M_0\) ist, ist in unserer Situation erfüllt. Nämlich ist der Körper \(\mathbf{k}_{x,y}\) endlich erzeugt über \(K_0\) (der Primkörper von \(K\)), weil \(\mathbf{k}_{x,y} = K_0(a_{ij}, b_{ij})\), wobei \((a_{ij})_{1 \leqslant i, j \leqslant n}\) und \((a_{ij})_{1 \leqslant i, j \leqslant n}\) die Koeffizienten der Matrizen \(M_x\) und \(M_y\) sind. Dann, im Beweis des Satzes vom primitiven Element, wenden wir das Lemma mit \(j := \frac{n(n-1)}{2}\), wobei \(n := \dim_K K[x,y]\).
  • In diesem Fall behauptet das Lemma, dass entweder \(\mathbf{k}_{x,y}\) mehr als \(\frac{n(n-1)}{2}\) Elemente hat, oder \(\mathbf{k}_{x,y}\) endlich ist. In beiden Fällen ist der Beweis des Satzes über primitive Elemente uns bekannt.
  • Formell bedeutet der Ausdruck \(M\) hat mehr als \(j\) Elemente”, dass eine Teilmenge \(A \subseteq M\) existiert, der endlich ist, und \(|A| > j\) erfüllt. Daraus folgt, dass es für jedes \(B \subseteq M\) mit \(|B| \leqslant j\) ein Element \(a : M\) gibt, sodass \(a \in A \wedge a \notin B\).

19.17 Bemerkungen zum Beweis des Satzes vom primitiven Element

  • Im Prinzip berechnet der Beweis ein explizites primitives Element z, sodass \(K[x,y] = K[z]\) gilt.
  • In diesem Beweis sagen wir niemals, dass \((K\ \text{endlich}) \vee (K\ \text{unendlich})\) gilt, noch dass \(\text{Char}(K) = 0 \vee \text{Char}(K) > 0\) gilt. Um eines dieser beiden Ergebnisse für einen beliebigen Körper \(K\) zu beweisen, muss man den SAD verwenden.

19.18 Separabilität in positiver Charakteristik

  • In Charakeristik Null ist jede algebraische Erweiterung separabel (vollkommener Körper). Das ist auch der Fall für endliche Körper (zugelassen).

  • Was können wir über unendliche Körper positiver Charakteristik sagen? Zum Beispiel, wann ist eine algebraische Erweiterung von \(K = \mathbb{F}_p(T)\) separabel, wobei \(\mathbb{F}_p := \mathbb{Z}/p\mathbb{Z}\) ?

    Satz. Sei \(K\) ein Körper mit der Charakteristik \(p > 0\). Sei \(L\) eine Körpererweiterung von \(K\) und sei \(a : L\) ein Element von \(L\). Dann gilt:

    1. Ist \(a\) separabel über \(K\), dann gilt, \(\forall\ n : \mathbb{N}_{>0}\), \(a \in K[a^q]\), wobei \(q := p^n\).
    2. Existiert \(n : \mathbb{N}_{>0}\) sodass \(a \in K[a^q]\) für \(q := p^n\), dann ist \(a\) separabel über \(K\).

19.19 Potenzen, deren Exponent eine Potenz der Charakteristik ist

  • Zeigen wir zunächst (ii). Sei \(a : L\) und \(n : \mathbb{N}_{>0}\), sodass \(a \in K[a^q] \subseteq L\) gilt, mit \(q := p^n\). Wir möchten zeigen, dass \(a\) separabel ist.
  • Die Bedingung \(a \in K[a^q]\) bedeutet, dass ein \(P : K[X]\) existiert, mit \(a = P(a^q)\). Daher ist \(a\) eine Wurzel von \(Q(X) := X - P(X^q) = X - \sum_j a_j (X^q)^j\) . Da \(q \cdot 1_K = 0_K\), gilt \(Q' = 1 - \sum_j a_j (qj) X^{qj -1} = 1\). Inbesondere gilt \(\left< Q, Q'\right> = \left< 1_{K[X]}\right>\). Das heißt, \(Q\) ist separabel.
  • Dies genügt, um zu beweisen, dass \(a\) separabel ist.

19.20 Separable Elemente in positiver Charakteristik

  • Zeigen wir nun (i). Sei \(a : L\) und nehmen wir an, dass \(a\) separabel über \(K\) ist. Sei \(n : \mathbb{N}_{>0}\) und sei \(q := p^n\) (wobei \(p = \text{Char}(K) > 0\)). Wir werden zeigen, dass \(a \in K[a^q] \subseteq L\).
  • Sei \(P_a : K[X]\) das Minimalpolynom von \(a\) und sei \(M_a\) der Körper \(M_a := K[X]\ / \left< P_a \right>\). Sei \(b := X\ \text{mod}\ P_a\) die Klasse von \(X\) in \(M_a\).
  • Es reicht zu zeigen, dass \(b \in K[b^q] \subseteq M_a\), weil in diesem Fall, gilt \(b = Q(b^q)\) für geeignetes \(Q : K[X]\), somit \(X = Q(X^q) + P(X) R(X)\) für geeignetes \(R : K[X]\). Daher gilt \(a = Q(a^q) + P(q) R(a) = Q(a^q)\).
  • Da \(b\) algebraisch über \(K \subseteq M_a\) ist, ist \(K[b]\) ein endlich-dimensional \(K\)-Vektorraum. Sei \(n := \dim_K K[b]\) und sei \(B\) die Matrix, in einer beliebigen Basis, der Multiplikation mit \(b\) in \(K[b]\). Da \(M_a \simeq K[a]\) eine separable Erweiterung von \(K\) ist, ist \(b\) separabel über \(K\). Deswegen ist \(B\) diagonalisierbar über einem geeigneten Körper \(L_b\). Wir werden unten zeigen, dass ein \(Q : K[X]\) existiert, mit \(B = Q(B^q)\).

19.21 Frobeniushomomorphismus

  • Sei \(R\) ein kommutativer unitärer Ring mit der Charakteristik \(p\), wobei \(p\) eine Primzahl ist.
  • Sei \(n : \mathbb{N}_{>0}\) und sei \(q := p^n\). Dann ist die Abbildung \(F : R \to R\), die durch \(x \mapsto x^q\) definiert wird, ein Ringhomomorphismus. Da die Eigenschaften \(F(1_R) = 1_R\) und \(F(xy) = (xy)^q = x^q y^q = F(x) F(y)\) unmittelbar sind, reicht es die Eigenschaft \(F(x+y) = (x+y)^q = x^q + y^q = F(x) + F(y)\) zu zeigen. Der Ausdruck „Fresh(wo)man’s dream“, der zur Beschreibung dieser Eigenschaft manchmal verwendet wird, ist abwertend und wir werden ihn nicht benutzen.
  • Der Beweis lautet durch Induktion auf \(n : \mathbb{N}_{> 0}\). Tatsächlich reicht es den Fall \(n = 1\) zu zeigen (Übung). In diesem Fall, gilt \((x + y)^p = \sum_{j=0}^p (^p_j) x^j y^{p-j}\). Da \(\forall j \in \{1,\ \ldots\ ,\ p-1\} \Rightarrow p\ |\ (^p_j)\) gilt, erreichen wir \((x + y)^p = x^p + y^p\).
  • Wenn \(n = 1\) heißt die Abbildung \(x \mapsto x^p\) der Frobeniusendomorphismus von \(R\).

19.22 Verwendung des Frobeniushomomorphismus

  • Nehmen wir an, dass wir eine diagonale Matrix \(B \sim \text{Diag}(\lambda_1,\ \ldots\ , \lambda_n)\) haben, mit \(\lambda_1,\ \ldots\ , \lambda_n \in L_b\). Wir möchten ein Polynom \(Q : L_b[X]\) bauen, sodass \(B = Q(B^q)\).
  • Da die Abbildung \(F(\lambda) := \lambda^q\) ein Ringhomomorphismus ist, ist diese Abbildung genau dann injektiv, wenn \(\text{Ker}\ F = \{0_{L_b}\}\). Das gilt aber unmittelbar, denn in einem Körper gilt die Eigenschaft \(x^q = 0_{L_b} \Rightarrow x = 0_{L_b}\). Bemerkung. Wenn \(L_b\) endlich ist, ist daher die injektive Abbildung \(F(\lambda) := \lambda^q\) auch surjektiv.
  • Daher gilt \(\lambda_i \not= \lambda_j \Rightarrow \lambda_i^q \not= \lambda_j^q\). Wir können deshalb das Newton-Lagrange Interpolationspolynom verwenden, um ein Polynom \(Q : L_b[X]\) mit der Eigenschaft \(\forall\ j,\ Q(\lambda_j^q) = \lambda_j\) zu bauen. Dann gilt für dieses \(Q\), dass \(B = Q(B^q)\) ist.
  • Wie zuvor muss man etwas vorsichtig sein, um zu beweisen, dass wir annehmen können, dass \(Q\) ein Polynom mit Koeffizienten in \(K\) ist.

19.23 Polynomrelation zwischen Matrizen

  • Zum Schluss wollen wir einen Beweis für ein Lemma geben, das wir zuvor verwendet haben.

    Lemma. Sei \(L/K\) eine Körpererweiterung und nehmen wir an, dass \(L\) endlich-dimensional als \(K\)-Vektorraum ist. Sei \(n : \mathbb{N}_{>0}\) eine natürliche Zahl und seien \(A, B : \text{Mat}(n \times n,K)\) Matrizen mit Koeffizienten in \(K\). Nehmen wir an, dass ein Polynom \(P : L[X]\) (mit Koeffizienten in \(L\)) existiert, sodass \(B = P(A)\) ist. Dann existiert auch ein Polynom \(Q : K[X]\) (mit Koeffizienten in \(K\)), sodass \(B = Q(A)\) ist.

  • Sei \(d := \dim_K L\). Der Vektor \(v_1 := 1_K\) ist eine Basis von \(K\) als \(K\)-Vektorraum. Daher existiert eine Basis von \(L\) als \(K\)-Vektorraum, die der Gestalt \((v_1, v_2,\ \ldots\ , v_d)\) ist.

  • Sei \(N := \deg P\). Schreiben wir \(P = \sum_{i=1}^N a_i X^i\) , mit \(a_i : L\) und, für alles \(i\), \(a_i = \sum_{j=1}^d c_{ij} v_j\) , mit \(c_{ij} : K\).

19.24 Beweis des Lemmas zur Polynomrelation zwischen Matrizen

  • Dann gilt \[v_1 B = 1_K P(A) = \sum_{i = 1}^N a_i A^i = \sum_{i = 1}^N \left( \sum_{j=1}^d c_{ij} v_j \right) A^i = \sum_{j = 1}^d v_j \left( \sum_{i=1}^N c_{ij} A^i \right) = \sum_{j=1}^d v_j Q_j(A) ,\] wobei, für alles \(j\), \(Q_j(X) := \sum_{i=1}^N c_{ij} X^i : K[X]\) ist ein Polynom mit Koeffizienten in \(K\).
  • Gegeben eine Matrix \(M : \text{Mat}(n \times n, K)\) und natürliche Zahlen \(1 \leqslant \alpha,\beta \leqslant n\), bezeichnen wir als \(M_{\alpha\beta}\) der Koeffizient mit Index \((\alpha,\beta)\) dieser Matrix. Dann gilt, für alle \(\alpha,\beta\), \[v_1 B_{\alpha\beta} = v_1 Q_1(A)_{\alpha \beta} + \sum_{j=2}^d v_j Q_j(A)_{\alpha\beta}\ \text{in}\ L~.\]
  • Da \((v_1,v_2,\ \ldots\ , v_d)\) eine \(K\)-Basis von \(L\) ist, gilt \(\forall\ \alpha, \beta,\ Q_1(A)_{\alpha\beta} = B_{\alpha\beta}\) in \(K\) und \(\forall\ \alpha, \beta,\ \forall\ j \geqslant 2,\ Q_j(A)_{\alpha\beta} = 0_K\). Folgt daraus, dass \(\forall\ j \geqslant 2,\ Q_j(A) = 0_{\text{Mat}(n \times n, K)}\) und \(Q_1(A) = B\) sind. Was im Allgemeinen nicht gilt, ist \(Q_1(X) = P_1(X)\) (nur \(P_1(A) = Q_1(A)\)).