Teorie čísel

Transkript

Teorie čísel
Teorie čísel
Nerozuměl jsem všemu. Ale to, čemu jsem porozuměl,
mně nahánělo hrůzu z toho, čemu jsem nerozuměl.
F.X. Šalda
Obsah
Obsah
1
1
Prvočísla
4
1.1
Prvočísel je nekonečně mnoho . . . . . . . . . . . . . . . . . . . . . . . . .
4
1.2
Rozložení prvočísel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7
1.3
Mertensovy věty
1.4
Počty dělitelů . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2
3
4
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
Trocha algebry
20
2.1
Grupy, okruhy, tělesa - základní pojmy . . . . . . . . . . . . . . . . . . . . 20
2.2
Dělitelnost v oborech integrity . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.3
Okruhy polynomů . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.4
Konstrukce těles a tělesové automorfismy . . . . . . . . . . . . . . . . . . . 26
Něco o polynomech
30
3.1
Polynomy nad C a nad R . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
3.2
Polynomy nad Q a nad Z . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
3.3
Cyklotomické polynomy . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.4
Symetrické polynomy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
Algebraická číselná tělesa
39
4.1
Algebraická čísla, minimální polynom . . . . . . . . . . . . . . . . . . . . . 39
4.2
Vlastnosti množiny algebraických čísel . . . . . . . . . . . . . . . . . . . . 41
4.3
Algebraická číselná tělesa . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
4.4
Izomorfizmy těles Q(α) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
4.5
Tělesový polynom, norma, stopa . . . . . . . . . . . . . . . . . . . . . . . . 51
4.6
Příklady algebraických číselných těles . . . . . . . . . . . . . . . . . . . . . 53
1
5
6
7
8
9
10
Diofantické rovnice
56
5.1
Kvadratická rezidua . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
5.2
Lineární diofantické rovnice . . . . . . . . . . . . . . . . . . . . . . . . . . 58
5.3
Pythagorejské trojice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
5.4
Součet dvou čtverců
5.5
Součet čtyř čtverců . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
5.6
Pellova rovnice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
Diofantické aproximace
72
6.1
Fareyovy zlomky . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
6.2
Řetězové zlomky . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
6.3
Aproximace sblíženými zlomky . . . . . . . . . . . . . . . . . . . . . . . . . 78
6.4
Řetězový zlomek kvadratických čísel . . . . . . . . . . . . . . . . . . . . . 83
6.5
Aplikace řetězových zlomků pro diofantické rovnice . . . . . . . . . . . . . 87
Transcendentní čísla
92
7.1
Liouvilleova čísla . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
7.2
Transcendentnost Eulerova čísla e . . . . . . . . . . . . . . . . . . . . . . . 96
7.3
Transcendentnost čísla π . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
7.4
Řetězový zlomek Eulerova čísla e . . . . . . . . . . . . . . . . . . . . . . . 102
Okruh celých čísel v číselném tělese
106
8.1
Algebraická celá čísla . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
8.2
Integrální báze okruhu celých čísel
8.3
Hledání integrální báze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
8.4
Integrální báze v cyklotomických tělesech . . . . . . . . . . . . . . . . . . . 114
. . . . . . . . . . . . . . . . . . . . . . 108
Dělitelnost a faktorizace v okruhu celých čísel
118
9.1
Jednotky . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
9.2
Jednotky v kvadratických tělesech . . . . . . . . . . . . . . . . . . . . . . . 119
9.3
Prvočísla, ireducibilní prvky, faktorizace . . . . . . . . . . . . . . . . . . . 121
9.4
Faktorizace v kvadratických tělesech . . . . . . . . . . . . . . . . . . . . . 125
Aplikace algebraických těles
131
10.1 Řešení diofantických rovnic . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
2
10.2 Lucas-Lehmerův test prvočíselnosti . . . . . . . . . . . . . . . . . . . . . . 136
10.3 Konstrukce pomocí kružítka a pravítka . . . . . . . . . . . . . . . . . . . . 138
10.4 Nekomutativní tělesa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
Literatura
148
3
1
Prvočísla
1.1
Prvočísel je nekonečně mnoho
V množině přirozených čísel, kterou budeme značit N = {1, 2, 3, . . .}, mají úlohu stavebních kamenů prvočísla. Za prvočíslo považujeme to přirozenné číslo, které má právě dva
různé dělitele, a to jedničku a sebe sama. Množinu prvočísel značíme P = {2, 3, 5, 7, . . .}.
Mezi prvočísla tedy neřadíme jedničku. Proto platí věta, kterou budeme mnohokrát využívat: každé přirozené číslo n > 1 lze jednoznačně až na pořadí zapsat jako součin prvočísel.
Že je pvočísel nekonečně mnoho, věděli lidé odedávna. První rigorózní důkaz lze nalézt
v Eukleidových základech.
Důkaz. Předpokládejme, že konečný seznam p1 , p2 , . . . , pr obsahuje všechna prvočísla. Označme n = p1 p2 . . . pr + 1. Zřejmě n není v seznamu. Protože číslo n není dělitelné žádným
prvočíslem ze seznamu, je n bud’ samo prvočíslo, nebo je n dělitelné prvočíslem, které není
v seznamu – spor s tím, že seznam p1 , p2 , . . . , pr vyčerpal všechna prvočísla.
Jiný důkaz nekonečnosti množiny P pochází z dopisu Christiana Goldbacha Leonhardu
Eulerovi z roku 1730.
Důkaz. Uvažujme posloupnost Fermatových čísel definovaných vztahem
n
Fn = 22 + 1 pro n = 0, 1, 2, . . .
(1.1)
Speciálně F0 = 3 a F1 = 5. Indukcí dokážeme, že pro n ≥ 1 platí
n−1
Y
Fk = Fn − 2 .
(1.2)
k=0
Pro n = 1 je tvrzení pravdivé, protože F0 = 3 = F1 − 2. Pro n > 1 využijeme indukční
předpoklad a můžeme psát
n
Y
k=0
Fk =
³n−1
Y
´
´
¡ 2n
¢ ¡ 2n
¢ ³ 2n+1
Fk Fn = (Fn − 2)Fn = 2 − 1 2 + 1 = 2
− 1 = Fn+1 − 2 .
k=0
4
Vztah (1.2) spolu s lichostí Fn implikuje, že každá dvě různá Fermatova čísla Fk a Fn
jsou nesoudělná. Tedy prvočísla nacházející se v rozkladu Fk a Fn jsou navzájem různá.
Protože Fermatových čísel je nekonečně, je nekonečně i prvočísel.
Množinu prvočísel lze uspořádat podle velikosti do ostře rostoucí posloupnosti (pn )n∈N ,
tedy
p1 = 2, p2 = 3, p3 = 5, p4 = 7, . . .
Z Goldbachova důkazu plyne, že n-té prvočíslo pn je menší než Fn−1 . Máme tedy první
odhad na velikost prvočísla
n−1
pn ≤ 22
+ 1.
Jak častý je výskyt prvočísel mezi přirozenými čísly bude vystihovat posloupnost
π(n) = #{p ≤ n | p ∈ P} .
Nekonečnost množiny P lze v tomto značení zapsat limn→∞ π(n) = +∞. Následující věta
pocházející od Eulera odhaduje rychlost růstu π(n) a jejím přímým důsledkem je opět
důkaz nekonečnosti P.
Věta 1.1. Pro počet π(n) prvočísel nepřevyšujících n platí π(n) ≥ ln n − 1.
Důkaz. Využijeme odhadu
Z
n
ln n =
1
n−1 Z k
n−1
X
X
X1
1
1
1
dx =
dx ≤
≤
,
x
x
k
k
k−1
k=1
k=1
k∈M
kde M = {m ∈ N | m má v rozkladu pouze prvočísla menší nebo rovna n}. Označme
r = π(n). Pak prvek M lze napsat ve tvaru m = pα1 1 pα2 2 . . . pαr r pro nějaká αi ≥ 0. Tedy
můžeme upravit
+∞ X
+∞
+∞
r X
+∞
r
X
X
Y
Y
X1
1
1
pi
=
...
=
=
.
α
α1 α2
i
αr
k
p
p
.
.
.
p
p
p
−
1
i
1
2
r
i
α =0 α =0
α =0
i=1 α =0
i=1
k∈M
1
r
2
Využijeme toho, že funkce
x
x−1
i
je pro x ≥ 2 klesající a jednoduchého odhadu pi ≥ i + 1.
Celkově dostaneme
ln n ≤
r
Y
i+1
i=1
i
= r + 1 = π(n) + 1 .
5
Když do předchozí věty za n dosadíme k-té prvočíslo, dostaneme ln pk ≤ 1 + π(pk ) =
1 + k , a tedy
pk ≤ ek+1 ,
což je lepší odhad pro velikost pk než z Goldbachova důkazu. Že i tento horní odhad je
P
velice nadsazený věděl už Euler, který dokázal divergenci p∈P p1 . Důkaz sporem, který
uvedeme, pochází od Erdöse z roku 1938.
Věta 1.2. Řada
P
1
p∈P p
diverguje.
P
Důkaz. Předpokládejme, že řada p∈P p1 konverguje. Podle Bozanova Cauchyova kritéria
P
existuje přirozené k takové, že i≥k+1 p1i < 12 . Tedy
X N
N
<
pi
2
i≥k+1
pro každé N ∈ N.
(1.3)
Pro tuto chvíli budeme prvočísla p1 , p2 , . . . , pk nazývat malá a prvočísla pk+1 , pk+2 , . . .
velká. Pro zvolené N ∈ N označme Ns velikost množiny těch přirozených čísel n ≤ N ,
která jsou dělitelná pouze malými prvočísly, a Nb velikost množiny těch přirozených čísel
n ≤ N , která mají za dělitele alespoň jedno velké prvočíslo. Podle definice je N = Ns +Nb .
Spor bude spočívat v tom, že odvodíme Ns + Nb < N .
Počet n ≤ N , které jsou dělitlné velkým prvočíslem pi je b N
c. Proto je podle (1.3)
pi
Nb ≤
X jN k
N
<
.
p
2
i
i≥k+1
Nyní odhadneme Ns . Každé n lze napsat jako n = an b2n , kde an je čtvrcuprosté přirozené
číslo. Je-li n dělitelné pouze malými prvočísly, je an součinem různých malých prvočísel.
Proto pro vytvoření an máme maximálně 2k možností. Na druhé straně b2n ≤ n ≤ N , a
√
tedy bn nabývá nanejvýš N hodnot. Proto je
√
Ns ≤ 2k N .
Celkově máme
√
N
+ 2k N pro každé N ∈ N.
2
√
Spor dostaneme, když zvolíme N tak, aby 2k N ≤ N2 . Např. volba N = 22k+2 vyhovuje.
N = N s + Nb <
Divergence
P
1
p∈P p
znamená, že množina, přes kterou sčítáme, je nekonečná. Dali jsme
tak další důkaz nekonečnosti P. Existuje však celá řada dalších důkazů.
6
1.2
Rozložení prvočísel
Prvočísla nejsou v přirozených číslech rozmístěna nijak pravidelně. Pro libovolné n ∈ N
lze najít úsek n po sobě jdoucích přirozených čísel, z nichž žádné není prvočíslo:
(n + 1)! + 2, (n + 1)! + 3, (n + 1)! + 4, . . . , (n + 1)! + n + 1
Tedy mezery mezi sousedními prvočísly mohou být libovolně velké. Na druhé straně už
v antice byla vyslovena hypotéza, že existuje nekonečně mnoho prvočíselných dvojčat,
tedy nekonečně mnoho takových prvočísel p, že také p + 2 je prvočíslo. Takové dvojčata
jsou např. pár 11 a 13, pár 17 a 19, pár 41 a 43, atd. Počítačové experimenty potvrzují
zmíněnou hypotézu, ale dokázat se jí zatím nikomu nepodařilo.
Fakt, že v úseku přirozených čísel začínajícím n natrefíme na prvočíslo dříve, než
dojdeme k číslu 2n, pozoroval první Joseph Bertrand. On také toto tvrzení, dnes nazývané
Bertrandův postulát, empiricky ověřil pro n < 3.106 . První důkaz pochází z roku 1850
od Pafnutija Čebyševa. Důkaz, který později uvedeme, pochází od Paula Erdöse z roku
1932. Před tím však odvodíme několik důležitých tvrzení.
Věta 1.3 (Legendre). Prvočíslo p ∈ P se nachází v rozkladu čísla n! právě
Xjnk
krát.
k
p
k≥1
Důkaz. Tvrzení plyne z faktu, že mezi čísly 1, 2, 3, . . . , n je právě b np c násobků čísla p,
právě b pn2 c násobků čísla p2 , právě b pn3 c násobků čísla p3 , atd.
Důsledek 1.4. Prvočíslo p ∈ P se nachází v rozkladu kombinačního čísla
¡2n¢
n
nanejvýš
r krát, kde r = max{r | pr ≤ 2n}.
Důkaz. Z Legendreovy věty plyne, že prvočíslo p se nachází v rozkladu čísla
právě
¡2n¢
n
=
(2n)!
(n!)2
j n k´
X ³j 2n k
−
2
krát.
pk
pk
k≥1
Pro libovolné reálné x > 0 je b2xc−2bxc bud’ 0 nebo 1. Proto lze sumu odhadnout počtem
nenulových sčítanců. Pro index k, pro který je pk > 2n, je sčítanec sumy nulový.
Lemma 1.5. Pro každé n ∈ N, n ≥ 2 platí
Y
p ≤ 4n−1 .
p∈P,p≤n
7
Důkaz. Důkaz provedeme indukcí. Pro n = 2 a n = 3 tvrzení platí. Pro n > 3 najdeme
největší prvočíslo q ≤ n. Zřejmě je q liché, tj. q = 2m + 1 a
Y
p
p∈P, p≤n
Číslo
¡2m+1¢
m
=
Y
=
p
=
p
p∈P
p≤m+1
p∈P
p≤2m+1
(2m+1)(2m)(2m−1)...(m+2)
m!
Y
Y
·
p.
(1.4)
p∈P
m+1<p≤2m+1
je celé. Přitom prvočíslo p, pro nějž m < p ≤ 2m+1,
se vysytuje pouze v čitateli zlomku, a ne ve jmenovateli. Tedy takové p se určitě vyskytne
¡
¢
v rozkladu 2m+1
na prvočísla. Proto
m
Y
µ
p ≤
p∈P
m+1<p≤2m+1
2m + 1
m
¶
1
2
≤
2m+1
Xµ
k=0
2m + 1
k
¶
= 22m .
(1.5)
Využitím indukčního předpokladu na (1.4) a odhadu (1.5) dostaneme
Y
p
=
p∈P, p≤n
Y
p
≤ 4m · 22m ≤ 4n−1 .
p∈P
p≤2m+1
Věta 1.6. Pro každé přirozené číslo n existuje prvočíslo p takové, že
n < p ≤ 2n .
Důkaz. Nejdříve dokážeme větu pro n < 4000. Uvažujme posloupnost těchto 14 prvočísel
q1 , . . . , q14 :
2, 3, 5, 7, 13, 23, 43, 83, 163, 317, 631, 1259, 2503, 4001 .
Každé následující je menší než dvojnásobek předchozího prvočísla. Libovolné n < 4000
leží mezi nějakými dvěma sousedními prvočísly z této posloupnosti, t.j. qi < n ≤ qi+1 <
2qi < 2n.
K důkazu věty pro n ≥ 4000 budeme odhadovat číslo
¡2n¢
n
. Protože je to největší číslo
ve 2n-tém řádku Pascalova trojúhelníku, lze jej zdola odhadnout takto
µ ¶
¶
2n µ
2n
1 X 2n
4n
.
≥
=
n
2n k=0 k
2n
Necht’ pα1 1 pα2 2 . . . pαs s je rozklad
¡2n¢
n
(1.6)
na prvočísla. Využijeme tří pozorování, které plynou
z důsledku (1.4).
• pαi i ≤ 2n pro každé i.
8
• Prvočíslo p >
√
2n se v rozkladu
¡2n¢
n
nachází nanejvýš jednou.
• Prvočíslo p splňující 23 n < p ≤ n se v rozkladu
Proto
µ
¶
Y
2n
≤
2n
n
p∈P
Y
·
¡2n¢
n
p
nenachází vůbec.
·
p∈P
√
2n<p≤ 23 n
√
p≤ 2n
Y
p
(1.7)
p∈P
n<p≤2n
Větu dokážeme sporem. Předpokádejme, že mezi n a 2n neexistuje žádné prvočíslo. Kombinací odhadů (1.6), (1.7) a lemmatu 1.5 dostaneme
√
2
4n
≤ (2n) 2n 4 3 n
2n
=⇒
Srovnáním rychlosti růstu posloupností n,
2n ≤ 3(1 +
√
√
2n)(1 + ln2 n) .
(1.8)
n a ln2 n je na první pohled vidět, že poslední
nerovnost pro velká n neplatí. Abychom dostali spor, potřebujeme však dokázat, že
”velká” n jsou v našem případě všechna n ≥ 4000. Za tímto účelem definujeme funkce
√
g(x) = 2x a f (x) = 3(1 + 2x)(1 + ln2 x). Nyní stačí ověřit, že g(4000) > f (4000) a
g 0 (x) > f 0 (x) pro x > 4000. Tuto úlohu ze základní analýzy přenecháme čtenáři.
Důsledek 1.7. Existuje konstanta A taková, že všechny členy posloupnosti
¹ Aº
¥ A ¦ j 2A k j 22A k
22
2 , 2
, 2
, 22
,...
jsou prvočísla.
Důkaz. Definujme posloupnost (qn ) rekurzivně: q1 = 2 a qn+1 jako nejmenší prvočíslo větší
než 2qn . Z Bertrandova postulátu tedy plyne 2qn < qn+1 < 21+qn . Mohli jsme použít dvě
ostré nerovnosti, protože prvočíslo qn+1 není sudé, a tedy 1 + qn+1 ≤ 21+qn . Ani v této
nerovnosti nemůže však nastat rovnost. Jelikož 1 + qn je pro n > 1 sudé číslo, řekněme
1 + qn = 2k, znamenala by rovnost 1+qn+1 = 21+qn , že qn+1 = 21+qn −1 = (2k −1)(2k +1).
To je v rozporu s prvočíselnosti qn+1 . Platí proto
2qn < qn+1 < 1 + qn+1 < 21+qn .
Zlogaritmujme se základem 2 předchozí nerovnost n + 1 krát. (Pro n krát interovaný
(n)
logaritmus použijeme značení ln2 .) Dostaneme
(n)
(n+1)
ln2 qn < ln2
(n+1)
qn+1 < ln2
9
(n)
(1 + qn+1 ) < ln2 (1 + qn )
(1.9)
¡ (n) ¢
¡ (n)
¢
Posloupnost ln2 qn je ostře rostoucí a posloupnost ln2 (1+qn ) je ostře klesající. Proto
¡ (n) ¢
posloupnost ln2 qn má konečnou limitu, označme ji A. Z nerovností (1.9) dostaneme
(n)
(n)
ln2 qn < A < ln2 (1 + qn ) .
Zpětným n násobným odlogaritmováním pak
qn < 2 2
A
.2
..
< 1 + qn .
Aplikováním funkce celá část na poslední nerovnost odvodíme, že posloupnost uvedená
ve tvrzení věty, je posloupnost prvočísel (qn ).
Poznámka 1.8. Zobecnění Bertrandova postulátu představuje následující tvrzení:
¡
¢¡
¢¡
¢¡
¢¡
¢
∀ε > 0 ∃n0 ∀n > n0 , n ∈ N ∃p ∈ P n < p < (1 + ε)n .
Jinými slovy pro dostatečně velké n lze najít prvočíslo mezi n a (1 + ε)n.
Bez odpovědi je zatím slavný problém, zda mezi n2 a (n + 1)2 leží vždycky alespoň
jedno prvočíslo.
Asymptotické chování π(n) počtu prvočísel nepřevyšujících n dlouho odolávalo matematikům. Už Gauss předpověděl, že
lim
n→∞
π(n)
n
ln n
= 1,
kde ln je logaritmus se základem e. Nejdříve se podařilo Čebyševovi ukázat, že kdyby
limita nalevo existovala, pak by to byla jednička. Existenci této limity, a tedy poslední
krok v důkazu, udělali v roce 1896 nezávisle na sobě dva francouzští matematici Hadamard
a de la Valleé-Poussin. Jejich důkaz je komplikovaný a využívá aparát komplexní analýzy.
My dokážeme elementárními prostředky slabší tvrzení.
Věta 1.9. Existují kladné konstanty a, b ∈ R takové, že
a
n
n
< π(n) < b
.
ln2 n
ln2 n
¡ ¢
Důkaz. Kombinační číslo 2n
neobsahuje ve svém rozkladu prvočísla větší než 2n. Proto
n
¡2n¢
α
π(2n)
lze napsat n = pα1 1 pα2 2 . . . pπ(2n)
pro αi ∈ {0, 1, 2, . . .}. Z definice kombinačního číslo
10
plyne, že prvočíslo p > n a p ≤ 2n se nachází v rozkladu
¡2n¢
n
právě jednou. Na druhé
straně, z důsledku 1.4 získáme pro každý index i nerovnost pαi i ≤ 2n. Proto
µ ¶
Y
2n
απ(2n)
π(2n)−π(n)
n
≤
≤ (2n)π(2n) .
p ≤
= pα1 1 pα2 2 . . . pπ(2n)
n
p∈P
(1.10)
n+1≤p≤2n
Předchozí odhady zkombinované s odhadem 2n ≤
¡2n¢
n
≤ 22n dávájí dva důležité vztahy
2n ≤ (2n)π(2n)
(1.11)
nπ(2n)−π(n) ≤ 22n .
(1.12)
a
Zlogaritmovaním (1.11) a po jednoduché úpravě odvodíme
n ≤ π(2n) ln2 (2n)
=⇒
1 2n
≤ π(2n) .
2 ln2 (2n)
V případě sudé proměnné bychom tak mohli vzít za konstantu a zlomek
1
.
2
Pro liché
hodnoty využijeme toho, že π(n) ln2 n je rostoucí posloupnost.
2n + 1
≤ n ≤ π(2n) ln2 (2n) ≤ π(2n + 1) ln2 (2n + 1)
3
⇓
1 2n + 1
≤ π(2n + 1) .
3 ln2 (2n + 1)
Dolní odhad na π(n) ve větě bude platit pro sudé i liché n zároveň, když položíme a = 13 .
Zlogaritmovaním (1.12) odvodíme
¡
¢
π(2n) − π(n) ln2 n ≤ 2n
=⇒
π(2n) ln2 (2n) − π(n) ln2 n ≤ 2n + π(2n) ≤ 4n .
(1.13)
Definujme pro i = 0, 1, 2, . . . čísla Ai := π(2i ) ln2 (2i ). Podle (1.13) pro členy této posloupnosti platí
Ai+1 − Ai ≤ 4 · 2i
pro každé i = 0, 1, 2, . . .
Sečtením předchozích nerovností pro i = 0, . . . , k − 1 dostaneme
Ak ≤ 4
k−1
X
2i = 4(2k − 1) ≤ 4 · 2k .
i=0
Uvažujme nyní libovolné n. Najdeme k ∈ N tak, aby 2k−1 < n ≤ 2k . Opět využijeme, že
π(n) ln2 n je rostoucí posloupnost. Proto
π(n) ln2 n ≤ π(2k ) ln2 (2k ) = Ak ≤ 4 · 2k = 8 · 2k−1 < 8n .
Za konstantu b lze tedy položit b = 8.
11
Zatím jsme ukázali, že k-té prvočíslo pk je menší než ek+1 . Předchozí věta nám umožní
daleko lépe vystihnout růst pk .
Důsledek 1.10. Existují konstanty c a d takové, že pro k-té prvočíslo platí
c k ln2 k < pk < d k ln2 k .
Důkaz. Použijeme nerovnost z předchozí věty na k-té prvočíslo n = pk . Dostaneme
a pk ≤ k ln2 pk ≤ b pk .
Když využijeme, že k < pk , dostaneme dolní odhad k ln2 k ≤ b pk . Stačí tedy položit
c = b−1 .
Na druhé straně platí
pk ≤ a−1 k ln2 pk
(1.14)
a po zlogaritmovaní
ln2 pk ≤ ln2 k + ln2 ln2 pk − ln2 a .
Od jistého k počínaje lze odhadnout
ln2 pk ≤ ln2 k + 2 ln2 ln2 pk ≤ ln2 k + 12 ln2 pk
=⇒
ln2 pk ≤ 2 ln2 k
Dosazením do (1.14) získáme od jistého k
pk ≤ 2a−1 k ln2 k .
1.3
Mertensovy věty
Čebyševovy výsledky byly podnětem pro Mertensovy asymptotické formule, které pocházejí z roku 1874.
Věta 1.11. Existuje konstanta K taková, že pro každé n ∈ N platí
ln n − K ≤
X ln p
p
p∈P,p≤n
≤ ln n + K .
Důkaz. Označme r := π(n) a využijme rozkladu n! = pα1 1 pα2 2 . . . pαr r . Podle věty 1.3 je
αi = b pni c+b pn2 c+. . .+b pnqi c, kde qi je největší takové celé číslo, že pqi i ≤ n. Zlogaritmovaním
i
dostaneme
i
µj k j k
r
j n k¶
X
n
n
+ 2 + . . . + qi
ln n! =
ln pi .
pi
pi
pi
i=1
12
(1.15)
Odhadněme ln n! shora:
¶
µ
r
r
X
X
1
1
1
1
+ 2 + . . . + qi ln pi ≤ n
ln pi .
ln n! ≤ n
p
p
p
p
−
1
i
i
i
i
i=1
i=1
S použitím
ln p
ln p
ln p
ln p
1
=
+
≤
+ √
p−1
p
p(p − 1)
p
p p
můžeme pokračovat v odhadu
+∞
X ln p
X
1
√ .
+ n
p
k k
p∈P,p≤n
k=2
ln n! ≤ n
Protože
+∞
X
k=2
Z
1
√
+∞
<
k k
1
je celkově
1
√ dx = 2 ,
x x
X ln p
+ 2n .
p
p∈P,p≤n
ln n! ≤ n
(1.16)
Odhadujme (1.15) zdola:
r j k
r
r
r
X
X
X
X
n
ln pi
ln pi
ln n! ≥
ln pi ≥ n
−
ln pi ≥ n
− r ln n .
p
p
p
i
i
i
i=1
i=1
i=1
i=1
Písmenem r bylo označeno π(n). Proto r ≤ b ln 2
jsme tak dolní odhad
n
,
ln n
kde b je konstanta z věty 1.9. Získali
X ln p
− n b ln 2 .
p
p∈P,p≤n
ln n! ≥ n
(1.17)
K zakončení důkazu potřebujeme ještě nerovnosti
nn ≥ n! >
³ n ´n
e
.
(1.18)
Jedna z těchto nerovností je zřejmá, druhou lze snadno odvodit matematickou indukcí,
když si vzpomeneme, že
µ
1
1+
n
¶n
< e.
Indukční krok má tvar
µ
µ
¶n+1
¶n ³ ´
³ n ´n
n+1
1
1 n n
= (n + 1) 1 +
> (n + 1)
> (n + 1)n!
e
n
e e
e
Zkombinováním odhadu (1.17) a zlogaritmované nerovnosti (1.18) dostaneme
X ln p
− n b ln 2 ,
p
p∈P,p≤n
n ln n ≥ ln n! ≥ n
13
což po zkrácení faktorem n je už část tvrzení dokazované věty.
Podobně z (1.16) a (1.18) získáme nerovnost
X ln p
+ 2n ,
p
p∈P,p≤n
n(ln n − 1) ≤ ln n! ≤ n
kterou opět lze zkrátit faktorem n.
Věta 1.12. Existuje konstanta C taková, že pro každé n ∈ N platí
ln ln n − C ≤
X 1
≤ ln ln n + C .
p
p∈P,p≤n
Důkaz. Připomeňme nejdříve Abelovou sumační formuli. Jsou daná čísla a1 , a2 , . . . , an a
b1 , b2 , . . . , bn . Pro i = 1, 2, . . . , n označme Bi := a1 + a2 + . . . + ai . Pak platí
n
X
ai bi = an Bn +
n−1
X
i=1
(ai − ai+1 )Bi
i=1
Opět položíme r = π(n) a aplikujme sumační formuli na ai =
1
ln pi
a bi =
ln pi
.
pi
Podle věty
1.6 je pi ≥ 12 pi+1 . Pro Bi proto z věty 1.11 platí
ln pi+1 − ln 2 − K ≤ ln pi − K < Bi :=
i
X
ln pk
k=1
pk
≤ ln pi + K .
Můžeme tedy odhadnout shora
r
r
r−1 ³
X
X
¢ X
1
1 ln pi
1
1 ¡
1 ´
=
≤
ln pr + K +
−
(ln pi + K) =
p
ln pi pi
ln pr
ln pi ln pi+1
i=1 i
i=1
i=1
r−1
X 1 ¡
¢
K
=
+1+
ln pi+1 − ln pi .
ln p1
ln pi+1
i=1
Jelikož funkce
1
x
je pro kladná x klesající, lze odhadnout
¢
1 ¡
ln pi+1 − ln pi =
ln pi+1
Z
ln pi+1
ln pi
1
dx ≤
ln pi+1
Z
ln pi+1
ln pi
1
dx = ln ln pi+1 − ln ln pi .
x
Ted’ dokončíme horní odhad
r
X
K
K
1
≤
+ 1 + ln ln pr − ln ln p1 ≤
+ 1 − ln ln 2 + ln ln n .
p
ln p1
|ln 2
{z
}
i=1 i
=:C1
Pro dolní odhad
r
r−1 ³
r
X
X
¢ X
1 ¡
1
1 ´
1 ln pi
1
=
≥
ln pr − K − ln 2 +
−
(ln pi+1 − K − ln 2)
p
ln pi pi
ln pr
ln pi ln pi+1
i=1
i=1
i=1 i
14
= −
Monotonie funkce
r−1
X
¢
K
1 ¡
ln pi+1 − ln pi .
+
ln 2
ln pi
i=1
1
x
poskytne s využitím integrálu dolní odhad na sčítance sumy
Z ln pi+1
¢
1 ¡
1
ln pi+1 − ln pi ≥
dx = ln ln pi+1 − ln ln pi .
ln pi
x
ln pi
Celkově dostaneme
r
³K
´
X
1
K
+ ln ln pr − ln 2 ≥ −
+ ln 2 + 1 + ln ln n .
≥ −
p
ln 2
}
| ln 2 {z
i=1 i
=:C2
Pro poslední nerovnost jsme použili, že z Bertrandova postulátu plyne n ≥ pπ(n) ≥ n2 , a
pak jednoduchý vztah ln ln n2 > ln ln n − 1.
Abychom dostali tvrzení věty stačí položit C = max{C1 , C2 }.
Poznámka 1.13. Větě 1.11 se říká první Mertensova věta. Věta 1.12 je slabší formou
tzv. druhé Mertensovy věty. My jsme dokázali omezenost posloupnosti
X 1
− ln ln n .
p
p∈P,p≤n
Jemnějšími metodami lze dokonce dokázat, že tato posloupnost má limitu β = 0.26149 . . ..
Někdy se pod pojmem druhá Mertensova věta rozumí formule
Y³
1−
1
p
´−1
= eγ ln n + O(1) ,
p≤n
kde γ je Eulerova konstanta
γ = lim
n7→+∞
n
X
1
k=1
k
− ln n .
Tato formule implikuje větu 1.12.
1.4
Počty dělitelů
Počet všech dělitelů čísla n budeme značit τ (n), počet prvočíselných dělitelů čísla n
budeme značit ω(n). Formálně
τ (n) =
X
1
a
d∈N, d|n
ω(n) =
X
1.
p∈P, p|n
Určit hodnotu τ (n) a ω(n) je snadné, když známe rozklad n na prvočísla:
n = pα1 1 pα2 2 . . . pαk k
=⇒
τ (n) = (α1 + 1)(α2 + 1) . . . (αk + 1) a ω(n) = k
15
(1.19)
Vztah (1.19) mimo jiné říká, že funkce τ (n) je multiplikativní a ω(n) aditivní, tj.
τ (mn) = τ (m)τ (n) a ω(mn) = ω(m) + ω(n)
pro nesoudělná m a n .
Věnujme se nejdříve funkci τ (n). S rostoucím n se funkce τ (n) chová velice nepravidelně; zřejmě
lim inf τ (n) = 2
a
lim sup τ (n) = +∞
Zajímavé je, že průměrnou hodnotu τ (n) můžeme popsat dobře.
Věta 1.14. Pro průměrnou hodnotu počtu dělitelů prvních n přirozených čísle platí
n
1 X
τ (k) = ln n + 2γ − 1 + εn ,
n k=1
kde γ je Eulerova konstanta a lim εn = 0.
Důkaz. Použijeme geometrickou interpretaci
τ (k) =
X
1=
X
1.
uv=k
d|k
pomocí celočíselné mřížky v rovině. Počet bodů (u, v) ∈ N × N, které leží na hyperbole
Pn
xy = k, je právě τ (k). Tedy suma
k=1 τ (k) je rovna počtu mřížkových bodů (u, v)
ležících v prvním kvadrantu pod hyperbolou nebo na hyperbole xy = n. Rozdělme tyto
body do tří skupin:
1. 1 ≤ u ≤
2. 1 ≤ u ≤
3. 1 ≤ v ≤
√
√
√
n a 1≤v≤
n ,
n ,
√
√
n<v
√
n;
a uv ≤ n ;
n < u a uv ≤ n .
√
Bodů v první skupině je b nc2 . Bodů ve druhé skupině je
X ³j n k
√ ´
− b nc =
u
√
1≤u≤ n
X jnk
√
− b nc2
u
√
1≤u≤ n
a ze symetrie je stejný počet i bodů ve třetí skupině. Proto je celkový počet bodů
n
X
k=1
τ (k) = 2
X jnk
X ³ n n n o´
¡√
√
√ ¢2
− b nc2 = 2
−
−
n − { n} =
u
u
u
√
√
1≤u≤ n
1≤u≤ n
X nno
√ √
√ 2
1
= 2n
− n + 2 n{ n} − { n} − 2
u
√ u
√
1≤u≤ n
1≤u≤ n
|
{z
}
zbytek
X
16
√
Zbytek je v absolutní hodnotě nanejvýš 1 + 2 n. Pro průměrnou hodnotu počtu dělitelů
tak platí
n
X 1
1 X
zbytek
τ (k) = 2
− 1 −
.
n k=1
n
√ u
1≤u≤ n
Tvar průměru, který uvádí věta, dostaneme, když využijeme, že z definice Eulerovy konstanty γ plyne
2
X
√
1≤u≤ n
¡ √
¢
1
= 2 ln n + γ + δn = ln n + 2γ + 2δn ,
u
kde lim δn = 0.
Věta 1.15. Pro průměrnou hodnotu počtu prvočíselných dělitelů prvních n přirozených
čísel platí
n
1 X
ω(k) = ln ln n + γn ,
n k=1
kde (γn ) je omezená posloupnost.
Důkaz.
n
X1
1X
1 X
1 Xj n k
1 X
1 Xn n o
1 =
1 =
ω(k) =
=
−
.
n k=1
n
n
n p≤n p
p
n p≤n p
p≤n
k≤n, p|k
p≤n, p|k
Podle věty 1.9 je
1 Xn n o
1X
b
≤
1 ≤
.
n p≤n p
n p≤n
ln2 n
P
K ukončení důkazu věty už stačí aplikovat na sumu p≤n p1 druhou Mertensovu větu.
0 ≤
Kapitolu uzavřeme slavným výsledkem Hardyho a Ramanujana z roku 1920. Ten říká,
že většina čísel k z množiny 1, 2, . . . , n má ω(k) blízké hodnotě ln ln n. Důkaz, který
předvedeme, pochází od P. Turána (1934). Jeho důkaz se často uvádí jako demonstrace
účinnosti pravděpodobnostních metod v kombinatorice. Abychom se vyhnuli odkazům na
teorii pravděpodobnosti, vyslovíme nejdříve dvě technická lemmata. Čtenář obeznámený
s pravděpodobností ve druhém z nich snadno rozpozná Čebyševovu nerovnost.
Lemma 1.16. Existuje konstanta K taková, že pro každé n ∈ N platí
n
X
¡
¢2
¡
¢2
ω(k) ≤ n ln ln n + Kn ln ln n .
k=1
17
Důkaz. V celém důkazu budou proměnné p a q prvočísla, proměnné k a n jsou přirozenná
čísla.
n
X
X¡ X
X ¢
X¡ X ¢¡ X ¢
¡
¢2
ω(k) =
1
1 =
1+
1 =
k=1
k≤n
=
p|k
XX
k≤n
q|k
1+
pq≤n pq|k
p6=q k≤n
X
pq|k
p6=q
Xj n k
ω(k) =
pq≤n
p6=q
k≤n
p|k
pq
+ n (ln ln n + γn ) .
Pro druhou rovnost bylo podstatné, že dvě různá prvočísla p a q dělí k, právě když
součin pq dělí k. V poslední rovnosti jsme využili tvrzení věty 1.15, kde γn je omezená
posloupnost. K důkazu lemmatu ted’ postačí ukázat, že
V :=
Xj n k
pq≤n
p6=q
pq
¡
¢2
≤ n ln ln n + αn ln ln n + βn
(1.20)
pro nějaké konstanty α a β. Odhadujeme V shora a využijeme větu 1.12:
V =
Xj n k
pq≤n
p6=q
pq
≤ n
³X 1 ´2
X 1
X 1
¡
¢2
≤ n ln ln n + C .
≤ n
= n
pq
pq
p
pq≤n
p,q≤n
p≤n
p6=q
Nerovnost (1.20) je splněna pro α = 2C a β = C 2 .
Lemma 1.17. Necht’ S je konečná podmnožina N a f reálná funkce definovaná na S.
Necht’ µ a t jsou reáná čísla, t > 0. Pak počet prvků k ∈ S takových, že
|f (k) − µ| ≥ t ,
nepřesáhne číslo
¢2
1 X¡
f (k) − µ .
2
t k∈S
Důkaz. Z nerovnosti |f (k) − µ| ≥ t plyne nerovnost 1 ≤
#{k ∈ S | t ≤ |f (k) − µ|} =
X
1 =
k∈S
|f (k)−µ|≥t
(f (k)−µ)2
.
t2
Proto
X (f (k) − µ)2
¢2
1 X¡
≤
f
(k)
−
µ
.
2
2
t
t
k∈S
k∈S
|f (k)−µ|≥t
Věta 1.18 (Hardy, Ramanujan). Pro každé kladné δ je
1
©
ª
# k ≤ n | (ln ln n) 2 +δ ≤ |ω(k) − ln ln n|
lim
n→∞
n
18
= 0.
Důkaz. Z lemmatu 1.17 aplikovaného na funkci f (k) = ω(k), množinu S = {1, 2, . . . , n},
1
čísla µ = ln ln n a t = (ln ln n) 2 +δ získáme odhad
1
©
ª
# k ≤ n | (ln ln n) 2 +δ ≤ |ω(k) − ln ln n|
n
≤
´2
X³
1
ω(k) − ln ln n .
n(ln ln n)1+2δ k≤n
(1.21)
Stačí ukázat, že limita zlomku na pravé straně nerovnosti je nula. Upravme čitatele zlomku
s použitím lemmatu 1.16 a věty 1.15. Dostaneme
X³
k≤n
´2 X ¡
X
X¡
¢2
¢2
ω(k) +
ln ln n ≤
ω(k) − ln ln n =
ω(k) − 2 ln ln n
k≤n
k≤n
k≤n
¡
¢
≤ n (ln ln n)2 + Kn ln ln n − 2 ln ln n n ln ln n + nγn + n (ln ln n)2 = (K − 2γn )n ln ln n ,
kde K je konstanta a γn je omezená posloupnost. Proto limita pravé strany nerovnosti
(1.21) je nula, jak jsme chtěli ukázat.
19
2
Trocha algebry
V této kapitole připomeneme definice základních pojmů z teorie grup a těles, se kterými
budeme pracovat. Bez důkazu uvedeme věty, které jsou náplní každého základního kurzu
algebry. Dokazovat budeme věty méně obvyklé nebo ty, jejichž důkazy jsou z pohledu
dalšího použití v našem textu ilustrativní.
Pod pojmem binární operace na množině M rozumíme zobrazení ◦ kartézského součinu
M × M do M . Operace ◦ je asociativní, když x ◦ (y ◦ z) = (x ◦ y) ◦ z pro každé x, y, z ∈ M ;
komutativní, když x ◦ y = y ◦ x pro každé x, y, z ∈ M .
2.1
Grupy, okruhy, tělesa - základní pojmy
Definice 2.1. Množinu G spolu s asociativní binární operací ◦ na G nazveme grupou,
pokud:
• v G existuje neutrální prvek e, tj. takový, že x ◦ e = x pro každé x ∈ G,
• ke každému x ∈ G existuje inverzní prvek y ∈ G, tj. takový, že x ◦ y = e.
Je-li navíc operace ◦ komutativní, nazýváme G komutativní nebo Abelovou grupou.
Někdy se pro operaci ◦ používá symbol +, v tom případě se neutrální prvek značí 0
a inverznímu prvku k prvku x se říká opačný a značí se −x. Takovému zápisu grupy se
říká aditivní. Jindy operaci ◦ značíme symbolem ×, pak se pro neutrální prvek používá 1
a inverzní prvek k prvku x se značí x−1 . Takovému zápisu grupy se říká multiplikativní a
znak pro operaci × se vynechává, jak je to zvykem u běžného násobení.
Příklad 2.2. Množina {0, 1, . . . , n − 1} s operací + mod p je grupa pro každé n ∈ N.
Tato grupa je komutativní a značí se Zn . Vybavíme-li množinu {1, . . . , n − 1} operací ×
mod p, získáme grupa, právě když n ∈ P.
Definice 2.3. Grupa G1 s operací ◦1 je izomorfní s grupou G2 s operací ◦2 , pokud existuje
bijekce π : G1 7→ G2 taková, že
π(x ◦1 y) = π(x) ◦2 π(y) pro každé x, y ∈ G1 .
20
Zobrazení π se nazývá izomorfizmem grup G1 a G2 .
Příklad 2.4. G1 = {0, 1, 2, 3} s operací + mod 4 je izomorfní grupě G2 = {1, 2, 3, 4} s
operací × mod 5. Snadno se ověří, že π : G1 7→ G2 dané předpisem
π(0) = 1 , π(1) = 2 , π(2) = 4 , π(3) = 3
vyhovuje předchozí definici.
Definice 2.5. Množinu R se dvěma asociativními binárními operacemi + a × nazýváme
okruhem, pokud R s operací + je komutativní grupa s neutrálním prvkem 0 a operace +
a × jsou svázány distributivním zákonem, tj.
(x + y) × z = x × z + y × z
a z × (x + y) = z × x + z × y pro všechna x, y, z ∈ R .
Okruh R se nazývá obor integrity1 , pokud
• operace × je komutativní,
• x × y = 0 implikuje x = 0 nebo y = 0, pro každé x, y ∈ R,
• v R \ {0} existuje neutrální prvek vzhledem k operaci ×; tento prvek značíme 1.
Nejtypičtějším příkladem oboru integrity jsou celá čísla Z. Pojmy jako dělitelnost a
prvočísla, známé z oboru celých čísel, lze zobecnit na libovolný obor integrity, jak připomeneme v sekci 2.2.
Definice 2.6. Okruh R s operacemi + a ×, pro který je R \ {0} s operací × grupa, se
nazývá těleso. Je-li operace × komutativní, nazýváme R komutativním tělesem.
Příklad 2.7. Množina {0, 1, 2 . . . , p−1} s operacemi + mod p a × mod p je komutativním
tělesem pro každé prvočíslo p. Vžilo se, že toto těleso se značí Zp , tedy stejně jako jeho
aditivní grupa. Tato nejednoznačnost pojmů však nepůsobí žádné problémy.
2.2
Dělitelnost v oborech integrity
Definice 2.8. V oboru integrity R řekneme, že y dělí x, jestliže existuje z ∈ R takové, že
x = yz. Tento vztah značíme y|x. Prvky x, y ∈ R jsou asociované v R, jestliže x|y i y|x,
zapisujeme x ∼ y. O prvku u ∈ R řekneme, že je jednotka v R, jestliže u ∼ 1. Množinu
jednotek oboru integrity R značíme U (R).
1
Obvykle se v definici oboru integrity nepožaduje existence neutrálního prvku vzhledem k operaci ×.
Těmto obecnějším oborům integrity se zde však nevěnujeme.
21
Protože každá jednotka u dělí jednotkový prvek 1, tj. 1 = uv pro nějaké v ∈ R, je
u v R invertovatelné a prvek v můžeme značit v = u−1 . Snadno lze ukázat, že U (R) je
multiplikativní grupa. Je také vidět, že dva prvky x, y ∈ R jsou asociované, pokud existuje
jednotka u ∈ U (R) tak, že x = uy. Je zřejmé, že relace ∼ je ekvivalence a bylo by tedy
možné obor R faktorizovat na třídy této ekvivalence a pracovat pouze s reprezentanty
jednotlivých tříd. To je vhodné například pro okruhy polynomů, jak uvidíme dále.
Definice 2.9. Nenulový prvek x ∈ R \ U (R) se nazývá ireducibilní v R, jestliže pro každé
y, z ∈ R platí, že x = yz implikuje y ∈ U (R) nebo z ∈ U (R). Nenulový prvek x ∈ R\U (R)
se nazývá prvočíslo v R, jestliže pro každé y, z ∈ R platí, že x|yz implikuje x|y nebo x|z.
Zřejmě platí, že každý prvek asociovaný s ireducibilním prvkem je ireducibilní a každý
prvek asociovaný s prvočíslem je prvočíslo v R.
Příklad 2.10. V oboru integrity Z je grupa jednotek dvouprvková, U (Z) = {±1}. Asociované jsou tedy vždy jen prvky x a −x. Ireducibilními v Z jsou právě všechna prvočísla.
V obecném oboru integrity lze dokázat, že každé prvočíslo v R je ireducibilní v R.
Implikaci ovšem nelze obecně obrátit, jak uvidíme na příkladech dále v textu.
Věta 2.11. Všechna prvočísla v R jsou ireducibilní v R.
Důkaz. Nechť x je prvočíslo v R. Předpokládejme, že x = yz pro nějaké y, z ∈ R. Pak ale
x|yz a z prvočíselnosti plyne x|y nebo x|z. Jestliže x|y, pak z x = yz máme y|x, a proto
x ∼ y. Snadno nahlédneme, že pak z ∼ 1, a tedy z ∈ U (R).
Lze vyslovit různé postačující podmínky pro to, aby implikace v předchozí větě šla
obrátit. Jednou z nich je vlastnost jednoznačné faktorizace.
Definice 2.12. Obor integrity R nazveme Gaussův, jestliže pro každý nenulový prvek
x ∈ R \ U (R) existují ireducibilní prvky y1 , . . . , yr ∈ R tak, že x = y1 · · · yr , a navíc platí,
že je-li x = z1 · · · zs , pak r = s a yi ∼ zπ(i) pro nějakou permutaci π množiny {1, 2, . . . , r}.
Gaussovy obory integrity se někdy nazývají obory jednoznačné faktorizace.
Jednoznačná faktorizace zaručuje existenci největšího společného dělitele libovolného
páru nenulových prvků v oboru R, který je jednoznačný až na ekvivalenci ∼. Jednoznačná
faktorizace platí například v okruzích hlavních ideálů.
22
Definice 2.13. Množina I ⊂ R je ideál v oboru integrity R, pokud x + y ∈ I pro všechna
x, y ∈ I a navíc x × y ∈ I, pro každé x ∈ I, y ∈ R. Ideál generovaný jedním prvkem, tj.
tvaru I = xR, kde x ∈ R, se nazývá hlavní a značí se (x). Jestliže všechny ideály v R
jsou hlavní, pak o R řekneme, že to je okruh hlavních ideálů.
Věta 2.14. Nechť R je obor integrity. Je-li R okruh hlavních ideálů, pak je R Gaussův
obor.
Opačná implikace opět obecně neplatí, i když ve speciálním případě číselných oborů,
kterými se budeme zabývat v tomto textu, jsou oba pojmy ekvivalentní. Ještě speciálnějším typem oborů integrity jsou obory Eukleidovy. V těch platí pravidla dělitelnosti
velmi obdobná těm, které známe z oboru celých čísel Z.
Definice 2.15. Obor integrity R se nazývá Eukleidův, jestliže existuje funkce φ : R \
{0} 7→ N s následujícími vlastnostmi:
(i) pro každé nenulové x, y ∈ R platí, že x|y implikuje φ(x) ≤ φ(y);
(ii) pro každé nenulové x, y ∈ R existuje z, w ∈ R takové, že x = yz + w, přičemž buď
w = 0 nebo φ(w) < φ(y).
Věta 2.16. Nechť R je obor integrity. Je-li R Eukleidův, pak je okruhem hlavních ideálů.
Speciálně je i Gaussův, a každý ireducibilní prvek v R je prvočíslem v R.
V oboru celých čísel jsou dobře známy dva postupy hledání největšího společného
dělitele čísel a, b ∈ Z, který existuje, protože Z je Gaussův obor. Jeden z postupů využívá
rozkladu a i b na prvočísla. Hledání rozkladů je časově náročné a pro mnohamístná a, b
v podstatě nemožné. Druhý, mnohem rychlejší algoritmus využívá vlastnosti nsd(a, b) =
nsd(a − b, b), a tím převádí úlohu na čísla s menší absolutní hodnotou. V Z totiž absolutní
hodnota hraje roli funkce φ z definice Eukleidova oboru. Práce v Eukleidových oborech
je tedy příjemnější.
2.3
Okruhy polynomů
Necht’ R je okruh. Výraz
f (x) = an xn + an−1 xn−1 + · · · + a1 x + a0 ,
ai ∈ R ,
se nazývá (formální) polynom nad R. Když n je nejvyšší takový index, že an 6= 0, pak
řekneme, že f je polynom stupně n, značíme stf = n. Když ai = 0 pro všechna i, pak
23
f je nulový polynom, a pro něj stupeň nedefinujeme. Koeficient an polynomu stupně n
nazýváme vedoucí koeficient f . Je-li an = 1, nazveme f monický polynom.
Na množině polynomů zavádíme operaci sčítání po složkách, tj. je-li
f (x) = an xn + · · · + a0 ,
g(x) = bm xm + · · · + b0 ,
a bez újmy na obecnosti m ≤ n, pak položíme bm+1 = bm+2 = · · · = bn = 0 a
(f ± g)(x) = (an ± bn )xn + · · · (a1 ± b1 )x + a0 ± b0 .
Součin polynomů f, g je polynom
(f g)(x) =
m+n
X
c k xk ,
kde
ck = a0 bk + a1 bk−1 + · · · + ak b0 =
k=0
X
ai bj .
i+j=k
Množina polynomů nad okruhem R s těmito operacemi tvoří okruh, který značíme R[x].
Můžeme postupovat indukcí a definovat i polynomy více proměnných, které budou
tvořit okruh R[x1 , . . . , xm ] = (R[x1 , . . . , xm−1 ])[xm ], jehož prvky lze zapsat ve tvaru
X
f (x1 , x2 , . . . , xm ) =
ak1 k2 ...km xk11 x2k2 · · · xkmm , kde ak1 k2 ...km ∈ R .
k1 ,k2 ,...,km
Všechny pojmy zavedené v sekci 2.2 lze zkoumat i pro tuto množinu, protože platí
následující věta.
Věta 2.17. Je-li R obor integrity, pak i okruh polynomů R[x1 , . . . , xm ], kde m ∈ N, je
obor integrity.
Až do konce sekce 2.3 se zaměříme na okruhy T [x], kde T je komutativní těleso. Pro
ně totiž platí následující věta.
Věta 2.18. Je-li T komutativní těleso, pak okruh polynomů T [x] je Eukleidův obor. Roli
funkce φ : T [x] 7→ N hraje stupeň polynomu, φ(f ) = stf , pro f ∈ T [x].
Pro okruh T [x] tedy můžeme tedy vyslovit větu o dělení se zbytkem.
Věta 2.19 (o dělení polynomů). Necht’ f, g ∈ T [x], a necht’ g je nenulový polynom. Pak
existují jednoznačně určené polynomy q, r ∈ T [x] tak, že f = qg + r, přičemž r je bud’
nulový polynom nebo str < stg.
Úlohu jednotek v okruhu T [x] hrají konstantní polynomy a ∈ T \ {0}, polynomy f
a g jsou asociované f ∼ g, jestliže f = ag. Někdy je vhodné pracovat pouze s třídami
24
ekvivalence ∼ a z každé z nich vybrat jako reprezentanta jediný monický polynom, který
se v třídě nachází.
Protože T [x] je Eukleidův obor, splývají pojmy ireducibilního prvku a prvočísla, a to
jsou v T [x] právě polynomy ireducibilní nad T .
Definice 2.20. Polynom h ∈ T [x] kladného stupně se nazývá ireducibilní nad T , jestliže
jej nelze rozložit na součin h = f g, kde f, g ∈ T [x] a platí stf < sth, stg < sth.
V obecném Gaussově okruhu je rozklad na ireducibilní prvky jednoznačný až na pořadí
a násobení jednotkou. Ve Větě o jednoznačné faktorizaci na ireducibilní polynomy můžeme
přidat podmínku, že hledané ireducibilní polynomy jsou monické.
Věta 2.21. Necht’ f je monický polynom kladného stupně nad tělesem T . Pak existují
monické polynomy g1 , . . . , gk ∈ T [x] ireducibilní nad T tak, že f = g1 g2 · · · gk . Polynomy
g1 , . . . , gk jsou určeny jednoznačně až na pořadí.
Připomeňme formální definici největšího společného dělitele dvou polynomů. Abychom vyloučili nejednoznačnost z důvodu násobení konstantou, požadujeme od nsd(f, g)
monickost.
Definice 2.22. Necht’ f, g jsou nenulové polynomy nad tělesem T . Monický polynom
h ∈ T [x] nazveme největší společný dělitel polynomů f , g, jestliže
• h|f a h|g,
• každý polynom h̃ ∈ T [x] takový, že h̃|f a h̃|g, dělí h.
Takový polynom značíme h = nsd(f, g).
Snadno ověříme, že nsd(f, g) = nsd(f − qg, g) pro každý polynom q ∈ T [x]. Jako
důsledek máme následující tvrzení, které nám bude několikrát užitečné.
Věta 2.23. Necht’ f, g jsou nenulové polynomy nad tělesem T . Pak existují polynomy
u, v ∈ T [x] tak, že uf + vg = nsd(f, g).
Důkaz. Větu dokážeme indukcí na součet stupňů polynomů f a g. Bez újmy na obecnosti
předpokládejme, že oba polynomy jsou monické. Pokud stf + stg = 0, znamená to, že
f (x) = g(x) = 1. Potom nsd(f, g) = 1 a lze volit u(x) = 1 a v(x) = 0.
Nechť nyní stf + stg > 0 a bez újmy na obecnosti stf ≥ stg. Pak buď g|f , a tedy
nsd(f, g) = g a volíme u(x) = 0 a v(x) = 1. Nebo g 6 |f , a proto existují polynomy q a
r takové, že f = qg + r, přičemž str < stg. Protože str + stg < stf + stg, z indukčního
25
předpokladu existují polynomy ũ, ṽ tak, že ũr + ṽg = nsd(r, g). Protože platí nsd(f, g) =
nsd(f − qg, g) = nsd(r, g), a proto
nsd(f, g) = nsd(r, g) = ũr + ṽg = ũ(f − qg) + ṽg = ũf + (ṽ − ũq)g .
Za polynomy u, v lze tedy volit u = ũ a v = ṽ − ũq.
2.4
Konstrukce těles a tělesové automorfismy
Definice 2.24. Necht’ T s operacemi + a × je těleso a K ⊂ T . Pokud K s operacemi
+ a × zúženými na K je také těleso, pak K nazýváme podtělesem tělesa T . Na těleso T
pak lze nahlížet jako na vektorový prostor nad tělesem K. Dimenzi tohoto vektorového
prostoru značíme [T : K].
Příklad 2.25. Reálná čísla R jsou podtělesem komplexních čísel C; čísla 1 a i tvoří
bázi C nad R. Proto je [C : R] = 2. Rovněž je Q podtělesem R. V tomto případě je
[R : Q] = +∞.
Věta 2.26. Necht’ K je podtěleso tělesa L s [L : K] < +∞ a necht’ L je podtěleso tělesa
M s [M : L] < +∞. Pak
[M : K] = [M : L][L : K] .
Důkaz. Označme [L : K] = n a [M : L] = m. Necht’ e1 , e2 , . . . , en ∈ L je báze L nad K a
necht’ f1 , f2 , . . . , fm ∈ M je báze M nad L. Snadno lze ověřit, že soubor vektorů ei fj ∈ M
pro i = 1, 2, . . . , n a j = 1, 2, . . . , m tvoří bázi vektorového prostoru M nad K.
Tělesa, se kterými běžně pracují všechny oblasti matematiky, jsou nekonečná tělesa
Q, R, C a konečná tělesa Zp , pro provočíslo p. Připomeneme si postup, jak konstruovat i
další tělesa.
Věta 2.27. Necht’ T je komutativní těleso a f ∈ T [x] je ireducibilní polynom stupně n.
Definujme M := {g ∈ T [x] | stg < n} a operace ⊕ a ⊗ na M takto: součet g1 ⊕ g2 je
definovaný stejně jako v okruhu polynomů T [x], součin definujeme
g1 ⊗ g2 := zbytek po dělení polynomu g1 g2 polynomem p .
Pak množina M s operacemi ⊕ a ⊗ je těleso. Budeme jej značit T [x]/f .
26
Důkaz. Kvůli vlastnostem okruhu T [x] je důkaz této věty jednoduchý. Uzavřenost na
operace ⊕ a ⊗ je zřejmá, zrovna tak jako platnost distributivního zákona a existence
opačného prvku k prvku g vzhledem k ⊕. Pro existenci inverzního prvku k nenulovému
prvku g ∈ M vzhledem k ⊗ využijeme Větu 2.23, podle které najdeme polynomy u a v
tak, že ug + vf = nsd(g, p). Protože při konstrukci požadujeme iraducibilitu polynomu f ,
je nsd(g, f ) = 1, a proto je zbytek po dělení součinu polynomů ug roven 1.
Z konstrukce T [x]/f je jasné, že T je podtěleso nového tělesa T [x]/f . Proto má smyslu
otázka na dimenzi vektorového prostoru T [x]/f nad T . Jelikož polynomy 1, x, x2 , . . . , xn−1
jsou lineárně nezávislé nad T a lze z nich pomocí koeficientů z T nakombinovat libovolný
prvek v M , dostaneme následující tvrzení.
Důsledek 2.28. Necht’ T je komutativní těleso a f ∈ T [x] je ireducibilní polynom stupně
n. Pak
£
T [x]/f : T ] = n .
Příklad 2.29. Když uvažujeme ve větě 2.27 těleso R a nad ním ireducibilní polynom
f (x) = x2 + 1, dostaneme těleso R[x]/f , jehož prvky jsou polynomy stupně nanejvýš 1, tj.
tvaru a + xb, kde a, b ∈ R. Když místo písmenka x použijeme pro proměnnou písmenko i
dostaneme obvyklý zápis tělesa komplexních čísel C.
Předchozí příklad demonstruje, že tělesa C a R[x]/f jsou stejná, jenom jejich prvky
různě zapisujeme. Formalizujme tento vágní pojem „stejnosti”.
Definice 2.30. Bijektivní zobrazení ψ : T1 7→ T2 tělesa T1 s operacemi +1 a ×1 na těleso
T2 s operacemi +2 a ×2 se nazývá izomorfizmus, pokud
ψ(x +1 y) = ψ(x) +2 ψ(y) a ψ(x ×1 y) = ψ(x) ×2 ψ(y)
pro každé x, y ∈ T1 .
Pokud jsou si tělesa T1 a T2 rovny, nazýváme ψ automorfizmem tělesa T = T1 = T2 .
Množina automorfizmů tělesa spolu s operací skládání zobrazení tvoří grupu, tu budeme
značit Aut T .
Poznámka 2.31. Když zvolíme v okruhu Zp [x] dva ireducibilní polynomy f a g stejného
stupně n, pak lze dokázat, že tělesa Zp [x]/f a Zp [x]/g jsou izomorfní. Proto prvočíslo p a
stupeň polynomu n určují těleso až na izomorfizmus jednoznačně. Takové těleso má pn
prvků a zapisuje se GF (pn ), bez udání konkrétního polynomu. To však není obecným
pravidlem. Jak uvidíme v kapitole o algebraických tělesech, pro tělesa Q[x]/f bude tvar
polynomu f důležitý.
27
Věta 2.27 nám dala návod, jak zkonstruovat k tělesu T nějaké jeho nadtěleso. Následující jednoduchý fakt nám dá návod, jak hledat podtělesa tělesa T .
Lemma 2.32. Necht’ pro všechny parametry α indexové množiny I je T (a) podtělesem
tělesa T . Pak
\
T (a) je podtělesem tělesa T .
a∈I
Poznámka 2.33. Průnik všech podtěles tělesa T je minimálním podtělesem tělesa T a
nazývá se prvotěleso tělesa T . Protože prvotěleso musí obsahovat 0 a 1 a také musí být
uzavřené na operace + a ×, rozhoduje o tvaru prvotělesa fakt, zda součtem konečně mnoha
jedniček v T lze dostat výsledek 0. Když tomu tak není, řekneme, že charakteristika tělesa
T je 0 a jeho prvotělesem je Q, v opačném případě nazveme charakteristikou tělesa T číslo
p, kde p je minimální počet jedniček jejichž součet je roven nule. Prvotělesem tělesa T je
pak těleso Zp .
Příklad 2.34. Uvažujme L podtěleso tělesa C. Vezměme komplexní α, které je kořenem
polynomu f (x) = x2 + ax + b pro a, b ∈ L. Zkoumejme minimální těleso, které obsahuje
L i číslo α,
L(α) :=
\
{S | S je podtěleso C, L ⊂ S, α ∈ S} .
Je-li samotné α ∈ L, pak L(α) = L. V opačném případě je polynom f ireducibilní nad L
a L(α) je izomorfní tělesu L[x]/f . Podle Důsledku 2.28 je [L(α) : L] = 2.
Jak jsme už konstatovali, množina automorfizmů Aut T tělesa T tvoří grupu. Běžně
používaným automorfizmem (aniž mu tak říkáme) je komplexní združení ψ(a + ib) =
a + ib = a − ib v tělese C. Žádný běžně používaný automorfizmum tělesa R se nám
nevybaví. Důvod je jednoduchý, jak ukážeme za chvilku: grupa Aut R obsahuje pouze
indentitu.
Lemma 2.35. Necht’ T1 , T2 jsou tělesa s prvotělesem K. Nechť ψ : T1 7→ T2 je izomorfizmus. Pak
ψ(x) = x
pro každé x ∈ K .
Důkaz. Připomeňme, že prvotělesem K může být buď těleso Zp nebo Q. Nejdříve ukážeme,
že z vlastností ψ(x + y) = ψ(x) + ψ(y) plyne ψ(0) = 0 a ψ(−x) = −ψ(x). Máme totiž
ψ(0) = ψ(0 + 0) = ψ(0) + ψ(0)
=⇒
ψ(0) = 0 ,
0 = ψ(0) = ψ(x + (−x)) = ψ(x) + ψ(−x)
=⇒
ψ(−x) = −ψ(x) .
28
(2.1)
Uvažujme prvek x0 ∈ T , pro který ψ(x0 ) 6= 0. Pro k ∈ N máme
ψ(k)ψ(x0 ) = ψ(kx0 ) = ψ(x0 ) + · · · + ψ(x0 ) = kψ(x0 )
=⇒
ψ(k) = k .
(2.2)
Je-li prvotělesem Zp , je důkaz hotov. Předpokládejme proto, že K = Q. Ze vztahů (2.1)
a (2.2) plyne ψ(k) = k pro každé k ∈ Z. Pro p ∈ Z a q ∈ N dostaneme
¡ ¢
¡ ¢
¡ ¢
p = ψ(p) = ψ q pq = ψ(q)ψ pq = qψ pq
=⇒
ψ
¡p¢
q
=
p
q
.
Věta 2.36. Jediným automorfizmem tělesa R je identita.
Důkaz. Využijeme následujících tří vlastností tělesa R:
1. prvky R jsou uspořádané podle velikosti,
2. s každým kladným prvkem leží v R i jeho odmocnina,
3. mezi libovolnými dvěma prvky z R leží racionální číslo.
Nejdřív ukážeme, že automorfizmus zachovává uspořádání. Uvažujme a, b ∈ R, b > a.
Najděme c ∈ R tak, že b − a = c2 . Z definice automorfizmu plyne
ψ(b) − ψ(a) = ψ(b − a) = ψ(c2 ) = (ψ(c))2 > 0
=⇒
ψ(b) > ψ(a) .
Ted’ použijeme tvrzení Lemmatu 2.35. Kdyby pro a ∈ R platilo a 6= ψ(a), muselo by podle
vlastnosti 3. existovat y ∈ Q takové, že a < y < ψ(a) nebo ψ(a) < y < a. Je-li například
a < y, pak protože ψ zachovává uspořádání, máme ψ(a) < ψ(y) = y < ψ(a), a to je spor.
Případ y < a vyloučíme stejně.
Poznámka 2.37. V důkazu předchozí věty jsme využili jenom tří vyjmenovaných vlastností R (nepotřebovali jsme např. úplnost R). Proto jediným automorfizmem každého
tělesa, které má zmíněné vlastnosti, je identita.
29
3
Něco o polynomech
3.1
Polynomy nad C a nad R
Kořenem polynomu f ∈ T [x] rozumíme prvek α (obecně z nějakého nadtělesa U tělesa
T ) takový, že f (α) = 0. Je-li α kořenem f , pak f je dělitelný polynomem (x − α). Pro
polynomy s koeficienty v tělese komplexních čísel platí základní věta algebry, která říká,
že každý polynom kladného stupně má v C alespoň jeden kořen. Odtud už lze snadno
odvodit, že každý polynom f ∈ C[x] stupně stf = n má právě n kořenů v C a lze tedy
zapsat ve tvaru
f (x) = c
n
Y
(x − αi ) ,
kde c ∈ C .
i=1
Není těžké ukázat, že αj musí být navzájem různé, pokud je polynom f ireducibilní
nad Q.
Lemma 3.1. Necht’ f ∈ Q[x] je monický polynom ireducibilní nad Q. Pak f má n různých
kořenů v C.
Důkaz. Označme h největší společný dělitel f a f 0 . Protože f je ireducibilní nad Q, je
h = f nebo h = 1, ale h|f 0 , a proto h = 1. Protože h = nsd(f, f 0 ), existují polynomy
u, v tak, že h = uf + vf 0 . Jestliže β je alespoň dvojnásobný kořen polynomu f , pak
f (β) = f 0 (β) = 0, a proto taky h(β) = 0, což je spor s h = 1.
3.2
Polynomy nad Q a nad Z
Podívejme se nyní blíž na polynomy s koeficienty v tělese Q a okruhu Z. Pro takové
polynomy lze vyslovit několik zajímavých tvrzení ohledně jejich dělitelnosti.
Lemma 3.2 (Gaussovo lemma). Necht’ f, g ∈ Z[x] a každý koeficient součinu h = f g
je dělitelný prvočíslem p. Pak p dělí bud’ všechny koeficienty polynomu f nebo všechny
koeficienty polynomu g.
30
Důkaz. Necht’
f (x) =
n
X
i
ai x ,
g(x) =
i=0
Potom
h(x) =
m
X
b j xj ,
a i , bj ∈ Z .
(3.1)
j=0
m+n
X
ck xk ,
kde
ck =
k=0
X
ai bj .
(3.2)
i+j=k
Pro spor předpokládejme, že existuje prvočíslo p, které dělí všechny koeficienty polynomu
h = f g, a přitom p nedělí ani všechny koeficienty ai , ani všechny koeficienty bj . Označme
i0 , j0 nejmenší indexy takové, že p 6 |ai0 a p 6 |bj0 . Koeficient polynomu h u mocniny xi0 +j0
je roven
ci0 +j0 =
X
ai bj = ai0 bj0 +
X
ai bj ,
i+j=i0 +j0
kde ve druhé sumě sčítaḿe přes indexy i, j takové, že i + j = i0 + j0 a přitom i < i0 nebo
j < j0 . V této sumě je každý sčítanec dělitelný p, takže celkově koeficient ci0 +j0 dělitelný
p není, což je spor.
Poznámka 3.3. Tvrzení lemmatu je někdy ekvivalentně formulováno pomocí pojmu
primitivního polynomu. Polynom f ∈ Z[x] se nazývá primitivní, jestliže největší společný
dělitel jeho koeficientů je roven 1. Gaussovo lemma pak říká, že součin dvou primitivních
polynomů je opět primitivní polynom.
Ukážeme, že monický polynom v Q[x], který dělí nějaký monický polynom v Z[x], má
sám celočíselné koeficienty.
Lemma 3.4 (o faktorizaci celočíselných polynomů). Necht’ f ∈ Q[x], h ∈ Z[x] jsou
monické polynomy. Jestliže f |h, pak f ∈ Z[x].
Důkaz. Jestliže f |h, pak h = f g pro nějaký polynom g ∈ Q[x]. Protože f a h jsou monické,
je i polynom g monický. Polynomy f , g lze vynásobit celými čísly r, s ∈ Z tak, aby rf
a sg byly primitivní polynomy v Z[x]. Podle Gaussova lemmatu je součin primitivních
polynomů zase primitivní, ale přitom všechny koeficienty polynomu rsh = rsf g jsou
dělitelné číslem rs. Proto nutně rs = 1 a r = ±1, s = ±1. Odtud už ale zřejmě plyne
f ∈ Z[x].
Důsledkem Věty 3.4 je zajímavé kritérium ireducibility polynomů.
Věta 3.5 (Eisensteinovo kriterium ireducibility). Necht’ p ∈ Z je prvočíslo a necht’ h(x) =
P
j
xn + n−1
j=0 cj x ∈ Z[x]. Necht’ dále platí:
31
• p | cj pro všechna j ∈ {0, 1, 2, . . . , n − 1},
• p2 6 | c0 .
Pak h je ireducibilní nad Q.
Důkaz. Myšlenka důkazu je podobná jako u Gaussova lemmatu. Předpokládejme pro spor,
že polynom h je reducibilní nad Q, tedy že existují polynomy f, g stupně menšího než n
tak, že h = f g. Z Věty 3.4 plyne, že lze tyto polynomy zvolit monické, s celočíselnými
koeficienty, tedy ve tvaru (3.1), kde an = bm = 1 a proto p 6 |an a p 6 |bm . Označme i0 ,
j0 nejmenší indexy takové, že p 6 |ai0 a p 6 |bj0 . Ukážeme, že i0 = n a j0 = m. V opačném
případěby totiž bylo i0 + j0 < m + n. Polynom h = f g je pak tvaru (3.2). V sumě
ci0 +j0 =
X
ai bj = ai0 bj0 +
X
ai bj ,
i+j=i0 +j0
kde ve druhé sumě sčítaḿe přes indexy i, j takové, že i + j = i0 + j0 a přitom i < i0
nebo j < j0 . V této sumě je každý sčítanec dělitelný p. Protože ai0 bj0 není dělitelné p, i
koeficient ci0 +j0 není dělitelný p. Z předpokladu věty plyne i0 + j0 = m + n a proto i0 = n
a j0 = n.
Proto jsou oba koeficienty a0 i b0 dělitelné p a jejich součin c0 = a0 b0 je dělitelný p2 .
To je ovšem spor.
Příklad 3.6. Necht’ p je prvočíslo. Pomocí Eisensteinova kritéria ukážeme ireducibilitu
polynomu
2
f (x) = 1 + x + x + · · · + x
p−1
=
p−1
X
j=0
xj =
xp − 1
,
x−1
Abychom kritérium mohli vhodně použít, zaved’me polynom f˜(x) = f (x + 1). Pak
!
à p µ ¶
p µ ¶
p
X
X
(x
+
1)
−
1
1
p
1
p j
j
f˜(x) =
=
x −1 =
x =
x
x j=0 j
x j=1 j
¶
p µ ¶
p−1 µ
X
p j−1 X
p
=
x
=
xj .
j
j
+
1
j=1
j=1
¡¢
Protože koeficient u nejvyšší mocniny xp−1 je roven pp = 1, je polynom f˜ monický. Ostat¡¢
ní koeficienty polynomu f˜ jsou tvaru pi , kde 0 < i < p, jsou proto dělitelné prvočíslem
¡¢
p. Koeficient u x0 je roven p1 = p, tj. není dělitelný p2 . Polynom f˜ tedy splňuje předpoklady Eisensteinova kritéria, a proto není reducibilní nad Q. Odtud plyne, že ani f není
reducibilní nad Q. V opačném případě je f (x) = g(x)h(x) a f˜(x) = g(x + 1)h(x + 1) je
pak faktorizace f˜.
32
3.3
Cyklotomické polynomy
Číslo ζ ∈ C takové, že ζ n = 1, se nazývá n-tý kořen z jedničky. Tyto kořeny mají tvar
e
2πik
n
, pro k = 0, 1, . . . , n. Tvoří multiplikativní cyklickou grupu Wn , jejíž generátory
jsou primitivní n-té kořeny z jedničky, tj. ty, jejichž řád v grupě Wn je roven n. Je-li ζ
primitivní n-tý kořen z jedničky, pak ζ k je primitivní n-tý kořen z jedničky, právě když
k je nesoudělné s n. Proto je primitivních n-tých kořenů z jedničky právě ϕ(n), kde ϕ je
Eulerova funkce.
Definice 3.7. Necht’ ζ je nějaký primitivní n-tý kořen z jedničky. Polynom
Y
Φn (x) =
(x − ζ k )
k≤n, k⊥n
nazýváme n-tý cyklotomický polynom nad Q.
Poznámka 3.8. Stupeň n-tého cyklotomického polynomu je ϕ(n).
Polynom Φn (x) je vlastně součinem Φn (x) =
Q
(x − λ) přes všechny kořeny z jedničky
řádu n. Odtud snadno plyne následující rozklad polynomu xn − 1.
Věta 3.9. Necht’ n ∈ N. Pak platí
xn − 1 =
Y
Φd (x) .
d|n
Protože stupeň n-tého cyklotomického polynomu je roven ϕ(n), odvodili jsme následující vztah pro Eulerovu funkci.
Věta 3.10. Necht’ n ∈ N. Potom n =
P
d|n
ϕ(d).
Příklad 3.11. Rozložme na součin ireducibilních faktorů polynom x6 − 1. Z Věty 3.9
máme
x6 − 1 = Φ1 (x)Φ2 (x)Φ3 (x)Φ6 (x) .
Jednotlivé cyklotomické polynomy v součinu určíme přímo z definice, když si uvědomíme,
že mezi ζ k , k = 0, 1, . . . , 6, ζ = e
3 mají ζ 2 = e
2πi
3
a ζ4 = e
4πi
3
2πi
6
, má ζ 0 = 1 řád 1 v grupě W6 , ζ 3 = −1 řád 2, řád
πi
primitivní prvky grupy W6 (řádu 6 ve W6 ) jsou ζ 1 = e 3 a
33
ζ5 = e
5πi
3
. Je proto
Φ1 (x) = x − 1
Φ2 (x) = x + 1
³
´³
´
2πi
4πi
2π
3
3
Φ3 (x) = x − e
x−e
= x2 − 2x cos
+ 1 = x2 + x + 1
3
³
´³
´
πi
5πi
π
Φ6 (x) = x − e 3
x − e 3 = x2 − 2x cos + 1 = x2 − x + 1
3
Věta 3.12. Φn (x) má celočíselné koeficienty a koeficient absolutního členu je ±1.
Důkaz. Tvrzení dokážeme indukcí ne n. Víme, že Φ1 (x) = x−1 splňuje žádanou vlastnost.
Předpokládejme pro n > 1, že pro všechny d < n tvrzení platí. Máme
Y
Y
xn − 1 =
Φd (x) = Φn (x)
Φd (x)
d|n
d|n,d<n
Můžeme psát Φn (x) = a0 + a1 x + a2 x2 · · · + al xl pro nějaké l ∈ N. Podobně označme
Q
2
j
d|n,d<n Φd (x) = b0 + b1 x + b2 x + · · · + bj x . Tento polynom s použitím indukčního
předpokladu splňuje bi ∈ Z, b0 = ±1. Porovnáním koeficientů u jednotlivých mocnin x v
rovnosti
xn − 1 = (a0 + a1 x + a2 x2 · · · + al xl )(b0 + b1 x + b2 x2 + · · · + bj xj )
získáme postupně
x0 :
x1 :
2
x :
−1 = a0 b0
0 = a0 b1 + a1 b0
⇒
a0 = −b−1
0 = ±1 ,
⇒
a1 = −b−1
0 a0 b1
0 = a0 b2 + a1 b1 + a2 b0 ⇒
a2 =
−b−1
0 (a0 b2
∈ Z,
+ a1 b1 ) ∈ Z ,
atd.
Příklad 3.13. Nechť n = p je prvočíslo. Z Věty 3.9 platí xp − 1 = Φp (x)Φ1 (x) a proto je
p-tý cyklotomický polynom Φp (x) roven
Φp (x) =
xp − 1
= 1 + x + x2 + · · · + xp−1 .
x−1
Z Příkladu 3.6 víme, že tento polynom je ireducibilní nad Q.
Pro n = pk , kde p je prvočíslo a k ∈ N, opět použijeme Větu 3.9,
x
pk
−1=
k
Y
Φpj (x) = Φpk (x) · (xp
k−1
− 1) .
j=1
Odtud dostaneme
k
xp − 1
k−1
k−1
k−1
= 1 + xp + x2p + · · · + x(p−1)p .
Φpk (x) = pk−1
x
−1
34
Viděli jsme, že p-tý cyklotomický polynom pro p prvočíslo je ireducibilní nad Q. Ireducibilita Φn platí i obecně, důkaz ovšem přesahuje rámec tohoto textu.
Věta 3.14. Polynom Φn (x) je ireducibilní nad Q pro každé n ∈ N.
3.4
Symetrické polynomy
Každý polynom f stupně n s komplexními koeficienty má v C právě n kořenů. Mezi kořeny
a koeficienty tohoto polynomu existuje vztah. V případě kvadratického polynomu máme
(x − α1 )(x − α2 ) = x2 − (α1 + α2 )x + α1 α2 .
Podobně pro polynom třetího stupně je
(x − α1 )(x − α2 )(x − α3 ) = x3 − (α1 + α2 + α3 )x2 + (α1 α2 + α1 α3 + α2 α3 )x − α1 α2 α3 .
Není těžké ukázat, že obecně pro monický polynom stupně n s kořenẙ α1 , . . . , αn platí
f (x) =
n
Y
n
X
(x − αi ) = x +
(−1)i ei (α1 , α2 , . . . , αn )xn−i ,
n
i=1
i=1
kde ei jsou tzv. elementární symetrické funkce v n proměnných, definované takto:
X
e1 (x1 , . . . , xn ) = x1 + x2 + · · · + xn
=
xi ,
i
e2 (x1 , . . . , xn ) = x1 x2 + x1 x3 + · · · + xn−1 xn
=
X
xi xj ,
i<j
e3 (x1 , . . . , xn ) = x1 x2 x3 + x1 x2 x4 + · · · + xn−2 xn−1 xn =
X
xi xj xk ,
(3.3)
i<j<k
..
.
en (x1 , . . . , xn ) = x1 x2 x3 · · · xn .
Platí tedy násedující tvrzení.
Věta 3.15 (Viètovy vztahy). Pro každý monický polynom f (x) = xn +
Pn−1
i=0
ai xi s kořeny
α1 , . . . , αn platí an−i = (−1)i ei (α1 , α2 , . . . , αn ).
Zabývejme se ted’ polynomy v n proměnných. Necht’ f ∈ T [x1 , x2 , . . . , xn ], tj.
f (x1 , x2 , . . . , xn ) =
X
ak1 k2 ...kn xk11 xk22 · · · xk12 ,
ak1 k2 ...kn ∈ T .
k1 ,k2 ...kn
Jednotlivé sčítance s nenulovým koeficientem nazýváme členy polynomu. Exponent ki se
nazývá stupeň členu ak1 k2 ...kn xk11 xk22 · · · xk12 v proměnné xi . Podobně součet k1 + k2 + · · · +
35
kn je celkový stupeň členu, uspořádané n-tici (k1 , k2 , . . . , kn ) říkáme výška členu. Často
je výhodné uspořádat členy polynomu lexikograficky podle jejich výšek. Řekneme, že
výška (k1 , k2 , . . . , kn ) je lexikograficky ostře větší než výška (k̃1 , k̃2 , . . . , k̃n ), jestliže první
nenulový člen posloupnosti k1 − k̃1 , k2 − k̃2 , k3 − k̃3 , . . . je kladný. Zapisujeme
(k1 , k2 , . . . , kn ) Â (k̃1 , k̃2 , . . . , k̃n ) .
Člen polynomu f s lexikograficky největší výškou se nazývá vedoucí člen polynomu f .
Definice 3.16. Polynom f ∈ T [x1 , x2 , . . . , xn ] se nazývá symetrický, jestliže platí
f (x1 , x2 , . . . , xn ) = f (xπ(1) , xπ(2) , . . . , xπ(n) ) ,
pro každou permutaci π ∈ Sn .
Připomeňme, že v definici porovnáváme polynomy jako formální sumy, nikoliv hodnoty
polynomů v konkrétních n-ticích hodnot x1 , x2 , . . . , xn .
Příklad 3.17. Je zřejmé, že polynom f (x1 , x2 , x3 ) = x41 + x42 + x43 + 3x1 x2 x3 je symetrický
polynom ve třech proměnných. Není ovšem symetrický, je-li chápán jako polynom čtyř
proměnných. Výšky členů polynomu f jsou po řadě (4, 0, 0), (0, 4, 0), (0, 0, 4) a (1, 1, 1).
Příklad 3.18. Polynom g(x1 , x2 , x3 ) = x21 x2 + x22 x3 + x23 x1 není symetrický, protože
g(x1 , x2 , x3 ) 6= g(xπ(1) , xπ(2) , xπ(3) ) = x1 x22 + x2 x23 + x3 x21 ,
pro každou lichou permutaci π ∈ Sn .
Poznámka 3.19. Výška (k1 , k2 , . . . , kn ) vedoucího členu symetrického polynomu splňuje
k1 ≥ k2 ≥ · · · ≥ kn . Pro výšku (k̃1 , k̃2 , . . . , k̃n ) jakéhokoli jiného členu platí k̃i ≤ k1 .
Polynom, který vzniká součtem členů vytvořených z jediného členu permutací proměnných, se nazývá jednoduchý symetrický polynom. Výšky členů jednoduchého symetrického
polynomu jsou navzájem zpermutované n-tice. Jednoduchý symetrický polynom lze tedy
charakterizovat pomocí jediné výšky. Za tu volíme výšku vedoucího členu, tj. tu lexikograficky největší.
Příklad 3.20. Polynom f z Příkladu 3.17 je součtem dvou jednoduchých symetrických
polynomů
f1 (x1 , x2 , x3 ) = x41 + x42 + x43 ,
s výškou (4, 0, 0) ,
f2 (x1 , x2 , x3 ) =
s výškou (1, 1, 1) .
3x1 x2 x3 ,
36
Elementární symetrické funkce jsou jednoduché symetrické polynomy. Je zřejmé, že
P
e1 (x1 , . . . , xn ) =
má výšku (1, 0, 0, 0 . . . , 0) ,
i xi ,
P
e2 (x1 , . . . , xn ) =
má výšku (1, 1, 0, 0 . . . , 0) ,
i<j xi xj ,
P
e3 (x1 , . . . , xn ) =
má výšku (1, 1, 1, 0 . . . , 0) ,
i<j<k xi xj xk ,
..
.
en (x1 , . . . , xn ) = x1 x2 x3 · · · xn ,
má výšku
(1, 1, 1, 1, . . . , 1) .
Lemma 3.21. Symetrický polynom definovaný součinem ej11 · · · ejnn má vedoucí člen tvaru
xk11 xk22 · · · xknn , kde ki = ji + ji+1 + ji+2 + · · · + jn , pro i = 1, 2, . . . , n.
Důkaz. Stačí si uvědomit, že vedoucí člen součinu polynomů získáme násobením vedoucích členů jednotlivých činitelů a využít znalosti výšek určujících elementární symetrické funkce. Například proměnná x1 se vyskytuje ve vedoucím členu všech elementárních
symetrických funkcí, a proto vedoucí člen polynomu ej11 · · · ejnn má v proměnné x1 stupeň
k1 = j1 + j2 + j3 + · · · + jn . Proměnná x2 se nevyskytuje ve vedoucím členu e1 , proto
k2 = j2 + j3 + · · · + jn , atd.
Vzájemný vztah exponentů j1 , . . . , jn a k1 , . . . , kn lze tedy napsat takto:
k1
k2
= j1 + j2 + j3 + · · · + jn ,
= j2 + j3 + · · · + jn ,
..
.
kn−1 = jn−1 + jn ,
kn
= jn ,
j1
j2
= k1 − k2 ,
= k2 − k3 ,
..
.
jn−1 = kn−1 − km ,
jn
= kn .
Věta 3.22 (Základní věta o symetrických polynomech). Každý symetrický polynom f ∈
T [x1 , . . . , xn ] lze vyjádřit jako f = g(e1 , . . . , en ) pro nějaké g ∈ T [x1 , . . . , xn ] .
Důkaz. Budeme postupovat matematickou indukcí na výšku vedoucího členu polynomu
f . Protože výšky jsou lexikograficky uspořádané, je tento postup korektní. Pro první krok
indukce vezměme polynom f , jehož vedoucí člen má výšku (0, 0, . . . , 0). Takový polynom
je konstantní, tudíž už je zapsán v žádaném tvaru.
Nyní předpokládejme, že f má výšku vedoucího členu (k1 , k2 , . . . , kn ) a pro polynomy
s výškou vedoucího členu lexikograficky nižší než (k1 , k2 , . . . , kn ) už tvrzení věty platí. K
dané výšce (k1 , k2 , . . . , kn ) zkonstruujeme polynom ej11 ej22 · · · ejnn , kde ji = ki − ki+1 pro
i = 1, 2, . . . , n − 1 a jn = kn . Je-li ak1 k2 ...kn koeficient vedoucího členu polynomu f , pak
podle Lemmatu 3.21 polynom
f˜ = f − ak1 k2 ...kn ej11 ej22 · · · ejnn
37
má výšku vedoucího členu lexikograficky ostře menší než (k1 , k2 , . . . , kn ). Proto podle
indukčního předpokladu existuje polynom g̃ ∈ T [x1 , . . . , xn ] tak, že f˜ = g̃(e1 , . . . , en ).
Snadno odtud dostaneme, že
f = f˜ + ak1 k2 ...kn ej11 ej22 · · · ejnn = g̃(e1 , . . . , en ) + ak1 k2 ...kn ej11 ej22 · · · ejnn .
Proto hledaný polynom g ∈ T [x1 , . . . , xn ] má tvar g = g̃ + ak1 k2 ...kn xj11 xj22 · · · xjnn
Důkaz předchozí věty je konstruktivní, popisuje postup hledání polynomu g k danému
symetrickému polynomu f . Postup ilustrujeme v následujícím příkladě.
Příklad 3.23. Určíme polynom g z Věty 3.22 k polynomu f ∈ Q[x1 , x2 , x3 ] zadanému
f (x1 , x2 , x3 ) = x31 x2 + x31 x3 + x1 x32 + x1 x33 + x32 x3 + x2 x33 .
Zřejmě f je jednoduchý symetrické polynom určený výškou (3, 1, 0). Uvažujme polynom
ej11 ej22 ej33 , kde j1 = 3 − 1 = 2, j2 = 1 − 0 = 1, j3 = 0, tedy polynom
e21 e2 = (x1 + x2 + x3 )2 (x1 x2 + x1 x3 + x2 x3 ) =
= (x21 + x22 + x23 + 2x1 x2 + 2x1 x3 + 2x2 x3 )(x1 x2 + x1 x3 + x2 x3 ) =
= (x31 x2 + x31 x3 + x1 x32 + x32 x3 + x1 x33 + x2 x33 ) + 5(x21 x2 x3 + x1 x22 x3 + x1 x2 x23 )+
+ 2(x21 x22 + x21 x23 + x22 x23 ) .
Pak platí
(f − e21 e2 )(x1 , x2 , x3 ) = −2(x21 x22 + x21 x23 + x22 x23 ) − 5(x21 x2 x3 + x1 x22 x3 + x1 x2 x23 ) ,
což je opět polynom symetrický v proměnných x1 , x2 , x3 , tentokrát s nižší výškou ve2−0 0
2
doucího členu, a to (2, 2, 0). Součin e2−2
1 e2 e3 = e2 je tvaru
e22 (x1 , x2 , x3 ) = (x1 x2 +x1 x3 +x2 x3 )2 = (x21 x22 +x21 x23 +x22 x23 )+2(x21 x2 x3 +x1 x22 x3 +x1 x2 x23 ) ,
a proto máme
(f − e21 e2 + 2e22 )(x1 , x2 , x3 ) = −(x21 x2 x3 + x1 x22 x3 + x1 x2 x23 ) = −(x1 + x2 + x3 )x1 x2 x3 ,
Celkem tedy platí f = e21 e2 − 2e22 − e1 e3 .
38
4
Algebraická číselná tělesa
4.1
Algebraická čísla, minimální polynom
Definice 4.1. Číslo α ∈ C se nazývá algebraické, jestliže existuje monický polynom
f ∈ Q[x] tak, že f (α) = 0. Množinu všech algebraických čísel značíme A. Číslo, které není
algebraické, se nazývá transcendentní.
Příklad 4.2. Každé racionální číslo
x−
p
q
p
q
∈ Q je algebraické, protože je kořenem polynomu
∈ Q[x]. Je tedy Q ⊂ A.
Věta 4.3 (o minimálním polynomu). Necht’ α ∈ A. Pak existuje právě jeden monický polynom f ∈ Q[x] minimálního stupně, pro který f (α) = 0. Tento polynom splňuje
následující vlastnost: necht’ g ∈ Q[x] a g(α) = 0. Pak f |g.
Důkaz. Necht’ existuje kromě f ještě jiný monický polynom f˜ ∈ Q[x], pro který f˜(α) = 0 a
necht’ má stejný stupeň jako f . Pak nenulový polynom h = f −f˜ je stupně sth < stf = stf˜.
Přitom je h(α) = 0. Snadno vyrobíme monický polynom h̃ = a−1 h, kde a je vedoucí
koeficient polynomu h. Polynom h̃ taky splňuje h̃(α) = 0 a sth̃ < stf . To je ale spor s
definicí minimálního polynomu f .
Necht’ nyní g ∈ Q[x], g(α) = 0. Z věty o dělení polynomů lze napsat g = qf + h, kde
q, h ∈ Q[x] a je-li h nenulový polynom, pak sth < stf . Navíc h(α) = g(α) − q(α)f (α) = 0,
což vede opět ke sporu s definicí f . Proto h je nulový polynom, a tedy f dělí g.
Definice 4.4. Necht’ α ∈ A a necht’ f je monický polynom v Q[x] nejnižšího stupně,
pro který f (α) = 0. Polynom f nazveme minimálním polynomem čísla α. Jeho stupeň
nazýváme řádem čísla α.
Příklad 4.5.
• Je zřejmé, že racionální čísla jsou algebraická čísla řádu 1.
39
√
• Je-li k, n ∈ N, k, n ≥ 2, pak k n ∈ Q implikuje n = mk pro nějaké m ∈ N. Je-li totiž
√
k
n = mr pro navzájem nesoudělná m, r ∈ N, pak z rovnosti nrk = mk plyne n|mk
a z nesoudělnosti m a r zároveň mk |n. Proto n = mk .
• Číslo
√
2 je tedy iracionální, přitom je kořenem kvadratického polynomu s celočísel-
nými koeficienty, proto je to algebraické číslo řádu 2.
• Číslo
√
3
2 je algebraické řádu 3. Je kořenem polynomu x3 − 2. Zároveň není kořenem
žádného monického polynomu druhého stupně s racionálními koeficienty. Pak by
totiž
√
3
√
3
4 + a 2 = −b ,
pro nějaké a, b ∈ Q. Umocněním dostaneme
√
√
3
3
a2 4 + 2 2 = b2 − 4a .
Tyto dvě rovnosti lze chápat jako soustavu dvou rovnic pro dvě neznámé
√
3
4a
√
3
2s
racionálními koeficienty. Z Cramerova pravidla vyplývá, že řešením takové soustavy
√
je číslo racionální, což je spor s iracionalitou 3 2.
Lemma 4.6. Minimální polynom algebraického čísla α je ireducibilní nad Q. Naopak je-li
g ∈ Q[x] monický polynom ireducibilní nad Q takový, že g(α) = 0, pak g je minimálním
polynomem čísla α.
Důkaz. Označme f minimální polynom čísla α. Pro spor předpokládejme, že f je reducibilní. Pak f = gh pro nějaké polynomy g, h ∈ Q[x] takové, že sth, stg < stf . Máme
0 = f (α) = g(α)h(α), tj. alespoň jedno z g(α), h(α) je rovno 0. Necht’ například g(α) = 0.
Pak z Věty 4.3 polynom f dělí polynom g. To ovšem nelze, protože g je nenulový polynom
stupně ostře menšího než f .
Naopak je-li g ∈ Q[x] monický polynom ireducibilní nad Q takový, že g(α) = 0, pak
podle Věty 4.3 platí, že f dělí g. Ale protože g je ireducibilní, nutně g = cf pro nějaké
c ∈ Q. Ale protože oba polynomy f i g jsou monické, musí být c = 1, takže f = g.
Každému algebraickému číslu α ∈ A řádu n přísluší tzv. matice společnice2 Mα ∈ Qn×n
Pn−1
ai xi čísla α
definovaná pomocí koeficientů minimálního polynomu f (x) = xn + i=0
2
Anglický termín „companion matrix” zatím nemá standardizovaný český ekvivalent. U nás v kanceláři
se však již vžil uvedený termín „matice společnice”. Má někdo zajímavější návrh?
40
předpisem







Mα = 





0
1
0
···
0
0
0
0
1
···
0
0
0
..
.
0
..
.
0
..
.
···
.
0
..
.
0
..
.
0
0
0
···
0
1
..







.





−a0 −a1 −a2 · · · −an−2 −an−1
Charakteristický polynom této matice je právě minimální polynom čísla α. Vlastní číslo
α odpovídá vlastnímu vektoru vα = (1, α, . . . , αn−1 )T .
4.2
Vlastnosti množiny algebraických čísel
Vrat’me se nyní k množině algebraických čísel. Ukážeme, že množina A má zajímavou
algebraickou strukturu, je to totiž číselné těleso.
Věta 4.7. Algebraická čísla tvoří podtěleso C. ekvivalentně, necht’ α, β ∈ A. Potom α+β,
α − β, αβ leží v A. Když navíc α 6= 0, pak α−1 ∈ A.
Důkaz. Zjevně stačí ukázat, že množina A je uzavřená na operace sčítání a násobení a na
inverzní prvek. Formálně, chceme ukázat, že je-li α, β ∈ A, pak α + β, α − β, αβ leží v
A, a když navíc α 6= 0, pak α−1 ∈ A.
První část tvrzení snadno odvodíme pomocí matic společnic. Nechť α je algebraické
číslo řádu n a β algebraické číslo řádu m. Tenzorový součin matic Mα ⊗ Mβ a (Mα ⊗ Im ) ±
(In ⊗ Mβ ) jsou pak matice řádu mn s racionálními koeficienty. Navíc platí
¡
(Mα ⊗ Mβ )(vα ⊗ vβ ) = αβ(vα ⊗ vβ )
¢
(Mα ⊗ Im ) ± (In ⊗ Mβ ) (vα ⊗ vβ ) = (α ± β)(vα ⊗ vβ )
Číslo αβ (resp. α ± β) je tedy vlastní číslo matice Mα ⊗ Mβ ∈ Qmn×mn (resp. (Mα ⊗ Im ) ±
(In ⊗ Mβ ) ∈ Qmn×mn ) příslušné vlastnímu vektoru vα ⊗ vβ . Charakteristické polynomy
těchto matic jsou monické polynomy v Q[x], a proto jsou čísla αβ (resp. α±β) algebraická.
Zbývá dokázat, že převrácená hodnota nenulového algebraického čísla je také algeP
i
braické číslo. Necht’ α 6= 0, α ∈ A, a necht’ f (x) = xn + n−1
i=0 ai x je jeho minimální
polynom. Protože f je ireducibilní, je a0 6= 0. Lze tedy dělit rovnici f (α) = 0 číslem a0 αn .
Máme
1
0=
a0 αn
Ã
αn +
n−1
X
!
ai αi + a0
i=1
41
n−1
=
X an−i
1
+
α−i + α−n .
a0 i=1 a0
Máme proto monický polynom g(x) = xn +
Pn−i
i=1
−1
i
an−i a−1
0 x +a0 s racionálními koeficienty
a kořenem α−1 . Proto α−1 ∈ A.
Důkaz věty dává návod k nalezení monického polynomu v Q[x], který má kořen α ± β,
resp. αβ. V případě, že tento polynom je ireducibilní nad Q, pak je podle Lemmatu 4.6
zároveň minimálním polynomem daného čísla.
√
2, β = 3. V tomto případě máme
µ
¶
µ
¶
0 1
0 1
=
a
Mβ =
,
2 0
3 0
√
√
a
vβ = (1, 3) .
= (1, 2)
Příklad 4.8. Necht’ α =
Mα
vα
√
Příslušné tenzorové součiny

0 0 0
 0 0 2
Mα ⊗ Mβ = 
 0 3 0
6 0 0
matic jsou pak tvaru


1
0


0 
2
a (Mα ⊗ I2 ) + (I2 ⊗ Mβ ) = 
 3
0 
0
0
√ √ √
Vlastnímu vektoru vα ⊗ vβ = (1, 2, 3, 6)T těchto matic odpovídají
1
0
0
3
1
0
0
2

0
1 
.
1 
0
vlastní hodnoty
αβ, resp. α + β.
Snadno vypočítáme, že charakteristický polynom matice (Mα ⊗ I2 ) + (I2 ⊗ Mβ ) je
√
√
p(x) = x4 − 10x2 + 1 = (x2 − 5 − 2 6)(x2 − 5 + 2 6) =
q
q
q
q
³
√ ´³
√ ´³
√ ´³
√ ´
= x− 5−2 6
x+ 5−2 6
x− 5+2 6
x+ 5+2 6 ,
p
√
√
√
5 + 2 6 = 2 + 3. Je vidět, že polynom p(x) = x4 − 10x2 + 1 je
√ √
ireducibilní nad Q a proto číslo 2+ 3 je algebraické čtvrtého řádu a p je jeho minimální
není těžké ověřit, že
polynom.
Naopak charakteristický polynom matice Mα ⊗ Mβ je
q(x) = x4 − 12x2 + 36 = (x2 − 6)2 = (x −
je nad Q reducibilní takže číslo
√
6)2 (x +
√
6)2 ,
√ √
√
2 3 = 6 je druhého řádu. Jeho minimální polynom
je x2 − 6.
Důkaz Věty 4.7 umožňuje nalézt minimální polynom součtu, resp. součinu algebraických čísel. Ve skutečnosti ale existuje mnohem jednodušší způsob. Budeme potřebovat
pojem sdružených kořenů.
Připomeňme, že algebraické číslo α řádu n má minimální polynom f stupně stf = n.
Podle základní věty algebry lze monický polynom f rozložit na součin n kořenových
42
činitelů, f (x) =
Qn
j=1 (x
− αj ), kde αj jsou (obecně komplexní) kořeny polynomu f a
například α1 = α. Protože minimální polynom algebraického čísla je ireducibilní nad Q,
αj jsou navzájem různé.
Definice 4.9. Necht’ α je algebraické číslo řádu n a necht’ f je jeho minimální polynom.
Necht’
f (X) =
n
Y
(x − αj ) ,
α1 = α .
j=1
KO kořenech αj , j = 1, . . . , n, řekneme, že jsou navzájem sdružené.
Poznámka 4.10. Je zřejmé, že kořeny αj splňují podmínky Definice 4.1, proto jsou to
algebraická čísla. Navíc mají stejný minimální polynom jako α, proto jsou to algebraická
čísla stejného řádu jako α.
√
Příklad 4.11. Algebraické číslo α = α1 = 2 má pouze jeden sdružený kořen, a to
√
√
√
√
α2 = − 2, protože x2 − 2 = (x − 2)(x + 2). Podobně sdružený kořen k β = β1 = 3
p
√
√
√
√
je β2 = − 3. Z Příkladu 4.8 vidíme, že sdružené kořeny k číslu 2 + 3 = 5 + 2 6
p
p
p
√
√
√
jsou 5 − 2 6, − 5 + 2 6 a − 5 − 2 6. Přepíšeme-li tato čísla do jiného tvaru,
q
q
√
√
√
√
√
√
5 + 2 6 = 2 + 3,
5 − 2 6 = − 2 + 3,
q
q
√
√
√
√
√
√
− 5 − 2 6 = 2 − 3,
− 5 + 2 6 = − 2 − 3.
zjistíme, že sdružené kořeny polynomu p(x) = x4 − 10x2 + 1 jsou právě αi + βj , i = 1, 2,
j = 1, 2.
Podobná zákonitost jako v Příkladu 4.11 platí obecně v poněkud slabší formě.
Tvrzení 4.12. Necht’ α ∈ A, řádu n má sdružené kořeny α1 = α, α2 , . . . , αn , a necht’
β ∈ A řádu m má sdružené kořeny β1 = β, β2 , . . . , βn . Potom sdružené kořeny čísla α + β,
resp. αβ, najdeme mezi αi + βj , i = 1, . . . , n, j = 1, . . . , m, resp. αi βj , i = 1, . . . , n,
j = 1, . . . , m.
Důkaz. Dokážeme, že
n Y
m
Y
(x − αi − βj ) ∈ Q[x] ,
i=1 j=1
n Y
m
Y
(x − αi βj ) ∈ Q[x] .
i=1 j=1
Pak bude z Věty 4.3 zřejmé, že minimální polynom čísla α + β, resp. αβ dělí (po řadě)
výše uvedené polynomy nad Q, a důkaz bude hotov. Myšlenku předvedeme na prvním z
dvojných produktů. Vyjádříme jej jako polynom v elementárních symetrických funkcích
43
proměnných α1 , . . . , αn , respektive β1 , . . . , βm , což jsou – coby koeficienty minimálního
polynomu čísla α, resp. β – racionální čísla. Součin
F (x; α1 , . . . , αn ; β1 , . . . , βm ) =
m
n Y
Y
(x − αi − βj )
i=1 j=1
lze chápat jako polynom v proměnných β1 , . . . , βm s parametry x a α1 , . . . , αn . V těchto
proměnných je symetrický a jako takový lze (podle Věty 3.22) napsat jako polynom v
elementárních symetrických funkcích e1 , . . . , em kořenů β1 , . . . , βm ,
F (β1 , . . . , βm ; x, α1 , . . . , αn ) = G(e1 , . . . , em ; x, α1 , . . . , αn ) ,
kde e1 = e1 (β1 , . . . , βm ), . . . , em = em (β1 , . . . , βm ) jsou nyní racionální hodnoty. Polynom
G lze teď také chápat jako symetrický polynom v proměnných α1 , . . . , αn , přičemž x je
parametr. Proto lze psát
G(α1 , . . . , αn ; x) = H(ẽ1 , . . . , ẽn ; x) ,
kde opět ẽ1 = ẽ1 (α1 , . . . , αn ), . . . , ẽn = ẽn (α1 , . . . , αn ) jsou racionální čísla. Polynom H
(jako polynom v proměnné x) má tedy racionální koeficienty, což jsme měli ukázat.
Dokázali jsme, že všechny sdružené kořeny čísla α+β (resp. αβ) jsou tvaru αi +βj (resp.
αi βj ). Narozdíl od Příkladu 4.11, v obecném případě nemusí všechna čísla αi + βj (resp.
αi βj ) být sdruženými kořeny k α + β. Může se tak stát v případě, že řád algebraického
čísla α + β (resp. αβ) nebude součinem řádů čísel α a β.
Podobný argument jako v důkazu předchozího tvrzení umožňuje dokázat, že těleso A
je algebraicky uzavřené, tedy že každý nekonstantní polynom s koeficienty v A má v A
alespoň jeden kořen. To už implikuje, že každý polynom stupně n s koeficienty v A má v
A právě n kořenů. Technický důkaz pomocí symetrických polynomů zde ovšem provádět
nebudeme, protože větu bude možno dokázat velmi elegantně na konci příští sekce.
O množině A ale můžeme dokázat ještě jednu zajímavou vlastnost.
Tvrzení 4.13. A je spočetná množina.
Důkaz. Každé algebraické číslo je kořenem nějakého polynomu v Z[x]. Takových polynomů pevného stupně je spočetně mnoho. Nyní si stačí uvědomit, že spočetné sjednocení
spočetných množin je spočetné.
44
4.3
Algebraická číselná tělesa
Pro číslo α ∈ C definujme množinu
Q(α) :=
\
{ T | T je podtělesem C, α ∈ T } .
(4.1)
Tedy Q(α) je minimální podtěleso tělesa C, které obsahuje číslo α. Snadno nahlédneme,
že množina
n Pn a α i
i=0 i
Pm
F :=
j
j=0 bi α
m
¯
o
X
¯
bi αj 6= 0
¯ n, m ∈ N0 , ai , bj ∈ Q,
(4.2)
j=0
musí být nutně obsažená v Q(α). Na druhé straně je tato množina uzavřená na odčítání
a dělení, a je to tedy podtěleso tělesa C. Proto Q(α) = F .
Poznámka 4.14. Pokud α je transcendentní, tedy není kořenem žádného polynomu s
racionálními koeficienty, jsou jeho mocniny 1 = α0 , α, α2 , α3 , α4 . . . lineárně nezávislé nad
Q, a tedy [Q(α) : Q] = +∞. Jinými slovy pokud dimenze tělesa Q(α) jako vektorového
prostoru nad Q je konečná, musí být α ∈ A.
Je-li α algebraické číslo, lze prvky tělesa Q(α) vyjádřit jednodušeji, než jako prvky
množiny F ze vztahu (4.2).
Příklad 4.15. Uvažujme těleso Q(i), kde i2 = −1. Jak víme, pro a, b, c, d ∈ Q je
a + bi
a + bi c − di
ac + bd + i(bc − ad)
=
=
.
c + di
c + di c − di
c2 + d 2
Proto je Q(i) = {a + bi | a, b ∈ Q}.
Věta 4.16. Necht’ α je algebraické číslo řádu n. Potom
Q(α) = {a0 + a1 + · · · + an−1 αn−1 | ai ∈ Q} .
(4.3)
Důkaz. Označme pravou stranu jako množinu M := {a0 + a1 + · · · + an−1 αn−1 | ai ∈
Q} = {g(α) | g ∈ Q[x], g = 0 nebo stg < n}. Především je zřejmé, že M ⊂ Q(α).
Ukažme, že M = {g(α) | g ∈ Q[x]}. Inkluze ⊂ je zřejmá. Naopak je-li g ∈ Q[x], pak
existují polynomy q, h ∈ Q[x] tak, že g = qf + h, kde f je minimální polynom čísla α.
Protože h = g − qf , je h(α) = g(α), přitom h je bud’ nulový polynom, nebo sth < n,
takže M ⊃ {g(α) | g ∈ Q[x]}.
Protože Q[x] je okruh, je i M okruh. Zbývá dokázat, že ke každému nenulovému
prvku obsahuje M i inverzní prvek. Necht’ 0 6= β ∈ M . Pak β = g(α) pro nějaký polynom
45
g ∈ Q[x]. Kdyby f dělilo g, pak g(α) = β = 0. Proto f 6 |g. Necht’ h = nsd(f, g) v Q[x].
Protože f je ireducibilní, h je bud’ rovno konstantnímu polynomu 1 nebo f . Ale h = f
nelze, protože f 6 |g. Proto h = 1. Z Věty 2.23 existují polynomy u, v ∈ Q[x] tak, že h =
1 = uf +vg. Ale u(α)f (α)+v(α)g(α) = v(α)g(α) = 1, takže β −1 = (g(α))−1 = v(α) ∈ M .
Ukázali jsme, že množina M je těleso. Protože Q(α) je minimální podtěleso C obsahující
α, musí být M ⊃ Q(α), a tedy M = Q(α).
Čtenář si jistě uvědomil, že předchozí důkaz kopíruje důkaz faktu, že pro ireducibilní
polynom f je Q[x]/f těleso. Rozdíl spočívá pouze v tom, že Q[x]/f je množina polynomů,
kdežto Q(α) je podmnožina C. Nicméně tělesa Q[x]/f a Q(α), kde f je minimální polynom
čísla α ∈ A, jsou izomorfní s izomorfismem ψ(g) = g(α) pro g ∈ Q[x]/f .
Vztah (4.3) vyjadřuje, že je-li n řád čísla α, pak prvky 1, α, α2 , . . . , αn−1 tvoří bázi
tělesa Q(α) nad Q.
Definice 4.17. Těleso Q(α) pro α ∈ A se nazývá číselné těleso, jeho dimenze jako
vektorového prostoru nad tělesem Q se nazývá řád Q(α).
Zobecníme definici (4.1),
Q(α, β) :=
\
{ T | T je podtělesem C, α, β ∈ T } .
(4.4)
Ukažme, že pro α, β ∈ A lze prvky tohoto tělesa hezky popsat.
Věta 4.18 (O primitivním prvku). Necht’ α, β ∈ A. Pak existuje γ ∈ A tak, že Q(α, β) =
Q(γ).
Důkaz. Necht’ α, β jsou algebraická čísla řádu n, resp. m. Je jasné, že těleso Q(α, β)
obsahuje množinu
M :=
( n−1 m−1
XX
)
¯
¯
cjk αj β k ¯¯ cjk ∈ Q .
j=0 k=0
Je snadno vidět, že tato množina je uzavřená na odčítání a násobení, je to okruh. Ukážeme,
že je to těleso, a to tak, že předvedeme, že je rovna Q(γ) pro vhodné γ ∈ A. Nechť
f (x) =
n
Y
(x − αi ) ,
resp.
g(x) =
i=1
m
Y
(x − βj ) .
j=1
jsou minimální polynomy čísel α, resp. β. Pro jednoduchost uvažujme α = α1 , β = β1 .
Rovnice
α + xβ = αi + xβj
46
má právě jedno řešení xij =
αi −α
β−βj
pro každé i = 1, 2, . . . , n a každé j = 2, 3, . . . , m. Zvolme
libovolné nenulové c ∈ Q takové, že c 6= xij pro všechna i a j, a položme γ = α + cβ.
Dokážeme, že Q(γ) = M . Zřejmě γ ∈ M , což je okruh. Proto platí inkluze Q(γ) ⊂ M .
Pro opačnou inkluzi stačí ukázat, že α, β ∈ Q(γ).
Definujme polynom h(x) = f (γ − cx) ∈ T [x], kde T = Q(γ). Protože c 6= 0, je
sth = stf = n. Navíc platí h(β) = f (γ − cβ) = f (α) = 0. Polynomy h a g mají tedy
společný kořen β. Ukažme, že nemají žádný jiný společný kořen. Kdyby totiž existovalo
δ tak, že h(δ) = g(δ) = 0, pak δ musí být jeden ze sdružených kořenů k β, tj. δ = βj pro
nějaké j = 2, 3, . . . , m. Pak ale h(βj ) = f (γ − cβj ) = 0, takže γ − cβj je rovno jednomu
ze sdružených kořenů k α, například γ − cβj = αi , odtud ale γ = α + cβ = αi + cβj , což
dále implikuje c = xij . To ovšem odporuje volbě parametru c.
Když ovšem polynomy g a h mají jediný společný kořen β, pak jejich největším společným dělitelem jako polynomů nad tělesem C je lineární polynom x − β. Protože ale
oba polynomy g a h mají koeficienty ve stejném tělese T = Q(γ), při hledání nsd(g, h)
Eukleidovým algoritmem v rámci dělení polynomů dostáváme koeficienty opět v T , a
proto nsd(g, h) ∈ T [x]. Proto β ∈ Q(γ) a α = γ − cβ ∈ Q(γ). Tím je důkaz dokončen.
√
√
3 je číslo γ = 2 + 3
√ √
algebraické, a to řádu 4. Je to zárověn vhodné γ do Věty 4.18, tj. těleso Q( 2, 3) =
√
√
√ √
√
√
Q( 2 + 3). Protože 2, 3 ∈ Q( 2 + 3) musí existovat polynom g ∈ Q[x], stg < 4,
√
√
√
tak, že g( 2 + 3) = 2. Polynom g je tedy tvaru g(x) = a + bx + cx2 + dx3 . Po dosazení
Příklad 4.19. V Příkladu 4.8 jsme viděli, že pro α =
máme
√
2, β =
√
√
√
√
√
√
√
√
√
g( 2 + 3) = a + b( 2 + 3) + c( 2 + 3)2 + d( 2 + 3)3
√
√
√
= a + 5c + 2(b + 11d) + 3(b + 9d) + 2c 6 .
√ √ √
Protože prvky 1, γ, γ 2 , γ 3 tvoří bázi Q(γ) nad Q, snadno nahlédneme, že i 1, 2, 3, 6
√
√
√
tvoří takovou bázi, tj. jsou lineárně nezávislé nad Q. Má-li tedy být g( 2 + 3) = 2,
stačí porovnat koeficienty u těchto bazických prvků,
a + 5c = 0 ,
b + 11d = 1 ,
b + 9d = 0 ,
což snadno implikuje a = c = 0, b = − 92 a d =
1
.
2
2c = 0 ,
Polynom g je tudíž tvaru g(x) =
− 92 x + 21 x3 .
Je zřejmé, že matematickou indukcí bychom snadno dokázali Větu 4.18 dále zobecnit.
Lze pak vyslovit následující důsledek.
47
Věta 4.20. Pro každé podtěleso K tělesa C konečné dimenze nad Q existuje číslo α ∈ A
tak, že K = Q(α).
Důkaz. Nechť dimenze tělesa K nad Q je n. Pak existuje n prvků β1 , β2 , . . . , βn ∈ K
lineárně nezávislých nad Q. Těleso Q(βi ) je podtělesem tělesa K, a proto musí mít rovněž
konečnou dimenzi nad Q. Proto jsou podle poznámky 4.14 všechna βi ∈ A. Z matematické
indukce pomocí Věty 4.18 je snadno vidět, že že pro každé r lze těleso Q(β1 , β2 , . . . , βr )
vyjádřit jako Q(α) pro nějaké α ∈ A. Protože β1 , . . . , βn jsou bazické prvky tělesa K, je
Q(β1 , . . . , βn ) = Q(α) = K.
Poznámka 4.21. Každé podtěleso K tělesa C konečné dimenze n nad Q je tedy algebraické číselné těleso ve smyslu Definice (4.17). Číslo α splňující K = Q(α) se nazývá
primitivní prvek v tělese K. Poznamenejme, že samozřejmě není určen jednoznačně, lze
volit libovolné číslo β ∈ K, jehož řád je roven řádu K, protože prvky 1, β, . . . , β n−1 jsou
rovněz lineárně nezávislé nad Q.
Jako zajímavý důsledek Věty 4.20 uvedeme následující tvrzení.
Věta 4.22. A je algebraicky uzavřené těleso.
Důkaz. Nechť f ∈ A[x] je polynom stupně n > 0 s koeficienty v tělese algebraických čísel.
Musíme ukázat, že v A leží alespoň jeden jeho kořen. Důkaz provedeme matematickou
indukcí na n. Je-li n = 1, pak f (x) = αx + β, kde α, β ∈ A. Jediný kořen polynomu f
je roven −β/α ∈ A. Nechť nyní n > 1. Podle Věty 4.18 existuje těleso K = Q(γ), které
obsahuje všechny koeficienty polynomu f , tj. f ∈ K[x]. Mohou nastat dvě možnosti. Buď
je f reducibilní nad K, f = gh, kde g, h ∈ K[x], kde stg, sth < n. Pak ale z indukčního
předpokladu polynomy g, h mají v A alespoň jeden kořen, a tudíž i f má v A kořen.
Pokud je f ireducibilní nad K, lze zkonstruovat těleso K[x]/f . Označíme-li α ∈ C jeden
z kořenů polynomu f , pak těleso K[x]/f je izomorfní tělesu K(α), tedy minimálnímu
podtělesu tělesa C, které obsahuje K i α. Těleso K(α) má dimenzi n = stf nad K.
Protože ale K = Q(γ), pro nějaké γ ∈ A, je dimenze m tělesa K nad Q konečná, rovna
řádu algebraického čísla γ. Celkem máme
£
¤ £
¤ £
¤
K(α) : Q = K(α) : K · K : Q = n · m < +∞ .
S použitím Věty 4.20 vidíme, že K(α) je číselné těleso a všechny jeho prvky, tedy i α,
jsou algebraická čísla.
48
4.4
Izomorfizmy těles Q(α)
Necht’ α1 , . . . , αn jsou sdružené kořeny k algebraickému číslu α = α1 . Zkoumejme, jaký
vztah mají tělesa Q(α1 ), . . . , Q(αn ).
Příklad 4.23. Necht’ α je algebraické číslo druhého řádu, a nechť f (x) = x2 + ax + b,
a, b ∈ Q, je jeho minimální polynom. Označme α0 druhý kořen polynomu f . Z Viètových
vztahů víme, že α + α0 = −a. Proto α0 = −a − α ∈ Q(α). Pro každé těleso druhého řádu
tedy platí Q(α) = Q(α0 ).
Obecně ale takto jednoduchý vztah neplatí, jak si ukážeme na následujícím příkladě.
√
Příklad 4.24. Polynom f (x) = x3 − 2 má pouze jeden reálný kořen α = 3 2. Další dva
√ 2πi
√ 4πi
kořeny, α0 = 3 2e 3 , α00 = 3 2e 3 jsou navzájem komplexně sdružená čísla. Protože je
ale Q(α) ⊂ R, je nutně Q(α) 6= Q(α0 ).
V předcházejícím příkladě neplatí rovnost mezi tělesy Q(α) a Q(α0 ), protože těleso
Q(α) obecně neobsahuje všechny kořeny minimálního polynomu f pro α.
Nejmenší podtěleso tělesa C, nad kterým je f úplně reducibilní, tj. ve kterém leží
všechny kořeny polynomu f , se nazývá rozkladové těleso polynomu f . Rozkladové těleso
T polynomu f ∈ Q[x] s kořeny α1 , . . . , αn je tedy rovno T = Q(α1 , . . . , αn ). Lze ukázat,
že toto těleso má řád nejvýše n!.
Příklad 4.25. Pokračování Příkladu 4.24. Rozkladové těleso polynomu f (x) = x3 − 2
√
najdeme rozšířením tělesa Q o všechny kořeny f , tj. o algebraická čísla α1 = 3 2, α2 =
√
√ 4πi
2πi
3
2e 3 a α3 = 3 2e 3 . Rozšíření provedeme pomocí návodu v důkazu věty o primitivním
√
√ 2πi
prvku (Věta 4.18). Položme α = 3 2, β = 3 2e 3 . Je zřejmé,že α i β mají stejné sdružené
kořeny. Číslo γ volíme jako α + cβ pro nějaké nenulové c ∈ Q takové, že
c 6=
αi − α1
.
α2 − αj
To zajistíme například volbou c = 2. Najděme polynom, který má γ =
kořen,
Y
(x − αi − βj )
= (x −
i,j
× (x −
× (x −
√
3
√
3
2e
2e
√
3
√
3
√ 2πi
2 + 2 3 2e 3 za
√
√
√
√
√
2πi
4πi
3
3
3
3
3
2 − 2 2e 3 )(x − 2 − 2 2)(x − 2 − 2 2e 3 ) ×
2πi
3
√
√
√
√
√
2πi
2πi
2πi
4πi
3
3
3
3
3
− 2 2e 3 )(x − 2e 3 − 2 2)(x − 2e 3 − 2 2e 3 ) ×
4πi
3
√
√
√
√
√
2πi
4πi
4πi
4πi
3
3
3
3
3
− 2 2e 3 )(x − 2e 3 − 2 2)(x − 2e 3 − 2 2e 3 ) =
= (x6 + 108)(x3 − 54) .
49
Je zřejmé, že hledaný ireducibilní polynom nad Q, který má γ za kořen, je x6 + 108. To
je tedy minimální polynom čísla γ. Těleso
√
√
√
√
2πi
2πi
3
3
3
3
Q(α, β) = Q( 2, 2e 3 ) = Q( 2 + 2 2e 3 ) = Q(γ)
je tedy 6. řádu. Toto těleso už je rozkladové těleso polynomu x3 − 2. K tomu stačí ukázat,
√ 4πi
že kořen α2 = 3 2e 3 už v tělese Q(γ) leží. Ale to je zřejmě pravda. Z Viètových vztahů
totiž víme, že
α1 + α2 + α3 =
Je tedy
√
3
2e
4πi
3
√
3
2+
√
3
2e
2πi
3
+
√
3
2e
4πi
3
= 0.
√
√
√
√
2πi
2πi
3
3
3
3
= − 2 − 2e 3 ∈ Q( 2, 2e 3 ) = Q(γ) .
Přestože obecně neplatí Q(α) = Q(αj ), tato tělesa mají stejnou strukturu. Jsou totiž
isomorfní. Definujme zobrazení σj : Q(α) → Q(αj ) předpisem
σj (g(α)) := g(αj ) .
Tato zobrazení jsou dobře definovaná. Lze-li prvek β ∈ Q(α) zapsat pomocí dvou různých
polynomů g1 , g2 , tj. je-li β = g1 (α) = g2 (α), pak (g2 − g1 )(α) = 0, proto podle Věty 4.3
f |g2 −g1 . Odtud plyne, že také (g2 −g1 )(αj ) = 0, tudíž g1 (αj ) = g2 (αj ). Definice zobrazení
σj je tedy korektní.
Ukažme, že σj je isomorfismus těles Q(α), Q(αj ).
Věta 4.26. Necht’ αj je sdružený kořen k α. Zobrazení σj : Q(α) → Q(αj ) definované
předpisem σj (g(α)) := g(αj ) je isomorfismus těles Q(α), Q(αj ).
Důkaz. Necht’ β = g(α), γ = h(α) jsou dva prvky z tělesa Q(α). Pak
σj (β + γ) = σj (g(α) + h(α)) = σj ((g + h)(α)) =
= (g + h)(αj ) = g(αj ) + h(αj ) = σj (β) + σj (γ) .
Naprosto analogicky ukážeme σj (βγ) = σj (β)σj (γ). Protože zobrazení σj zobrazí bázi
tělesa Q(α) na bázi tělesa Q(αj ) (tj. soubor 1, α, . . . , αn−1 na soubor 1, αj , . . . , αjn−1 ), je
zobrazení σj bijekce a tedy izomorfizmus.
Poznámka 4.27. Speciálně máme σj (cβ) = cσj (β) pro c ∈ Q, β ∈ Q(α), a σj (c) = c pro
c ∈ Q. Taky σj (h(β)) = h(σj (β)) pro každé h ∈ Q[x].
Věta 4.28. Nechť α ∈ A. Jediná podtělesa tělesa C izomorfní s Q(α) jsou Q(αi ), kde αi
jsou sdružené kořeny k α.
50
Důkaz. Použijeme Lemma 2.35. Je-li totiž T ⊂ C podtěleso tělesa komplexních čísel a
ψ : Q(α) 7→ T je izomorfismus, pak ψ zachovává Q, tj. ψ(c) = c pro každé c ∈ Q.
Ukážeme, že ψ je roven zobrazení σi pro nějaké i = 1, . . . , n. Zřejmě stačí ukázat, že
Pn−1
ψ(α) = σi (α) = αi pro nějaké i ∈ {1, 2, . . . , n}. Nechť f (x) = xn + i=0
ai xi je minimální
polynom čísla α. Platí f (α) = 0 a proto
¡
¢
¡
¢
0 = ψ(0) = ψ f (α) = f ψ(α) .
Proto je ψ(α) nutně kořenem minimálního polynomu f , a tedy rovno αi pro nějaké i.
Není překvapivé, že tělesa Q(αi ), i = 1, . . . , n, kde α1 , . . . , αn jsou kořeny stejného polynomu f , jsou navzájem izomorfní, protože jsou izomorfní tělesu Q[x]/f . Fakt, že jinému
podtělesu tělesa C izomorfní nejsou, už tak triviální není. Spočívá v tom, že jsou-li f a f˜
různé monické polynomy ireducibilní nad Q, pak Q[x]/f , Q[x]/f˜ jsou neizomorfní tělesa. To
může být překvapující, uvědomíme-li si, ze zaměníme-li Q libovolným koneňým tělesem,
takové tvrzení neplatí. Podobně i v případě záměny Q za těleso reálných čísel. Například
těleso R[x]/x2 +1 je izomorfní tělesu R[x]/x2 +x+1 , a obě jsou izomorfní C.
Věta 4.28 vyjadřuje, že každé podtěleso C konečné dimenze n nad Q (tedy každé
algebraické číselné těleso řádu n) má v C n izomorfních kopií. Je zajímavé poznamenat,že
celé těleso A všech algebraických čísel má pouze jeden neidentický automorfismus, a to
komplexní sdružení. Z Poznámky 2.37 totiž plyne, že jediný automorfismus tělesa A ∩
R je identita. Analogicky k důkazu Věty 4.28 bychom ukázali, že i se při libovolném
automorfismu A zobrazuje na sebe nebo na −i. Dohromady je tedy jediným neidentickým
automorfismem tělesa A = (A ∩ R) + i(A ∩ R) komplexní sdružení.
Poznámka 4.29. Těleso Q(α), pro které platí, že σj (Q(α)) = Q(α) pro všechna j, se
nazývá Galoisovo těleso. Isomorfismy σj jsou pak Galoisovy automorfismy tělesa Q(α),
které tvoří jeho tzv. Galoisovu grupu. Galoisovým tělesem je každé číselné těleso druhého
řádu, jak jsme viděli v Příkladu 4.23. Další důležitý případ Galoisových těles rozebereme
v sekci 4.6.
4.5
Tělesový polynom, norma, stopa
Definice 4.30. Necht’ α je algebraické číslo řádu n, β ∈ Q(α). Polynom
n
Y
(x − σi (β))
i=1
51
nazýváme tělesový polynom čísla β v tělese Q(α).
Věta 4.31. Necht’ α ∈ A, β ∈ Q(α). Tělesový polynom čísla β patří do Q[x].
Důkaz. Necht’ β = g(α) pro nějaký polynom g ∈ Q[x]. Tělesový polynom prvku β má
tvar
n
Y
n
(x − σi (β)) = x +
i=1
n−1
X
b i xi .
i=0
Koeficienty bi tělesového polynomu prvku β jsou podle Viètových vztahů až na znaménko
¡
¢
rovny elementárním funkcím v proměnných σ1 (β), . . . , σn (β). Protože σj (β) = σj g(α) =
g(αj ), jsou koeficienty bi zároveň symetrickými polynomy v proměnných α1 , . . . , αn . Podle hlavní věty o symetrických polynomech (Věta 3.22) existují polynomy g1 , . . . , gn ∈
Q[x1 , . . . , xn ] tak, že bi = gi (e1 , . . . , en ), kde ei jsou elementární symetrické funkce v
proměnných α1 , . . . , αn . Ty jsou ovšem až na znaménko rovny koeficientům minimálního
polynomu čísla α. Proto patří do Q a rovněž koeficienty bi tělesového polynomu prvku β
patří do Q.
Tvrzení 4.32. Necht’ α ∈ A, β ∈ Q(α). Pak pro každé j má číslo σj (β) stejný minimální
polynom jako β. Ekvivalentně, σj (β) jsou sdružené kořeny k β.
Důkaz. Necht’ h je minimální polynom čísla β. Z Poznámky 4.27 víme, že
0 = σj (0) = σj (h(β)) = h(σj (β)) ,
což znamená, že σj (β) je kořen polynomu h. Musí tedy být jedním se sdružených kořenů
k číslu β.
V případě, že β je nižšího řádu než α, mají kořeny tělesového polynomu čísla β v tělese
Q(α) násobnost větší než 1. Z Tvrzení 4.32 a Věty 4.3 lze odvodit následující tvrzení.
Tvrzení 4.33. Tělesový polynom čísla β v tělese Q(α) je mocninou minimálního polynomu čísla β.
Důkaz. Označme h minimální polynom čísla β. Necht’ k ≥ 0 je maximální takové, že
Q
Q
hk dělí ni=1 (x − σi (β)) nad Q. Pak ni=1 (x − σi (β)) = hk g, kde g ∈ Q[x] je monický
polynom takový, že h6 |g. Kdyby g 6= 1, pak má nějaký kořen tvaru σi (β). To má ale podle
Tvrzení 4.32 také minimální polynom h a podle Věty 4.3 musí h dělit g, a to je spor.
Důsledek 4.34. Prvky číselného tělesa řádu n jsou algebraická čísla řádu d, kde d je
dělitel n.
52
Mezi koeficienty tělesového polynomu xn +
Pn−1
i=0
bi xi čísla β ∈ Q(α) jsou významné
dva, a to koeficient b0 u absolutního členu a koeficient bn−1 . Pomocí nich definujeme dvě
důležitá zobrazení.
Definice 4.35. Necht’ α ∈ A. V tělese Q(α) Definujeme zobrazení normy N : Q(α) → Q
a stopy T : Q(α) → Q předpisem
N (β) =
n
Y
σj (β) ,
T (β) =
j=1
n
X
σj (β) ,
pro
β ∈ Q(α) .
j=1
Z Viètových vztahů je zřejmé, že N (β) je až na znaménko rovna absolutnímu koeficientu tělesového polynomu čísla β. Podobně T (β) je až na znaménko rovna koeficientu
u mocniny xn−1 . Uved’me některé jednoduché vlastnosti N (β), T (β).
Tvrzení 4.36. Necht’ α ∈ A je řádu n. Pro zobrazení N , T v tělese Q(α) platí:
• Norma je multiplikativní, tedy pro β, γ ∈ Q(α) platí N (βγ) = N (β)N (γ).
• Stopa je aditivní, tedy pro β, γ ∈ Q(α) platí T (β + γ) = T (β) + T (γ).
• N (c) = cn a T (c) = nc pro c ∈ Q.
• N (cβ) = cn N (β) a T (cβ) = cT (β) pro c ∈ Q, β ∈ Q(α).
• N (0) = T (0) = 0, Naopak je-li β 6= 0, pak N (β) 6= 0. Pro stopu toto obecně neplatí.
Poznámka 4.37. N (β), T (β) závisí na tělese, např N (c) = cn , pro c ∈ Q.
4.6
Příklady algebraických číselných těles
Uveďme dva nejklasičtější a zároveň nejdůležitější příklady algebraických číselných těles.
4.6.1
Reálná a imaginární kvadratická tělesa
√
Popišme všechna číselná tělesa druhého řádu. Je zřejmé, že stačí studovat Q( m), kde m
√
je racionální číslo takové, že m ∈
/ Q. Je dokonce možné omezit se na m celočíselné. Jinak
q
q
√
by bylo m = pq a Q( pq ) = Q(q pq ) = Q( pq). Navíc můžeme uvažovat pouze m ∈ Z,
která nejsou dělitelná druhou mocninou žádného prvočísla, tj. m neobsahující čtverec.
√
Definice 4.38. Necht’ m ∈ Z neobsahuje čtverec. Číselné těleso Q( m) pro m > 0
nazýváme reálné kvadratické těleso, a pro m < 0 imaginární kvadratické těleso.
53
√
√
Těleso Q( m) je číselné těleso řádu 2. Minimální polynom čísla m je x2 − m a
√
√
√
√
sdružený kořen k m je tedy − m. Protože Q( m) = Q(− m), je to Galoisovo těleso
a zobrazení σ1 , σ2 jsou jeho automorfismy, přičemž σ1 = id . Označme proto jediný netriv√
√
iální automorfismus tělesa Q( m) jako σ = σ2 . Prvky kvadratického tělesa Q( m) jsou
√
√
tvaru g( m) = a + b m, a, b ∈ Q. Máme proto
√
√
σ(a + b m) = a − b m ,
√
√
√
N (a + b m) = (a + b m)(a − b m) = a2 − mb2 ,
√
√
√
T (a + b m) = (a + b m) + (a − b m) = 2a .
4.6.2
Cyklotomická tělesa
Jiným důležitým příkladem číselných těles jsou tělesa generovaná kořenem z jedničky.
Definice 4.39. Cyklotomické těleso je číselné těleso Q(ζ), kde ζ = e
2πi
n
.
Z kapitoly o cyklotomických polynomech víme, že ζ je kořenem n-tého cyklotomického
polynomu Φn . Protože Φn je monický polynom s celočíselnými koeficienty ireducibilní nad
Q, je ζ algebraické číslo řádu ϕ(n),
Q(ζ) = {a0 + a1 ζ + · · · + aϕ(n)−1 ζ ϕ(n)−1 | ai ∈ Q} .
Sdružené kořeny k ζ jsou právě všechny kořeny polynomu Φn , tj. ζ k , kde k, 1 ≤ k ≤ n je
nesoudělné s n. Vzledem k tomu, že sdružené kořeny k ζ jsou jeho mocniny, je ζ k ∈ Q(ζ),
a protože ζ k je pro k nesoudělné s n algebraické číslo stejného řádu jako ζ, je zřejmé,
že Q(ζ) je Galoisovo těleso, Q(ζ k ) = Q(ζ). Toto těleso má ϕ(n) automorfismů, kromě
σ1 = id., ještě netriviální
¡
¢
σk a0 + a1 ζ + · · · + aϕ(n)−1 ζ ϕ(n)−1 = a0 + a1 ζ k + · · · + aϕ(n)−1 ζ k(ϕ(n)−1) ,
pro 1 < k < n, nesoudělné s n. Automorfizmus σk je zřejmě jendoznačně zadán hodnotou
σk (ζ) = ζ k . Pro složení automorfismů σi , σj pak platí
¡
¢
¢i
¡
¢
¡
¢j ¡ ¢j ¡ ¢i ¡
σi σj (ζ) = σi (ζ j ) = σi (ζ) = ζ i = ζ j = σj (ζ) = σj (ζ i ) = σj σi (ζ) ,
a tedy automorfizmy σi a σj komutují.
Nejjednodušším případem je n = p, prvočíslo. Pak
Φp (x) = xp−1 + xp−2 + · · · + x + 1 =
p−1
Y
j=1
54
(x − ζ j ) ,
(4.5)
číslo ζ = e
2πi
p
je řádu ϕ(p) = p − 1 a sdružené kořeny jsou ζ j , 1 ≤ j ≤ p − 1. V takovém
případě je každému automorfizmu σk jednoznačně přirazen prvek k ∈ {0, 1, 2, . . . , p − 1} a
naopak. Protože ζ p = 1, složení automorfizmů σi a σj odpovídá podle (4.5) automorfizmus
σij modp . Proto je grupa Aut Q(ζ) izomorfní grupě Zp \ {0} s násobením modulo p. Shrňme
výsledky do tvrzení, které využijeme později.
Věta 4.40. Grupa automorfismů Aut(Q(ζ)) cyklotomického tělesa Q(ζ), kde ζ = e
2πi
n
,
je komutativní. V případě, že n = p je prvočíslo, je Aut(Q(ζ)) izomorfní multiplikativní
grupě tělesa Zp .
55
5
Diofantické rovnice
Pod heslem diofantické rovnice se rozumí rovnice tvaru f (x1 , x2 , . . . , xk ) = b, u které
hledáme řešení v přirozených, celých nebo racionálních číslech. Obvykle f (x1 , x2 , . . . , xk )
značí polynom s racionálními nebo celými koeficienty. Název pochází od řeckého matematika Diofanta, který žil v Alexandrii asi ve druhém století. Nejslavnější diofantická rovnice
je rovnice
xn + y n = z n .
Už v starém Řecku veděli, že tato rovnice má nekonečně mnoho řešení pro n = 2. My
řešení rovnice x2 + y 2 = z 2 popíšeme v kapitole 5.3. O tom, že pro žádné n ≥ 3 rovnice
nemá řešení, byl přesvědčen už Pierre Fermat, důkaz tohoto faktu podal až Wiles v roce
1996. O historii tzv. poslední Fermatovy věty viz [11].
Nejdřív potřebujeme doplnit vlastnosti konečných grup Zn .
5.1
Kvadratická rezidua
Definice 5.1. Necht’ n ∈ N. Prvek y okruhu Zn , pro který má rovnice
y = x2
mod n
řešení, se nazývá kvadratické reziduum modulo n. Množinu kvadratických reziduí modulo
n značíme Rn , tj.
Rn = {x2 mod n | x ∈ Z}
Příklad 5.2. R6 = {0, 1, 4, 3}, R8 = {0, 1, 4}, R11 = {0, 1, 4, 9, 5}.
Věta 5.3. Pro každé n ∈ N platí
#Rn ≤ 1 + b n2 c .
Je-li n prvočíslo, pak v (5.1) platí rovnost.
56
(5.1)
Důkaz. Protože (n ± x)2 = x2 mod n , je Rn = {x2 mod n | x ∈ Z, 0 ≤ x ≤ n2 }, a tedy
počet prvků Rn nepřevýší 1 + b n2 c, jak tvrdí první část věty.
Počet prvků v Rn by byl ostře menší než právě odvozená mez, kdyby x21 = x22 mod n
pro nějaká různá x1 , x2 ∈ {0, 1, . . . , b n2 c}. Pro taková x1 , x2 je x1 ± x2 6= 0 mod n. Je-li n
prvočíslo, je Zn těleso a součin dvou nenulových prvků se nerovná nule, tj.
(x1 + x2 )(x1 − x2 ) 6= 0
mod n
=⇒
x21 6= x22
mod n .
Poznamenejme, že rovnost v (5.1) může nastat i pro neprvočíselná n, viz R6 .
Důsledek 5.4. Pro každé prvočíslo p > 2 má rovnice
x2 + y 2 + 1 = 0 mod p
řešení vyhovující nerovnostem 0 ≤ x <
p
2
a 0 ≤ y < p2 .
Důkaz. Obě množiny Rp a 1 − Rp mají
p+1
2
prvků. Jelikož jejich sjednocení leží v p
prvkové množině Zp , je jejich průnik neprázdný, tj. existuje x, y ∈ Zp takové, že x2 = 1−y 2
mod p. Protože pro každé z je z 2 = (p − z)2 mod p, lze nalézt x a y v požadovaném
intervalu.
Věta 5.5. Necht’ p ∈ P. Pak platí
−1 ∈ Rp
⇐⇒
p = 2 nebo p = 1 mod 4
Důkaz. Pro p = 2 tvrzení platí. Předpokládejme, že p je liché prvočíslo, a v množině
Zp \ {0} definujme ekvivalenci
x∼y
⇐⇒
x = ±y
mod p nebo x = ±y −1
mod p
Každá třída ekvivalence má tvar {x, −x, x−1 , −x−1 }, je tedy nanejvýš čtyřprvková. Zkoumejme, které ze tříd, mají méně prvků.
Protože uvažujeme p > 2, je x 6= −x mod p. Rovnost x = x−1 mod p implikuje x = 1
a jedná se o třídu {1, −1}. Kdyby pro nějaké x nastalo x = −x−1 mod p, měli bychom
další třídu o dvou prvcích {x, −x}. Ostaní třídy ekvivalence jsou čtyřprvkové.
Uvažovaná ekvivalence je na množině mohutnosti p−1. Další dvouprvková třída kromě
třídy {1, −1} existuje proto právě tehdy, když 4 dělí p − 1. Jelikož
x = −x−1
mod p
⇐⇒
je důkaz hotov.
57
x2 = −1 mod p ,
5.2
Lineární diofantické rovnice
Věta 5.6. Necht’ ai , a2 , . . . , ak jsou celočíselné parametry ne všechny rovny nule, b ∈ Z.
Rovnice
a1 x1 + a2 x2 + . . . + ak xk = b
(5.2)
pro neznámé xi , x2 , . . . , xk má řešení v celých číslech, pravě když nsd(ai , a2 , . . . , ak ) dělí
pravou stranu rovnice b.
Důkaz. Označme d = nsd(ai , a2 , . . . , ak ). Číslo d dělí levou stranu rovnice (5.2), a proto
podmínka d | b je nutná. Ukážeme, že je i postačující.
Předpokládejme b = db0 , pro b0 ∈ Z. Uvažujme množinu
M := {ai z1 + a2 z2 + . . . + ak zk | zi , z2 , . . . , zk ∈ Z}
Zřejmě
1. M je uzavřena na sčítání svých prvků a násobení libovolným celým číslem.
2. M obsahuje ai pro každé i = 1, 2, . . . , k.
3. d dělí každý prvek množiny M .
Položme
s := min{z ∈ M | z > 0}
Nejdříve uká žeme, že s dělí každé ai . Necht’ ri je zbytek po dělení čísla ai číslem s, tj.
ai = ki s + ri , pro nějaké ki , ri ∈ Z, 0 ≤ ri < s. Protože s ∈ M , je podle vlastností 1 a 2
také ri ∈ M . Z definice čísla s a nerovnosti 0 ≤ ri < s plyne, že ri = 0. Protože s dělí
každé ai , nutně s dělí d. Vlastnost 3 říká speciálně, že d dělí s. Proto d = s ∈ M , a tedy
existují z1 , . . . zk ∈ Z takové, že ai z1 +a2 z2 +. . .+ak zk = d = nsd(ai , a2 , . . . , ak ) . (5.3)
Z toho už plyne, že b = b0 d = ai (b0 z1 ) + a2 (b0 z2 ) + . . . + ak z(b0 zk ) . Tedy rovnice (5.2) má
řešení xi = b0 zi .
Pro řešení rovnice (5.2) byla podstatná vlastnost (5.3). Pro její platnost je důležité,
že zi ∈ Z. Když však hledáme řešení rovnice (5.2) v nezáporných celých číslech vlastnost (5.3) nám nepomůže. Např. rovnice 3x1 + 5x2 = 7 má řešení v celých číslech, ne
však v přirozených. V dalším textu budeme bez újmy na obecnosti předpokládat, že
nsd(ai , a2 , . . . , ak ) = 1.
58
Věta 5.7. Necht’ a1 , a2 , . . . , ak a b jsou přirozená čísla a nsd(a1 , a2 , . . . , ak ) = 1. Když
(ak − 1)
k−1
X
ai ≤ b ,
(5.4)
i=1
pak existují nezáporná celá čísla x1 , x2 , . . . , xk taková, že
a1 x1 + a2 x2 + . . . + ak xk = b
(5.5)
Důkaz. Popíšeme algoritmus hledání řešení. Nejdříve podle věty 5.6 najdeme y1 , . . . , yk ∈
Z tak, aby b = a1 y1 + a2 y2 + . . . + ak yk . Pro i = 1, . . . , k − 1 položíme xi rovno zbytku po
dělení čísla yi posledním koeficientem ak , tj.
yi = ak qi + xi
a
0 ≤ xi ≤ ak − 1 .
Abychom dostali řešení rovnice, musíme vhodně zvolit poslední proměnnou xk . Protože
b = a1 (ak q1 + xi ) + a2 (ak q2 + x2 ) + . . . + ak−1 (ak qk−1 + xk−1 ) + ak yk =
³
= a1 x1 + a2 x2 + . . . + ak−1 xk−1 + ak yk +
stačí položit xk := yk +
Pk−1
i=1
k−1
X
´
a i qi ,
i=1
ai qi . Jelikož a1 x1 +a2 x2 +. . .+ak−1 xk−1 ≤ (ak −1)
(5.6)
Pk−1
i=1
ai , a
předpokládame platnost (5.4), je nutně poslední sčítanec ak xk v rovnosti (5.6) nezáporný,
tj. xk ≥ 0.
Předchozí věta říká, že každé dostatečně velké b lze nakombinovat pomocí nezáporných
celočíselných koeficientů z hodnot a1 , a2 , . . . , ak . To znamená, že pro přirozená nesoudělná
čísla a1 , a2 , . . . , ak existuje minimální takové celé číslo F (a1 , a2 , . . . , ak ) s vlastností
b ≥ F (a1 , a2 , . . . , ak )
=⇒
b ∈ {a1 x1 + a2 x2 + . . . + ak xk | x1 , . . . , xk ∈ N0 } .
Úloha určit hodnotu F (a1 , . . . , ak ) se nazývá Frobeniův problém. Hodnota F (a1 , . . . , ak )
je známá pro k = 2 a k = 3. Obecně však Frobeniův problém není vyřešen. Pro přehled
částečných výsledků viz [7].
Není těžké ukázat, že v pří padě k = 2 je F (a1 , a2 ) = (a1 − 1)(a2 − 1) a mezi ”malými”
pravými stranami b ∈ {0, 1, 2, . . . , F (a1 , a2 )−1} je přesně polovina, pro které rovnice (5.5)
má řešení.
59
5.3
Pythagorejské trojice
Cílem této kapitoly bude popsat všechna řešení diofantické rovnice x2 + y 2 = z 2 . Pro
trojici x, y, z, která je řešením této rovnice, zřejmě platí:
• Trojice y, x, z a trojice ±x, ±y, ±z jsou řešeními.
• Trojice kx, ky, kz je řešením pro každé k ∈ Z.
• Když k | x a k | y, pak také k | z a trojice xk , ky , kz je řešením.
• Když x a y jsou nesoudělná, pak x a y nemohou být obě současně lichá.
Proto pro popis všech řešení rovnice x2 + y 2 = z 2 stačí popsat řešení s vlastnostmi:
x, y, z ∈ N ,
x a y nesoudělná a x sudé
(5.7)
Takovému řešení se říká pythagorejská trojice.
Věta 5.8. Trojice x, y, z ∈ N je pythagorejská, právě když existují nesoudělná celá čísla
m a n s opačnou paritou, m > n ≥ 1, taková, že
x = 2mn , y = m2 − n2 a z = m2 + n2
Důkaz. Protože
(2mn)2 + (m2 − n2 )2 = (m2 + n2 )2 ,
je jedna implikace věty zřejmá.
Předpokládejme proto, že x, y, z je pythagorejská trojice. Sudost x vynucuje lichost y
a z a nesoudělnost x a y vynucuje nesoudělnost y a z. Proto jsou celá a nesoudělná i čísla
z+y
2
a
z−y
.
2
2
Úpravami zíi skáme:
2
x +y =z
2
=⇒
2
x = (z + y)(z − y)
=⇒
³ x ´2
2
=
z+y z−y
.
2
2
Ted’ si stačí uědomit, že vztah c2 = pq pro nesoudělná čísla p a q implikuje, že p i q jsou
kvadráty dvou celých nesoudělných čísel. Proto existují taková nesoudělná m, n ∈ N, že
z+y
= m2
2
a
z−y
= n2 .
2
(5.8)
Protože v pythagorejské trojici je z > y, je m > n > 0. Vyjádřením z, y ze vztahu (5.8) a
x z rovnice x2 + y 2 = z 2 už dostaneme tvrzení věty.
60
Poznámka 5.9. Geometrická představa nám dá velice jednoduchý návod, jak lze snadno
najít řešení diofantické rovnice x2 + y 2 = z 2 .
Ke každému celočíselnému řešení lze zkonstruovat racionální bod rovniny (X, Y ) =
¢
, y , který splňuje X 2 + Y 2 = 1, a tedy leží na jednotkové kružnici. Přímka p, která
z z
¡x
prochází racionálním bodem kružnice (X, Y ) a bodem (−1, 0), má tedy racionální směrnici, označme ji
m
.
n
Našli jsme korespondenci mezi řešeními diofantické rovnice a racionál-
ními směrnicemi.
Ted’ naopak. Zkoumejme průsečíky jednotkové kružnice X 2 + Y 2 = 1 a přímky Y =
m
(X
n
+ 1) s racionální směrnicí, která prochází bodem (−1, 0). Tedy hledáme řešení
kvadratické rovnice
1 = X2 +
³
m
(X
n
+ 1)
´2
=⇒
2
2
(m
+ 1)X 2 + 2 m
X+
n2
n2
m2
n2
− 1 = 0.
Bod (−1, 0) je bodem přímky i kružnice, a proto jedno z řešení kvadratické rovnice je
X1 = −1. Protože součin kořenů kvadratické rovnice je koeficient u absolutního členu po
normalizování kvadratického polynomu na monický, je druhý kořen naši rovnice
X2 =
1−
m2
n2
m2
n2
+1
=
n2 − m2
m2 + n2
=⇒
Y2 =
m
2mn
(X2 + 1) = 2
.
n
m + n2
Ze souřadnic racionálního bodu jednotkové kružnice už odvodíme řešení (x, y, z).
5.4
Součet dvou čtverců
Cílem této kapitoly bude popsat taková přirozená čísla n, pro která diofantická rovnice
x2 + y 2 = n
(5.9)
má řešení v celých číslech, neboli popsat celá čísla, která lze reprezentovat jako součet
dvou čtverců.
Při popisu pythagorejských trojic v kapitole 5.3 jsme zkoumali tuto otázku v případě,
kdy pravá strana n je kvadrát celého čísla, tj. n = z 2 . Ukázali jsme, že x2 + y 2 = z 2 má
řešení, když samotné z je součtem dvou čtverců.
Charakterizovat parametry n, pro něž má rovnice (5.9) řešení, znamená studovat
množinu
M := {x2 + y 2 | x, y ∈ Z} .
Ukažme nejdříve několik jednoduchých vlastností množiny M .
61
• Když n = 3 mod 4, pak n ∈
/ M.
Tento fakt plyne z toho, že pro liché číslo k je k 2 = 1 mod 4, pro sudé číslo k je
k 2 = 0 mod 4. Proto x2 + y 2 mod 4 nabývá pouze hodnoty 0, 1 nebo 2.
• Když n ∈ M , pak k 2 n ∈ M pro každé k ∈ Z.
Z rovnosti n = x2 + y 2 totiž plyne k 2 n = (kx)2 + (ky)2 .
• Když n1 ∈ M a n2 ∈ M , pak také n1 n2 ∈ M .
¡
¢2
Pro n1 = x21 + y12 a n2 = x22 + y22 lze snadno ověřit, že n1 n2 = x1 x2 − y1 y2 +
¡
¢2
x1 y2 + x2 y1
Z vyjmenovaných vlastností množiny M je zřejmé, že klíčový problém tkví v tom, zda
prvočíslo tvaru 4k + 1 patří do M . Kladnou odpověd’ na tuto otázku dal v roce 1747
Euler. První důkaz, který uvedeme, pochází z roku 1902 od norského matematika Axela
Thueho. S myšlenkou druhého důkazu přišel Heath Brown v roce 1971. My prezentujeme
zjednodušení jeho důkazu, které publikoval v roce 1990 Don Zagier.
Věta 5.10. Necht’ p je prvočíslo tvaru 4k +1. Pak existují x, y ∈ Z takové, že p = x2 +y 2 .
Důkaz. (A. Thue) Protože prvočíslo p má tvar p = 4k + 1, je −1 kvadratické reziduum
mod p. Existuje tedy s ∈ {1, 2, . . . , p − 1} takové, že s2 = −1 mod p.
√
Uvažujme páry (x0 , y 0 ), kde x0 , y 0 ∈ {0, 1, 2, . . . , b pc} a hodnoty x0 − sy 0 mod p.
√
Protože párů je (1 + b pc)2 > p, existují podle holubníkového princípu dva různé páry
(x0 , y 0 ) a (x00 , y 00 ) takové, že
x0 − sy 0 = x00 − sy 00
mod p .
(5.10)
√
Položme x := |x0 − x00 | a y := |y 0 − y 00 |. Zřejmě x, y ∈ {0, 1, 2, . . . , b pc} a (x, y) 6= (0, 0),
protože páry (x0 , y 0 ) a (x00 , y 00 ) jsou různé. Platí tedy odhady
0 < x2 + y 2 < 2p .
(5.11)
Podle (5.10) a v důsledku volby s dostaneme
x = ±sy
mod p
=⇒
x2 = s2 y 2
mod p
=⇒
x2 = −y 2
x2 + y 2 je dělitelné číslem p. To však spolu s (5.11) znamená p = x2 + y 2 .
62
mod p
Thueho důkaz využíval důležité tvrzení o tom, kdy je −1 kvadratické reziduum. Následující důkaz se neopírá o žádné výsledky teorie čísel.
Důkaz. (D. Zagier) Položme
S := {(x, y, z) ∈ Z3 | 4xy + z 2 = p a x, y > 0} .
Tato množina je konečná. Žádný bod množiny S nemá třetí souřadnici z = 0, v tom
případě by totiž p = 4xy, a to by byl spor s prvočíselností p. Jelikož (x, y, z) ∈ S ⇔
(x, y, −z) ∈ S, má množina S sudý počet prvků, přičemž přesně polovina jejích prvků leži
v prvním oktantu. Označme tuto polovinu
T := {(x, y, z) ∈ S | z > 0} .
Našim cí lem bude ukázat, že tato plovina, tj. T má lichý počet prvků. Lichost #T zaručí,
že zobrazení h : T → T dané předpisem h(x, y, z) = (y, x, z) má v T pevný bod. Ten je
tvaru (x, x, z). To znamená, že p = 4x2 + y 2 je součet dvou čtverců.
K ukončení důkazu tedy stačí, abychom ukázali, že polovina počtu prvků S je lichá.
K tomu využijeme množinu
U := {(x, y, z) ∈ S | x − y + z > 0} .
Ukážeme, že
1. U tvoří polovinu množiny S;
2. počet prvků množiny U je lichý.
1) Uvažujme zobrazení f : S → S dané předpisem
f (x, y, z) = (y, x, −z).
Pro žádné (x, y, z) ∈ S není možné, aby x − y + z = 0. To by totiž implikovalo p =
4xy + z 2 = 4xy + (x − y)2 = (x + y)2 , a to by odporovalo p ∈ P. Z tvaru f plyne, že
(x, y, z) ∈ U , právě když f (x, y, z) ∈
/ U . Proto
S = U ∪ f (U )
=⇒
#S = 2#U .
2) Definujme na U zobrazení
g(x, y, z) = (x − y + z, y, 2y − z) .
63
Ověřme, že g zobrazuje U do U : Protože 4(x − y + z)y + (2y − z)2 = 4xy + z 2 = p, je
g(x, y, z) ∈ S. Navíc je (x − y + z) − y + (2y − z) = x > 0, a tedy g(x, y, z) ∈ U .
Snadno lze ukázat, že g 2 je identita. To mimo jiné znamená, že g je bijekcí U na U .
Zkoumejme pevné body g.
g(x, y, z) = (x, y, z)
=⇒
y=z
=⇒
p = 4xy + y 2 = y(4x + y)
Protože p je prvočíslo tvaru p = 4k + 1, je nutně y = 1 a x = k. Zobrazení g má na U
jediný pevný bod (k, 1, 1). To spolu s faktem, ze g 2 je identita, implikuje že U má lichý
počet prvků. Tím je důkaz hotov.
Věta 5.11. Číslo n ∈ N lze zapsat jako součet dvou čtverců, právě když prvočísla tvaru
4k + 3 se v rozkladu čísla n nacházejí v sudé mocnině.
Důkaz. Nutnost podmínky dokážeme sporem. Předpokládejme, že existuje n, které je
součtem dvou čtverců, a přitom se v jeho rozkladu nachází v liché mocnině prvočíslo
tvaru 4k + 3. Vezměme nejmenší možné n s touto vlastností.
Máme tedy n = x2 + y 2 a prvočíslo p = 4k + 3, které dělí n. Odvodíme, že p dělí x i y.
Kdyby totiž p nedělilo x, v tělese Zp by bylo x 6= 0 mod p a existoval by k němu inverzní
prvek x−1 . Protože p dělí n, platí
2
³
2
x + y = 0 mod p
=⇒
1 + yx
−1
´2
=0
mod p .
Číslo −1 by tak bylo kvadratickým reziduem, a to je v tělese Zp s prvočíslem p = 4k + 3
nemožné. Ze stejných důvodů p dělí y. Můžeme psát x = px0 a y = py 0 . Rovnost n =
x2 + y 2 = (px0 )2 + (py 0 )2 implikuje, že p2 je dělitelem n a
n0 :=
n
= (x0 )2 + (y 0 )2 .
p2
Číslo n0 je součtem dvou čtverců. Jelikož p se nacházelo v rozkladu n v liché mocnině,
nachází se p v rozkladu n0 také v liché mocnině. Protože n0 < n, dostali jsme spor s volbou
n.
Obrácená implikace plyne z věty 5.10 a vlastností množiny M .
5.5
Součet čtyř čtverců
Jak jsme viděli v předchozí kapitole, ne všechna přirozená čísla lze zapsat jako součet
dvou čtverců. Ani součet tří čtverců není vždy postačující. Protože x2 mod 8 nabývá
64
pouze hodnoty 0, 1 nebo 4, leží x21 + x22 + x23 mod 8 v množině {0, 1, 2, 3, 4, 5, 6}. Žádné
číslo n tvaru n = 8k + 7 nelze tedy zapsat jako součet tří čtverců. Náplní této kapitoly
bude dokázat, že čtyři čtverce už stačí.
Věta 5.12. Pro každé n ∈ N existují x1 , x2 , x3 , x4 ∈ Z takové, že
n = x21 + x22 + x23 + x24 .
Už v roce 1621 Bachet tvrdil, aniž by své tvrzení dokázal, že každé číslo lze zapsat jako
součet čtyř čtverců. První důkaz podal Lagrange v roce 1770. Důkaz, který uvedeme my,
pochází z dopisu Dirichleta Liouvilleovi z roku 1856. V roce 1834 Jacobi dokonce určil,
kolika způsoby lze n takto zapsat.
Následující lemma, které plyne bezprostředně z tzv. Eulerovy identity 10.20, nám
umožňuje omezit se v důkazu věty 5.12 na prvočíselné n.
Lemma 5.13. Když čísla n1 a n2 lze vyjádřit jako součet čtyř čtverců, pak i jejich součin
n1 n2 lze vyjádřit jako součet čtyř čtverců.
Lemma 5.14. Necht’ p ∈ P a m ∈ N, 1 < m < p. Když mp lze zapsat jako součet čtyř
čtverců, pak existuje n ∈ N, 1 ≤ n < m takové, že np lze také zapsat jako součet čtyř
čtverců.
Důkaz. Necht’
mp = x21 + x22 + x23 + x24 .
(5.12)
Definujme y1 , y2 , y3 a y4 tak, aby pro i = 1, 2, 3, 4 platilo
y i = xi
mod m
a
−
m
2
< yi ≤
m
2
.
(5.13)
Z volby yi plyne, že
0 ≤ y12 + y22 + y32 + y42 ≤ m2
(5.14)
Ukážeme, že obě nerovnosti jsou ostré:
0 = y12 + y22 + y32 + y42
⇒
xi = 0 mod m
⇒
m2 dělí mp .
To je vzhledem k předpokladu p ∈ P nemožné. A podobně
y12 + y22 + y32 + y42 = m2
⇒
xi =
m
2
mod m
65
⇒
m2 dělí x21 + x22 + x23 + x24 = mp .
Ze vztahů (5.12) a (5.13) plyne, že y12 + y22 + y32 + y42 = 0 mod m, a tedy existuje n ∈ Z
takové, že
y12 + y22 + y32 + y42 = nm .
(5.15)
Protože nerovnosti v (5.14) jsou ostré, je 0 < n < m. Kombinací (5.15), (5.12) a Eulerovy
identity 10.20 získáme z1 , z2 , z3 , z4 takové, že
m2 np =
¡
¢¡
¢
x21 + x22 + x23 + x24 y12 + y22 + y32 + y42 = z12 + z22 + z32 + z42 ,
(5.16)
přičemž
z1 = x1 y1 + x2 y2 + x3 y3 + x4 y4 ,
z2 = x1 y2 − x2 y1 − x3 y4 + x4 y3 ,
z3 = x1 y3 − x3 y1 + x2 y4 − x4 y2 ,
z4 = x1 y4 − x4 y1 − x2 y3 + x3 y2 .
Z definice yi proto plyne
z1 = x21 + x22 + x23 + x24
mod m
z 2 = x1 x2 − x2 x1 − x3 x 4 + x4 x3
=⇒
mod m
m | z1
=⇒
m | z2
a analogicky m | z3 a m | z4 . Ted’ už stačí položit
ui =
zi
∈ Z pro i = 1, 2, 3, 4
m
a po zkrácení rovnice (5.16) faktorem m2 dostaneme
np = u21 + u22 + u23 + u24 .
Máme tak vše nachystáno na důkaz věty 5.12.
Důkaz. Jak jsem už konstatovali, lemma 5.13 nás opravňuje se omezit při důkazu na
prvočísla. Necht’ p ∈ P. Podle důsledku 5.4 existují x, y ∈ Z takové, že
x2 + y 2 + 1 = 0
mod p
a
0 ≤ x, y <
p
2
.
Označme x1 = x, x2 = y, x3 = 1, x4 = 0. V tomto značení můžeme (5.17) přepsat
x21 + x22 + x23 + x24 = 0 mod p
a
0 < x21 + x22 + x23 + x24 < p2 .
To znamená, že existuje m ∈ Z takové, že
1≤m<p
a
x21 + x22 + x23 + x24 = mp .
Na tento vztah aplikujeme opakovaně lemma 5.14 tak dlouho, až je m = 1.
66
(5.17)
Poznámka 5.15. Lagrange první dokźal, že každé n ∈ N lze zapsat jako n = x21 + x22 +
x23 + x24 , kde x1 , . . . , x4 jsou nezáporná celá čísla. Wieferich dokázal, že každé přirozené
číslo lze zapsat jako sumu devíti třetích mocnin, tj. n = x31 + x32 + . . . + x39 , kde x1 , . . . , x9
jsou nezáporná celá čísla. Oba tyto výsledky jsou speciální případy Waringova problému,
jednoho z nejslavnějších problému teorie čísel. Waringův problém zní: pro každý exponent
k ∈ N existuje h ∈ N takové, že každé přirozené číslo n lze zapsat jako součet h k-tých
mocnin. V roce 1909 toto tvrzení dokázal David Hilbert pro každý exponent k.
5.6
Pellova rovnice
Věnujme se diofantické rovnici
x2 − Dy 2 = 1
(5.18)
s parametrem D ∈ N a celočíselnými proměnnými x, y. Zřejmě (1, 0) a (−1, 0) jsou
řešeními této rovnice. Tato řešení nazveme triviální.
Když D = m2 pro nějaké m ∈ N, lze rovnici urpavit x2 −m2 y 2 = (x−my)(x+my) = 1.
To implikuje x−my = 1 a x+my = 1 nebo x−my = −1 a x+my = −1. A tedy rovnice
√
/ N. To je
má pouze triviální řešení. Proto se od této chvíle zaměříme na případ, kdy D ∈
√
ekvivalentní podmínce, že D je iracionální. Rovnici (5.18) s požadavkem na iracionalitu
√
D se říká Pellova rovnice. Tento název začal používat Euler, i když není jasné z jakých
důvodů. Cílem této kapitoly bude ukázat, že Pellova rovnice má nekonečně mnoho řešení.
Také popíšeme strukturu množiny řešení.
Následující věta je z roku 1842 a pochází od Dirichleta. Její důkaz je jedním z nejhezčích použití banálního holubníkového principu. Proto není divu, že se v zemích ze
silným vlivem německé matematiky pro holubníkový princip ujal název Dirichletův princip.
Věta 5.16. Necht’ α ∈ R \ Q. Pak existuje nekonečně mnoho zlomků
tvaru takových, že
¯
¯
¯α −
p
q
ve zkráceném
p ¯¯
1
¯ < 2.
q
q
£
¢ £
¢
£
¢
Důkaz. Zvolme Q ∈ N, ≥ 2 a uvažujme Q intervalů 0, Q1 , Q1 , Q2 , . . . , Q−1
,
1
; délka
Q
každého z nich je
1
.
Q
Dále uvažujme Q + 1 zlomkových částí {0α}, {1α}, {2α}, . . . , {Qα}.
Podle Dirichletova principu do jednoho z intervalů padnou dvě zlomkové části. Tedy
existují indexy 0 ≤ j < i ≤ Q takové, že
¯
¯
¯
¯
1
> ¯{iα} − {jα}¯ = ¯(i − j)α − [iα] + [jα]¯ .
Q
67
Označme p := [iα] − [jα] a q := i − j. Z konstrukce plyne, že 1 ≤ q ≤ Q. Ukázali jsme
pomocné tvrzení
¡
¢¡
¢³¯¯
∀Q ∈ N, Q ≥ 2 ∃p, q ∈ Z, 1 ≤ q ≤ Q ¯α −
p ¯¯
1 ´
<
.
¯
q
qQ
(5.19)
Z tvaru nerovnosti plyne, že bez újmy na obecnosti můžeme předpokládat nesoudělnost
p a q.
Je zřejmé, že pro každé pevné Q je množina
¯
n¯
p ¯¯
1 o
p ¯¯
¯
¯
MQ := ¯α − ¯ | p, q ∈ Z, 1 ≤ q ≤ Q, ¯α − ¯ <
q
q
qQ
konečná. Z iracionality α plyne, že její minimum je kladné.
Abychom našli nekonečně mnoho zlomků pq vyhovujících nerovnosti ve zneění věty,
¡ ¢
zkonstruujme posloupnost pqii . Zvolme libovolně Q1 ∈ N, Q1 ≥ 2 a posloupnost (Qi ) tak,
aby
1
< min MQi .
Qi+1
Pro každé Qi nalezneme podle (5.19) zlomek pqii ve zkráceném tvaru. Z definice MQi je
¡ ¢
vidět, že qi+1 > qi , a tedy posloupnost pqii má nekonečně mnoho různých členů. Každý z
nich splňuje
¯
1
1
pi ¯¯
¯
≤ 2.
¯α − ¯ <
qi
qi Qi
qi
Věta 5.17. Každá Pellova rovnice x2 − Dy 2 = 1, kde D ∈ N a
√
D je iracionální, má
netriviální řešení v celých číslech.
Důkaz. Podle věty 5.16 existuje nekonečně mnoho párů (p, q) nesoudělných čísel takových,
¯
√ ¯
že ¯p − q D¯ < 1q . Pro tyto páry platí
√
√
√
√ ´
√
1 ³1
|p2 − Dq 2 | = |p − q D| . |p − q D + 2q D| <
+ 2q D ≤ 1 + D .
q q
√
√
Proto mezi celými čísly v intervalu (−1 − D, 1 + D) existuje m ∈ Z takové, že pro
√
nekonečně mnoho párů (p, q) je p2 − Dq 2 = m. Z iracionality D plyne, že m 6= 0. Z
Dirichletova principu dostaneme, že existují dva různé pá ry (p1 , q1 ) a (p2 , q2 ) vyhovující
p21 − Dq12 = m ,
p22 − Dq22 = m ,
p 1 = p2
mod m ,
q1 = q2
mod m . (5.20)
Z prvních dvou rovností získáme
m2 = (p21 − Dq12 )(p22 − Dq22 ) = (p1 −
√
Dq1 )(p1 +
68
√
Dq1 )(p2 −
√
Dq2 )(p2 +
√
Dq2 ) =
³
√ ¡
√ ¡
¢´³
¢´
= p1 p2 − q1 q2 D + D q1 p2 − p1 q2
p1 p2 − q1 q2 D − D q1 p2 − p1 q2 ;
(5.21)
z dalších dvou vlastností (5.20) dostaneme
p1 p2 − q1 q2 D = 0 mod m
a
q1 p2 − p1 q2 = 0
p1 p2 − q1 q2 D
∈Z
m
a
Y :=
mod m .
Proto
X :=
q1 p2 − p1 q2
∈ Z.
m
Jelikož (p1 , q1 ) a (p2 , q2 ) byly dva různé páry nesoudělných čísel, je Y 6= 0. S použitím X
a Y lze rovnici (5.21) přepsat
√
√
¡
¢ ¡
¢
¡
¢
m2 = mX + DmY . mX − DmY = m2 X 2 − DY 2 .
To znamená, že X, Y je řešení Pellovy rovnice. Jelikož Y 6= 0, je to netriviální řešení.
Ted’ popíšeme množinu všech řešení Pellovy rovnice. Uvažjme množinu
√
√
M (D) := {a + b D | a, b ∈ Z , a2 − Db2 = 1, a + b D > 0} .
Ukážeme, že M (D) je spolu s operací standardního násobení v R grupou. Stačí ukázat
√
√
uzavřenost M (D) na násobení a na inverzní prvek. Necht’ a + b D a c + d D ∈ M (D).
Protože
¡
√
√ ¢¡
√ ¢
+
a + b D c + d D = ac
+
bdD
D (bc
{z ad}) > 0 ,
| {z }
| +
=:A ∈Z
=:B ∈Z
máme ověřit, že
A2 − DB 2 = (A +
√
DB)(A −
√
√ ¢¡
√ ¢¡
√ ¢¡
√ ¢
¡
DB) = a + b D c + d D a − b D c − d D = 1 .
√
√
√
Jelikož pro každý prvek a + b D z M (D) platí 1 = a2 − Db2 = (a + b D)(a − b D), je
√
√
(a + b D)−1 = a − b D ∈ M (D), a množina M (D) je uzavřena na obrácený prvek.
Triviálnímu řešení Pellovy rovnice (1, 0) odpovídá 1 ∈ M (D). Charakterizujme prvky
√
√
z M (D), které jsou větší než 1. Protože platí 1 = a2 −b2 D = (a+b D)(a−b D), vynucuje
√
√
√
√
nerovnost a + Db > 1, aby 0 < a − Db < 1. Ze vztahu a − D b < 1 < a + Db plyne
√
√
b > 0. To spolu s nerovností 0 < a − Db implikuje a > 0. Pro prvky a + Db ∈ M (D)
jsme odvodili
a+
√
Db > 1
⇐⇒
69
a, b > 0 .
(5.22)
Věta 5.18. Existuje takové řešení aD , bD Pellovy rovnice x2 − Dy 2 = 1, že pro každé jiné
její řešení a, b je
a+
√
√
¡
¢n
D b = ± aD + D bD
pro nějaké n ∈ Z.
Důkaz. Z věty 5.17 víme, že množina M (D) obsahuje i jiný prvek než 1, proto je M (D)
netriviální grupou. Bez újmy na obecnosti necht’ X, Y > 0 je netriviální řešení Pellovy
rovnice. Položme
aD +
√
√
√
√
D bD := min{ a + b D ∈ M (D) | a, b > 0 , a + b D < X + Y D } .
√
Existence minima plyne z konečnosti uvažované množiny: Pro dva prvky a1 + b1 D
√
a a2 + b2 D z této množiny nerovnost a1 < a2 implikuje b1 < b2 . Tedy vzdálenost
√
mezi každými dvěma prvky je alespoň 1 + D, a přitom celá množina leží v intervalu
√ ¢
¡
1, X + Y D .
Sporem ukážeme, že definovaná čísla aD , bD mají vlastnosti z tvrzemí věty. Necht’ a, b
√
√
je řešení Pellovy rovnice; bez újmy na obecnosti necht’ a + b D > 0, tj. a + b D je
prvkem grupy M (D). Kdyby existovalo k ∈ Z tak, že
¡
aD +
√
D bD
¢k
√
√
¡
¢k+1
< a + b D < aD + D bD
,
dostali bychom po vynásobení inverzním prvkem k prvku aD +
√
DbD nerovnost
√ ¢¡
√
√
¡
¢−k
1 < a + D b a D − D bD
< aD + D bD .
√
√
¡ √ ¢¡
¢−k
Jelikož a+ D b aD − D bD
je rovněž prvkem grupy M (D) je to číslo tvaru c+ Dd.
Podle (5.22) jsou c, d > 0. To je ovšem ve sporu s definicí aD a bD .
Poznámka 5.19. Dvojice aD , bD ve znění věty 5.18 se nazývá minimální řešení Pellovy
rovnice. K hledání minimálního řešení poslouží řetězové zlomky (Sekce 6.5). V následující
tabulce najdeme minimální řešení pro počátečné hodnoty D.
D 2 3 5 6 7 8 10 11 12 13 14 15 17 18 ... 27 28
29 30
aD 3 2 9 5 8 3 19 10 7 649 15 4 33 17 ... 26 127 9801 11
bD 2 1 4 2 3 1 6 3 2 180 4 1 8 4 ... 5 24 1820 12
Hodnoty aD , bD přesáhnou prvně mez 1000 pro parametr D = 29, konkrétně a29 = 9801
a b29 = 1820. Je zajímavé, že v jednom ze starých indických matematických textů
70
(Brahmagupta kolem roku 600) je za matematika pokládan ten, kdo umí řešit rovnici
x2 − 29y 2 = 1. Rovnici x2 − Dy 2 = 1 se věnoval také Fermat. V roce 1657 vyzval svého
přítele Frénicle de Bessy, aby řešil rovnici x2 − 61y 2 = 1. V tomto případě jsou hodnoty
minimálního řešení rovny a61 = 1766319049 a b61 = 226153980.
Důsledek 5.20. Necht’ m ∈ Z a D ∈ N,
√
D ∈
/ Q. Pokud má zobecněná diofantická
rovnice x2 − Dy 2 = m alespoň jedno řešení, pak má nekonečně mnoho řešení.
Důkaz. Necht’ pár x1 , y1 ∈ Z vyhovuje rovnici x21 − Dy12 = m1 a pár x2 , y2 ∈ Z rovnici
x22 − Dy22 = m2 . Pak
√
√
√
√
m1 m2 = (x1 − y1 D)(x1 + y2 D)(x2 − y2 D)(x2 + y2 D) =
√ ¢
√ ¢¡
¡
= x1 x2 + Dy1 y2 − (y1 x2 + x1 y2 ) D x1 x2 + Dy1 y2 + (y1 x2 + x1 y2 ) D =
¡
¢2
¡
¢2
= x1 x2 + Dy1 y2 − D y1 x2 + x1 y2 .
Tedy pár
x := x1 x2 + Dy1 y2
a
y := y1 x2 + x1 y2
je řešením diofantické rovnice x2 −Dy2 = m1 m2 . Tímto postupem z jednoho řešení rovnice
x2 − Dy 2 = m a nekonečně mnoha řešení Pellovy rovnice x2 − Dy 2 = 1 zkonstruujeme
nekonečně mnoho řešení rovnice x2 − Dy 2 = m.
71
6
Diofantické aproximace
Množina racionálních čísel je hustá v R. Proto lze libovolné reálné číslo ξ libovolně přesně
aproximovat zlomkem pq . Otázka ovšem je, jak tyto aproximace hledat a jak ‘měřit’ jejich
přesnost.
Prvním naivním způsobem hledání racionálních aproximací je tento: Chceme-li zlomek
p
,
q
který by splňoval |ξ − pq | < ε, uvažujme q > (2ε)−1 a rozdělme reálnou osu na intervaly
typu [ kq , k+1
), k ∈ Z. Číslo ξ padne do některého z nich. Za
q
p
q
stačí vzít krajní bod tohoto
intervalu, a to ten, který je blíž ke ξ. Máme pak
¯
¯
¯
¯
p
¯ξ − ¯ < 1 < ε .
¯
q ¯ 2q
Pro každé ξ ∈ R a pro každé q ∈ N proto existuje p ∈ Z tak, že |ξ − pq | <
1
.
2q
V
následujícím textu uvidíme, že k danému reálnému číslu lze nalézt nekonečně mnoho
mnohem přesnějších racionálních aproximací.
6.1
Fareyovy zlomky
Oproti předchozí naivní úvaze získáme jemnější aproximaci reálného čísla, budeme-li místo
zlomků s pevným jmenovatelem n uvažovat zlomky se všemi jmenovateli menšími než n.
Bez újmy na obecnosti se můžeme omezit na zlomky mezi 0 a 1, protože pro aproximaci
čísla ξ 6∈ (0, 1) bychom uvažovali zlomkovou část {ξ} := ξ − bξc a k aproximujícímu
zlomku
p
q
bychom ve výsledku přičetli bξc.
Definice 6.1. Nechť n ∈ N. Uvažujme všechny zlomky
p
q
∈ [0, 1], p ⊥ q a q ≤ n.
Uspořádané podle velikosti je označme 0 = f0 < f1 < · · · < fm = 1. Seznam Fn = {fi |
i = 0, 1, . . . , m} nazveme Fareyovy zlomky řádu n.
Příklad 6.2. Vypišme Fareyovy zlomky řádu 5. Máme
0=
0
1
1
1
2
1
3
2
3
4
1
< < < < < < < < < < = 1.
1
5
4
3
5
2
5
3
4
5
1
72
Než předvedeme, jak dobře lze s pomocí Fareyových zlomků aproximovat reálná čísla,
všimneme si několika zajímavostí:
• V seznamu Fn je právě ϕ(k) zlomků se jmenovatelem právě k, pro 1 ≤ k ≤ n,
kde ϕ je Eulerova funkce. Celkem je tedy počet Fareyových zlomků řádu n roven
P
1 + nk=1 ϕ(k).
• Mezi třemi po sobě jdoucími zlomky v Fn je vždy prostřední roven podílu součtu
čitatelů a součtu jmenovatelů krajních zlomků. Např.
1
0+1
= ,
1+4
5
2+3
1
= ,
5+5
2
• Pro libovolný pár po sobě jdoucích zlomků
a
b
<
3+3
2
= .
5+4
3
c
d
v seznamu Fn platí, že bc−ad = 1.
V jistém smyslu jsou tedy Fareyovy zlomky nejblíže u sebe. Je totiž
c a
bc − ad
1
− =
≥
d b
db
db
a čitatel tedy nabývá nejmenší možné meze.
Zatímco první z uvedených pozorování je triviální, další dvě vyžadují důkaz.
Věta 6.3 (Cauchy). Nechť
Důkaz. Pro zlomek
a
b
a
b
<
c
d
jsou sousední položky seznamu Fn . Pak bc − ad = 1.
platí a ⊥ b. Proto podle Věty 5.6 existují celá čísla x, y ∈ Z taková,
že bx−ay = 1. Navíc je-li x0 , y0 řešením této rovnice, pak je řešením i dvojice x1 = x0 +ra,
y1 = y0 + rb, protože
b(x0 + ra) − a(y0 + rb) = bx0 − ay0 + bra − arb = 1 .
Pro vhodné r pak řešení x1 , y1 ∈ Z splňuje
0 ≤ n − b < y1 ≤ n .
(6.1)
Navíc bx1 − ay1 = 1 implikuje
1
x1 a
− =
> 0.
y1
b
by1
Zlomek
x1
y1
má tedy jmenovatel omezený číslem n a je ostře větší než ab . Nejmenší takový
zlomek je dc , a proto
x1
y1
≥ dc . Nám stačí dokázat platnost rovnosti.
Pro spor předpokládejme, že
x1
y1
> dc . Pak ale
c
dx1 − cy1
1
x1
− =
≥
,
y1
d
y1 d
y1 d
ale také
73
c a
bc − ad
1
− =
≥
.
d b
bd
bd
Po sečtení obou nerovností máme
1
x1 a
1
1
b + y1
n
=
− =
+
=
>
,
by1
y1
b
y1 d bd
bdy1
bdy1
kde první rovnítko plyne z faktu, že bx1 − ay1 = 1 a poslední odhad z (6.1). Vyšlo tedy
1 > nd , tj. d > n, což je spor s předpokladem, že zlomek
a
b
Tvrzení 6.4 (Mediánová vlastnost). Necht’
<
c
d
<
c
d
e
f
patří do Fn .
jsou tři po sobě jdoucí položky
seznamu Fn . Pak
c
a+e
=
.
d
b+f
Důkaz. Z předchozí věty víme, že platí ed − cf = 1 a cb − ad = 1. Vynásobením první
z rovností číslem b a druhé číslem f a sečtením dostaneme d(eb − af ) = b + f . Podobně
násobením první z rovností číslem a a druhé číslem e dostaneme po sečtení c(eb − af ) =
a + e. Odtud už plyne tvrzení.
Hledáme-li nyní racionální aproximaci
p
q
reálného čísla ξ ∈ (0, 1) s omezeným jmeno-
vatelem q ≤ n, stačí sevřít ξ mezi dva po sobě jdoucí Fareyovy zlomky řádu n. S pomocí
právě dokázaných vlastností nebude těžké ukázat, že je-li fi < ξ < fi+1 , potom pro
¯
¯
nebo pq = fi+1 platí ¯ξ − pq ¯ < q12 . Tím dostáváme další důkaz Dirichletovy věty.
p
q
= fi
Důkaz Věty 5.16. Necht’ n ∈ N a necht’ ab , dc jsou sousední položky seznamu Fn takové, že
a
b
< ξ < dc . Je-li například b ≤ d, pak
¯
a ¯¯ c a
1
1
¯
≤ 2,
¯ξ − ¯ < − =
b
d b
bd
b
kde jsme použili Větu 6.3. Pokud by b ≥ d, stejným způsobem ukážeme, že |ξ − dc | <
Protože sousední položky seznamu Fn mají vzdálenost
1
,
n
1
.
d2
je zřejmé, že zvětšováním n
dostaneme nekonečně mnoho různých zlomků splňujících tvrzení.
V dalším textu ukážeme méně triviální způsob hledání dobré racionální aproximace
reálného čísla. Tentokrát ovšem bude možno ukázat, že tyto aproximace jsou v jistém
smyslu nejlepší.
6.2
Řetězové zlomky
Nechť ξ ∈ R. Položme ξ0 = ξ a pro i ≥ 0
ai := bξi c ,
a pokud ξi ∈
/ Z ξi+1 :=
74
1
.
ξi − ai
(6.2)
Z algortimu jasně vyplývá, že a0 ∈ Z a ai ∈ N pro i ≥ 1. Protože ξi = ai +
1
,
ξi+1
dostáváme po n-tém kroku výše uvedeného algoritmu vyjádření čísla ξ ve tvaru
1
ξ = a0 +
,
1
a1 +
(6.3)
1
... +
an +
1
ξn+1
Je zřejmé, že pokud je v nějakém kroku ξk ∈ Z, algoritmus se zastaví, dostaneme
pouze konečnou posloupnost a0 , . . . , ak a ξ je rovno zlomku
1
ξ = a0 +
a1 +
∈ Q.
1
..
.+
1
ak
Naopak každé racionální číslo pq , p ⊥ q, lze vyjádřit v tomto tvaru. Pro nalezení koeficientů
ai použijeme Eukleidův algoritmus hledání největšího společného dělitele.
p = a0 q + r1 ,
=⇒
q = a1 r1 + r2 ,
=⇒
r1 = a2 r2 + r3 ,
=⇒
..
.
p
q
q
r1
r1
r2
= a0 +
= a1 +
= a2 +
1
,
1
,
1
,
q
r1
r1
r2
r2
r3
Snadno nahlédneme, že tato procedura odpovídá algoritmu (6.2). Protože q > r1 > r2 >
· · · ≥ 0, je ai = bri /ri+1 c. Je zřejmé, že po konečném počtu kroků nastane rk+2 = 0. Pak
je rk+1 = nsd(p, q) = 1 a tudíž
rk
rk+1
∈ Z.
Poznámka 6.5. Protože v Eukleidově algoritmu je rk+1 < rk , je poslední koeficient
řetězového zlomku racionálního čísla
p
q
roven ak =
rk
rk+1
≥ 2. Poznamenejme, že zlomek
p
q
můžeme vyjádřit také jako
p
= a0 +
q
1
a1 +
1
...
1
= a0 +
a1 +
1
+
ak
.
1
...
+
1
1
1
Toto vyjádření však nevznikne z uvedeného algoritmu. Podmínka, že poslední koeficient
ak − 1 +
splňuje ≥ 2, však jednoznačnost vyjádření zaručuje.
Definice 6.6. Posloupnost (ai )i∈N0 (respektive (ai )ki=0 ) získaná algoritmem (6.2) se nazývá řetězovým zlomkem čísla ξ ∈ R \ Q (respektive ξ ∈ Q). Značíme ξ = [a0 , . . . , an , . . . ]
(repsektive ξ = [ao , . . . , ak ]).
75
Řetězový zlomek čísla ξ ∈ R je konečný, právě když ξ ∈ Q. Vzhledem k tomu, že
se v této kapitole zabýváme racionálními aproximacemi reálných čísel, budeme nadále
1
předpokládat ξ ∈
/ Q. Racionální aproximace ke ξ získáme vynecháním ‘zbytku’
∈
ξn+1
(0, 1) ve vyjádření (6.3).
Tak dostaneme racionální číslo a můžeme se ptát, jak dobře tento zlomek aproximuje ξ.
Abychom mohli snáze studovat vlastnosti těchto zlomků, představíme si ho jako racionální
lomenou funkci v proměnných ai , kde obecně povolíme libovolné ai > 0 pro i ∈ N a
a0 ∈ R. Tato racionální lomená funkce je tedy podíl polynomů v proměnných ai . Pro
několik prvních hodnot n snadno vypočítáme
a0 =
a0
,
1
a0 +
1
1 + a0 a1
=
,
a1
a1
a0 +
1
1
a1 +
a2
=
a0 + a2 + a0 a1 a2
,
1 + a1 a2
atd.
Matematickou indukcí snadno dokážeme následující tvrzení.
Tvrzení 6.7. Pro x0 ∈ R, xi > 0, i ∈ N platí
1
x0 +
x1 +
=
1
... +
Kn+1 (x0 , . . . , xn )
,
Kn (x1 , . . . , xn )
1
xn
kde polynomy Kn (x1 , . . . , xn ) jsou zadány rekurencí K0 = 1, K1 (x1 ) = x1 a pro n ≥ 2
Kn (x1 , . . . , xn ) = Kn−2 (x1 . . . , xn−2 ) + xn Kn−1 (x1 , . . . , xn−1 ), .
Definice 6.8. Necht’ n ∈ N0 . Polynom Kn (x1 . . . , xn ) definovaný výše se nazývá n-tý
kontinuální polynom v proměnných x1 , . . . , xn . Nemůže-li dojít k nedorozumění, index n
obvykle vynecháváme.
Pro zlomky, které dostaneme zanedbáním 1/ξn+1 ve výrazu (6.3), zavedeme jednodušší
značení.
Definice 6.9. Necht’ ξ ∈ R\Q a necht’ [a0 , . . . , an , . . . ] je jeho řetězový zlomek. Pro n ≥ 0
položme
pn = Kn+1 (a0 , . . . , an )
Zlomek
pn
qn
a
nazýváme n-tý sblížený zlomek čísla ξ.
76
qn = Kn (a1 , . . . , an ) .
Nyní lze vyjádření (6.3) čísla ξ přepsat v kompaktnějším tvaru,
Kn+1 (a0 , . . . , an−1 , an + 1/ξn+1 )
=
Kn (a1 , . . . , an−1 , an + 1/ξn+1 )
ξn+1 Kn+1 (a0 , . . . , an−1 , an ) + Kn (a0 , . . . , an−1 )
=
=
ξn+1 Kn (a1 , . . . , an−1 , an ) + Kn−1 (a1 , . . . , an−1 )
ξn+1 pn + pn−1
=
.
ξn+1 qn + qn−1
ξ=
(6.4)
Přímo z definice pomocí kontinuálních polynomů je zřejmé, že posloupnosti (pn )∞
n=0 ,
(qn )∞
n=0 splňují následující rekurentní vztahy
p0 = a0 , p1 = 1 + a0 a1 ,
q0 = 1, q1 = a1 ,
pn = an pn−1 + pn−2 ,
qn = an qn−1 + qn−2 ,
pro n ≥ 2 ,
pro n ≥ 2 .
(6.5)
Poznámka 6.10. Vzhledem k tomu, že koeficienty ai řetězového zlomku jsou vždy ∞
kromě a0 - kladné, posloupnosti (pn )∞
n=2 , (qn )n=1 jsou ostře rostoucí.
Další zajímavou vlastnost ukazuje následující lemma.
Lemma 6.11. Nechť
pn pn−1
,
qn qn−1
jsou n-tý a (n − 1)-ní sblížený zlomek čísla x ∈ R \ Q. Pak
platí
pn−1 qn − pn qn−1 = (−1)n .
Důkaz. Použijeme matematickou indukci. Pro n = 1 vztah platí, protože
p0 q1 − p1 q0 = a0 a1 − (1 + a0 a1 ) = (−1)1 .
∞
Pro n ≥ 2 pak máme s využitím rekurence pro posloupnosti (pn )∞
n=2 a (qn )n=1 a indukčního
předpokladu
µ
pn−1 qn − pn qn−1 = det
pn−1 pn
qn−1 qn
¶
µ
= det
pn−2 pn−1
qn−2 qn−1
¶
µ
det
0 1
1 an
¶
=
¡
¢
= pn−2 qn−1 − pn−1 qn−2 · (−1) = (−1)n−1 · (−1) = (−1)n .
Poznámka 6.12. Předchozí lemma mimo jiné říká, že čísla pn a qn jsou navzájem nesoudělná (viz Věta 5.6). Sblížený zlomek
pn
qn
je tedy v základním tvaru. Uvědomíme-li si,
jak jsou definovaná čísla pn a qn , můžeme přepsat tvrzení Lemmatu 6.11 pro kontinuální
polynomy, tedy
K(a0 , . . . , an−1 )K(a1 , . . . , an ) − K(a0 , . . . , an )K(a1 , . . . , an−1 ) = (−1)n ,
což platí pro libovolné koeficienty a0 , . . . , an ∈ N.
77
(6.6)
6.3
Aproximace sblíženými zlomky
Zkoumejme nyní, jak dobře je dané iracionální číslo aproximováno svými sblíženými
zlomky. Zajímá nás tedy rozdíl ξ −
pn
,
qn
který můžeme s pomocí (6.4) a Lemmatu 6.11
přepsat
ξ−
pn
(−1)n
ξn+1 pn + pn−1 pn
pn−1 qn − qn−1 pn
=
.
=
−
=
qn
ξn+1 qn + qn−1
qn
qn (ξn+1 qn + qn−1 )
qn (ξn+1 qn + qn−1 )
(6.7)
Z tohoto vyjádření lze odvodit základní vlastnosti sblížených zlomků. První vlastnost,
kterou bychom po nekonečné posloupnosti ‘dobrých’ aproximací čísla ξ měli požadovat,
je to, aby konvergovala, a to právě ke ξ.
Věta 6.13. Nechť ξ ∈ R \ Q a nechť
pn
,
qn
n ≥ 0, jsou jeho sblížené zlomky. Potom
pn
=ξ.
n→∞ qn
lim
Důkaz. Protože pro ξ ∈ R \ Q je εn ∈ (0, 1) a qn−1 , qn ∈ N, dostaneme z (6.7) odhad
¯
¯
¯
¯
1
1
¯ξ − pn ¯ =
<
.
¯
¯
qn
qn (ξn+1 qn + qn−1 )
qn
Posloupnost (qn )n∈N roste s n do nekonečna, a proto limn→∞ |ξ −
pn
|
qn
= 0.
Z rovnosti (6.7) lze ovšem odvodit o konvergenci sblížených zlomků ještě více. Především je vidět, že výraz ξ −
pn
qn
střídá s n znaménko. Máme tedy pro n ≥ 0,
p2n
p2n+1
<ξ<
.
q2n
q2n+1
(6.8)
Uvědomíme-li si, jak ξn+1 figuruje v algoritmu výpočtu řetězového zlomku, můžeme použít
an+1 = bξn+1 c < ξn+1 , abychom dostali horní odhad
¯
¯
¯
¯
1
1
1
¯ξ − pn ¯ =
<
=
.
¯
¯
qn
qn (ξn+1 qn + qn−1 )
qn (qn−1 + an+1 qn )
qn qn+1
(6.9)
Podobně použitím ξn+1 < an+1 + 1 dostáváme
¯
¯
¯
¯
1
p
1
n
¯ξ − ¯ =
>
=
¯
¯
qn
qn (ξn+1 qn + qn−1 )
qn (qn−1 + (an+1 + 1)qn )
=
1
1
1
≥
=
.
qn (qn + qn+1 )
qn (qn + an+2 qn+1 )
qn qn+2
(6.10)
Z nerovností (6.9) a (6.10) snadno dostaneme
· · · < |pn+1 − qn+1 ξ| <
1
qn+2
< |pn − qn ξ| <
1
qn+1
< ··· ,
(6.11)
což vlastně znamená, že vzdálenost qn ξ od nejbližšího celého čísla je v každém kroku
menší. Tento fakt se nám bude brzy hodit.
78
Poznámka 6.14. Odhadneme-li (6.10) dále, pomocí 1/(qn qn+2 ) > 1/(qn+1 qn+2 ), můžeme
také odvodit ne tak jemný, ale zřejmější fakt,
¯
¯
¯
¯
¯
¯
pn ¯¯
pn+1 ¯¯
1
1
¯
¯
< ¯ξ − ¯ <
,
<
· · · < ¯ξ −
¯
qn+1
qn+1 qn+2
qn
qn qn+1
(6.12)
totiž že aproximace sblíženým zlomkem se s každým n ostře zlepšuje.
Poznamenejme, že z odhadu (6.9) můžeme odvodit |ξ −
pn
|
qn
< 1/qn2 pro každé n ∈ N,
čímž jsme vlastně provedli ještě jeden důkaz Dirichletovy věty 5.16.
Příklad 6.15. Aproximujme pomocí sblížených zlomků číslo ξ =
√
2. Nejprve musíme
√
√
určit koeficienty řetězového zlomku. Z algoritmu máme ξ0 = ξ = 2 a0 = [ 2] = 1,
√
√
√
ξ1 = 1/( 2 − 1) = 2 + 1, a1 = [ξ1 ] = 2, ξ2 = 1/(ξ1 − a1 ) = 1/( 2 − 1) = ξ1 . Protože
jsme získali stejnou hodnotu ξi , která se vyskytovala již pro menší index, je jasné, že
výpočet se zacyklí, speciálně ai = a1 = 2 pro všechna i ∈ N. Pomocí (6.5) můžeme napsat
následující přehled.
n
0 1
2
an
pn
qn
1 2
1 3
1 2
2 2 2
7 17 41
5 12 29
Například pátý sblížený zlomek
3
4
p5
q5
=
5
6
2
2
99 239
70 169
99
70
7
2
577
408
8
···
2
···
1393 · · ·
985 · · ·
= 1.4142857 · · · se liší od
√
2 = 1.41421356 · · ·
až na pátém desetinném místě. To odpovídá odhadu (6.9)
√
p5
1
1
1
| 2− |<
=
=
< 10−4 .
q5
q5 q6
70 · 169
11830
Následující lemma je podstatné pro důkaz několika dalších tvrzení o přesnosti aproximace čísla ξ jeho sblíženými zlomky.
Lemma 6.16. Nechť ξ ∈ R\Q. Jestliže
p
q
pro dva po sobě jdoucí sblížené zlomky
pn pn
, ,
qn qn
∈ Q není sblížený zlomek čísla ξ a qn−1 < q ≤ qn
pak platí
|qξ − p| ≥ |qn ξ − pn | + |qn−1 ξ − pn−1 | .
Důkaz. Uvažujme soustavu rovnic
µpn−1 + νpn = p
µqn−1 + νqn = q
79
Protože determinant matice soustavy je podle Lemmatu 6.11 roven pn−1 qn − pn qn−1 =
(−1)n , je její řešení
µ = (−1)n (pqn − qpn )
ν = (−1)n−1 (pqn−1 − qpn−1 ) .
a
Zjevně platí µ, ν ∈ Z. Navíc také µ, ν 6= 0, protože
p
q
6=
pn p
,
qn q
6=
pn−1
.
qn−1
Čísla µ, ν mají různá
znaménka, což plyne z rovnosti µqn−1 + νqn = q a faktu, že qn−1 < q ≤ qn . Ze vztahu
p − qξ = µpn−1 + νpn − (µqn−1 + νqn )ξ = µ(pn−1 − qn−1 ξ) + ν(pn − qn ξ)
proto můžeme odvodit odhad
|p − qξ| = |µ||pn−1 − qn−1 ξ| + |ν||pn − qn ξ| ≥ |pn−1 − qn−1 ξ| + |pn − qn ξ| ,
kde pro první rovnítko využíváme, že i výrazy pn−1 −qn−1 ξ a pn −qn ξ mají různá znaménka,
což snadno vyplývá z (6.8).
Důsledek 6.17. Nechť ξ ∈ R \ Q a nechť
p
q
pn
,
qn
n ≥ 0, jsou jeho sblížené zlomky. Nechť
∈ Q je zlomek takový, že 0 < q ≤ qn a pq 6= pqnn . Pak platí
¯
¯ ¯
¯
¯
¯ ¯
¯
¯ξ − p ¯ > ¯ξ − pn ¯ .
¯
q¯ ¯
qn ¯
Důkaz. Je-li qn−1 < q ≤ qn , je z Lemmatu 6.16 zřejmé, že |qξ − p| > |qn ξ − pn |. Podělením
obou stran nerovnice kladným číslem q dostaneme
¯
¯
¯
¯ ¯
¯
¯
¯ qn ¯
¯ ¯
¯
p
p
p
n
n
¯ξ − ¯ >
¯ξ − ¯ ≥ ¯ξ − ¯ .
¯
q¯
q ¯
qn ¯ ¯
qn ¯
Pokud q < qn−1 , pak qm−1 < q ≤ qm pro nějaké m ∈ N, m < n. Pak ale
¯
¯ ¯
¯ ¯
¯
¯
¯ ¯
¯ ¯
¯
p
p
p
m
n
¯ξ − ¯ > ¯ξ −
¯ > ¯ξ − ¯ ,
¯
q¯ ¯
qm ¯ ¯
qn ¯
kde poslední nerovnost je důsledkem (6.12).
Definice 6.18. Nechť ξ ∈ R \ Q. Zlomek
p
q
∈ Q,
p
q
r
s
takový, že |r − sξ| < |p − qξ| pro všechny
6= rs , q ≤ s, se nazývá nejlepší aproximace čísla ξ.
Věta 6.19 (Lagrange). Nejlepší aproximace čísla ξ ∈ R \ Q jsou právě jeho sblížené
zlomky.
Důkaz. Fakt, že n-tý sblížený zlomek je nejlepší aproximací je přímým důsledkem Lemmatu 6.16, protože pro každý zlomek
p
q
se jmenovatelem qm < q ≤ qm , kde m ≤ n, s
použitím (6.11) platí
|qξ − p| > |qm ξ − pm | ≥ |qn ξ − pn | .
80
Naopak nechť
by
r
s
6=
pn
,
qn
r
s
je nejlepší aproximace. Najděme n takové, že qn−1 < s ≤ qn . Pokud
pak podle Lemmatu 6.16 je |sξ − r| > |qn−1 ξ − pn−1 |, což odporuje vlastnosti
nejlepší aproximace. Proto
r
s
=
pn
.
qn
Věta 6.20. Nechť ξ ∈ R \ Q. Jeden ze dvou po sobě jdoucích sblížených zlomků čísla ξ
splňuje
¯
¯
¯ξ −
¯
Důkaz. Pro spor předpokládejme, že
¯
¯
¯
¯
¯ξ − pn ¯ ≥ 1
¯
qn ¯ 2qn2
¯
p ¯¯
1
< 2.
¯
q
2q
¯
¯
¯
¯
¯ξ − pn−1 ¯ ≥ 1 .
2
¯
qn−1 ¯ 2qn−1
a
Máme
¯
¯
¯
¯ ¯
¯
2
¯ pn
¯ pn pn−1 ¯
¯ ¯
qn2 + qn−1
pn−1 ¯¯
1
1
1
¯
¯
¯
¯
¯
ξ
−
=
+
≥
= ¯ −
−
ξ
+
=
,
2
2
¯ qn
¯ ¯
qn qn−1
qn
qn−1 ¯
qn−1 ¯
2qn2 2qn−1
2qn2 qn−1
což implikuje (qn − qn−1 )2 ≤ 0. To je ovšem spor, protože posloupnost (qn )n∈N je ostře
rostoucí.
Věta 6.21 (Legendre). Necht’ ξ ∈ R \ Q a necht’
¯
¯
¯ξ −
¯
Pak
p
q
p
q
je zlomek takový, že
¯
p ¯¯
1
< 2.
¯
q
2q
je sblížený zlomek čísla ξ.
Důkaz. Nechť
p
q
není sblížený zlomek čísla ξ. Najděme n tak, že qn−1 < q ≤ qn . Z Lem-
matu 6.16 vyplývá
|pn−1 − qn−1 ξ| < |p − qξ| <
1
.
2q
Odtud máme
¯
¯
¯
¯ ¯
¯
¯p
¯ p pn−1 ¯
¯ ¯
pn−1 ¯¯
1
1
1
¯
¯
¯
¯
¯
≤ ¯ − ξ ¯ + ¯ξ −
<
≤ ¯ −
+
.
¯
¯
2
qqn−1
q qn−1
q
qn−1
2q
2qqn−1
Potom ovšem q < qn−1 , což je spor.
Dirichletova věta 5.16, kterou jsme dokázali několika způsoby, říká, že každé reálné
číslo ξ lze aproximovat nekonečně mnoha zlomky
p
q
ve vzdálenosti menší než 1/q 2 od
ξ. Věta 6.20 ukazuje, že pro každé ξ ∈ R existuje dokonce nekonečněmnoho zlomků
p
q
vzdálených od ξ méně než 1/2q 2 . V následující větě předvedeme, jak nejlépe lze tuto
vzdálenost vylepšit.
81
Věta 6.22 (Hurwitzova věta). Pro každé ξ ∈ R \ Q existuje nekonečně mnoho různých
p
q
racionálních čísel
takových, že
¯
¯
¯ξ −
¯
¯
p ¯¯
1
<√
.
¯
q
5q 2
√
√
Tvrzení neplatí, nahradíme-li 5 konstantou C > 5.
Důkaz. Ukážeme, že nerovnost splňuje jeden ze tří po sobě jdoucích sblížených zlomků
čísla ξ. Důkaz provedeme sporem. Nechť pro k = n − 1, n, n + 1 platí
¯
¯
¯
¯
¯ξ − pk ¯ ≥ √1 .
¯
qk ¯
5qk2
(6.13)
Uvažujeme-li nejprve k = n − 1, n, máme podobně jako v důkazu Věty 6.20
¯
¯
¯
¯ ¯
¯
2
¯ pn pn−1 ¯
¯ pn
¯ ¯
¯
qn2 + qn−1
p
1
n−1
¯ = ¯ − ξ ¯ + ¯ξ −
¯ ≥ √1 + √ 1
√
= ¯¯ −
=
,
¯ qn
¯ ¯
2
2
qn qn−1
qn
qn−1 ¯
qn−1 ¯
5qn2
5qn−1
5qn2 qn−1
z čehož lze odvodit
Označíme-li x =
√
qn
qn−1
2
qn2 + qn−1
qn
qn−1
=
+
.
qn qn−1
qn−1
qn
√
√
≥ 1, platí 5 > x + x−1 (protože 5 ∈
/ Q). Odtud ovšem
2
x −
Proto x ∈
odvodíme
¡ √5−1
2
qn+1
qn
<
,
√
5+1
2
√
5+1
.
2
√
5 ≥
³
√
5x + 1 = x −
5 − 1 ´³
x−
2
√
5 + 1´
< 0.
2
¢
. Analogicky z předpokladu platnosti (6.13) pro k = n, n + 1
Dohromady tedy máme
qn+1 qn−1
−
<
qn
qn
√
5+1
2
−√
= 1.
2
5+1
Z rekurentního vztahu pro posloupnost (qn )n∈N pak plyne, že levá strana této nerovnosti
je rovna koeficientu an+1 rětězového zlomku čísla ξ. Vychází tedy an+1 < 1, což je spor,
protože koeficienty řetězového zlomku jsou (kromě a0 ) přirozená čísla.
Abychom dokázali druhou část Hurwitzovy věty, stačí najít reálné číslo ξ, pro které
√
√
nerovnost |ξ − pq | < 1/Cq 2 (při C > 5) implikuje, že q je omezené. Položíme ξ = 5−1
.
2
Předpokládejme, že máme nekonečně mnoho zlomků
p
q
splňujících |ξ − pq | < 1/Cq 2 . Odtud
je
ξ=
p
ε
+
q Cq 2
pro nějaké |ε| < 1 .
Po vynásobení číslem q dostaneme
√
q
ε
5
q − = ξq = p +
,
2
2
Cq
82
což je ekvivalentní s
√
5
ε
q
q−
=p+ .
2
Cq
2
Umocněním obou stran rovnice a drobnou úpravou dostaneme
√
ε2
5ε
−
= p2 + pq − q 2 ∈ Z .
2
2
C q
C
Přitom je ale |
√
5ε
|
C
<
√
5
C
< 1, takže pro dostatečně velké q je levá strana rovnosti v
absolutní hodnotě menší než 1. Celé číslo p2 + pq − q 2 je tedy pro dost velké q nutně rovno
0. Pak ovšem
4(p2 + pq − q 2 ) = (2p + q)2 − 5q 2 = 0 ,
tj.
√
5=
2p + q
∈ Q,
q
což je spor. Číslo q je tedy omezené a nemůže existovat nekonečně mnoho zlomků splňujících |ξ − pq | < 1/Cq 2 .
√
Poznámka 6.23. Pro důkaz přesnosti konstanty 5 v Hurwitzově větě jsme využili číslo
√
√
ξ = 21 ( 5 − 1), což je bez 1 zlatý řez, τ = 12 (1 + 5) = ξ − 1. Dalo by se tedy říct, že zlatý
řez patří mezi nejhůře aproximovatelná iracionální čísla. Ačkoliv pro skoro všechna reálná
√
ξ jsou jeho sblížené zlomky pn /qn výrazně blíže ke ξ, než je uvedená hranice 1/( 5qn2 ),
sblížené zlomky zlatého řezu τ (např. 5/3, 8/5, 13/8, atd.) jsou téměř přesně ve vzdálenosti
dané Hurwitzovou větou.
Důležitou roli v důkazu hrál fakt, že koeficienty ai , i ∈ N, řetězového zlomku zlatého
řezu jsou všechny rovny 1. Lze ukázat, že každé reálné číslo tvaru
a+bτ
,
c+dτ
kde a, b, c, d ∈ Z
splňují ad − bc = ±1, sdílí se zlatým řezem tuto vlastnost špatné aproximovatelnosti.
Kdybychom všechna tato čísla v Hurwitzově větě vynechali, bylo by možné tvrzení
√
zlepšit, a to na konstantu 2 2. Zase by existovala čísla, pro která by tato mez byla
nejlepší možná. Tak by bylo možno pokračovat dál.
6.4
Řetězový zlomek kvadratických čísel
Věta 6.24 (Lagrange). Necht’ ξ ∈ R \ Q. Jeho řetězový zlomek ξ = [a0 , a1 , a2 , . . . ] je od
jistého místa periodický, právě když ξ je algebraické číslo řádu 2.
Důkaz. Pro implikaci zleva doprava, vezměme iracionální ξ s periodickým řetězovým
zlomkem ξ = [a0 , a1 , . . . , ak−1 , ak , ak+1 , . . . , ak+l−1 ]. Máme
ξ = a0 +
1
..
.+
,
1
ak−1 +
kde ξk = [ak , ak+1 , . . . , ak+l−1 ] .
1
ξk
83
(6.14)
Protože ξk má čistě periodický řetězový zlomek, platí ξk+l = ξk , a tedy podle (6.4) máme
1
ξk = al +
ak+1 +
=
1
..
. ak+l−1 +
ξk K(ak , . . . , ak+l−1 ) + K(ak , . . . , ak+l−2 )
.
ξk K(ak+1 , . . . , ak+l−1 ) + K(ak+1 , . . . , ak+l−2 )
1
ξk
Po malé úpravě dostaneme kvadratickou rovnici pro číslo ξk s celočíselnými koeficienty.
Díky vztahu (6.14) leží číslo ξ v tělese Q(ξk ), které je nejvýše druhého řádu. Protože ξ je
iracionální, je to kvadratické číslo.
Důkaz opačné implikace je poněkud techničtější. Nechť ξ splňuje kvadratickou rovnici
aξ 2 + bξ + c = 0 pro a, b, c ∈ Z, a 6= 0. Dosaďme do této rovnice vztah (6.4). Postupnými
úpravami získáme kvadratickou rovnici pro každé ξn+1 , n ∈ N, ve tvaru
2
An ξn+1
+ Bn ξn+1 + Cn = 0 .
kde
An = ap2n + bpn qn + cqn2 ,
(6.15)
Bn = 2apn pn−1 + b(pn−1 qn + pn qn−1 ) + 2cqn qn−1 ,
(6.16)
2
Cn = p2n−1 + bpn−1 qn−1 + cqn−1
.
(6.17)
Nyní ukážeme, že trojice koeficientů (An , Bn , Cn ) je omezená. Snadno ověříme, že
An−1 = Cn
a
Bn2 − 4An Cn = b2 − 4ac .
(6.18)
První z těchto vztahů je zřejmý, pro ověření druhého musíme dosadit z (6.15), (6.16) a
(6.17) a ve výpočtu využít pn−1 qn − pn qn−1 = (−1)n z Lemma 6.11.
Vzhledem k vztahům (6.18) stačí ukázat omezenost koeficientů An . Do vyjádření (6.15)
dosadíme
pn = ξqn −
kde |δ| < 1 je takové, že
¯
pn ¯¯
1
¯
ξ
−
¯
¯< 2,
qn
qn
δ
,
qn
a tedy
ξ=
pn
δ
+ 2.
qn qn
Máme potom
δ2
) + b(ξqn2 − δ) + cqn2 =
qn2
δ2
= qn2 (aξ 2 + bξ + c) + a 2 − 2aξδ − bδ =
qn
2
δ
= a 2 − 2aξδ − bδ ,
qn
An = a(ξ 2 qn2 − 2ξδ +
84
kde jsme využili kvadratickou rovnici pro ξ. Nyní je vidět, že exituje K ∈ N takové, že
|An |, |Bn |, |Cn | < K ,
pro všechna n ∈ N .
Pro trojice (An , Bn , Cn ) ∈ Z3 tedy existuje pouze konečný počet možností. Proto musí
existovat (A, B, C) ∈ Z, do kterého se trojice (An , Bn , Cn ) trefí pro nekonečně mnoho
hodnot n. Existují tedy navzájem různá n1 , n2 , n3 ∈ N taková, že
(An1 , Bn1 , Cn1 ) = (An2 , Bn2 , Cn2 ) = (An3 , Bn3 , Cn3 ) = (A, B, C) .
Tudíž čísla ξn1 , ξn2 , ξn3 splňují stejnou kvadratickou rovnici Ax2 + Bx + C = 0, a proto
nejméně dvě z nich musí splývat. Bez újmy na obecnosti ξn1 = ξn2 a tedy řetězový zlomek
čísla ξ je periodický s periodou |n2 − n1 |.
Příklad 6.25. V předchozí větě jsme ukázali, že číslo ξ s periodickým řetězovým zlomkem
je kvadratické. Pro ilustraci najděme minimální polynom čísla ξ = [1, 3, 3, 3, . . . ]. Číslo
µ = ξ + 2 má čistě periodický zlomek [3], a proto µ = 3 + µ1 . Odtud snadno plyne
√
µ2 − 3µ − 1 = 0. Proto (ξ + 2)2 − 3(ξ + 2) − 1 = ξ 2 + ξ − 3 = 0. Je tedy ξ = 21 (−1 + 13).
Lagrangeova věta říká, že řetězový zlomek kvadratického čísla je od jistého členu periodický. Předchozí příklad podněcuje zvědavost, která kvadratická ξ mají řetězový zlomek
dokonce čistě periodický. To popisuje následující tvrzení.
Teorém 6.26. Nechť ξ je algebraické číslo druhého řádu se sdruženým kořenem ξ 0 . Pak
jeho řetězový zlomek je čistě periodický, právě když ξ > 1 a ξ 0 ∈ (−1, 0).
Důkaz. Pro implikaci zleva doprava předpokládejme, že řetězový zlomek čísla ξ je čistě
periodický, ξ = [b0 , b1 , . . . , bl−1 ]. Nutně bi ≥ 1 pro všechna i = 0, . . . , l − 1. Proto ξ > 1.
Označme ξ0 = ξ a ξj jako v algoritmu (6.2). Zřejmě platí ξ = ξ0 = ξl . Proto dosazením
n = l − 1 do vztahu (6.4) dostaneme kvadratickou rovnici pro ξ ve tvaru
ξ 2 ql−1 − ξ(pl−1 − ql−2 ) − pl−2 = 0 .
Polynom f (x) = ql−1 x2 − (pl−1 − ql−2 )x − pl−2 má tedy kořeny ξ a ξ 0 . Protože f (−1) =
ql−1 −ql−2 +pl−1 −pl−2 > 0 (posloupnosti (pn ), (qn ) jsou ostře rostoucí) a f (0) = −pl−2 < 0,
musí jeden z kořenů f , (a je to jasně ξ 0 ), ležet v intervalu (−1, 0).
Pro opačnou implikaci předpokládejme, že ξ = ξ0 > 1 je kvadratické číslo se sdruženým
kořenem ξ 0 ∈ (−1, 0). Označme jeho řetězový zlomek [b0 , b1 , . . . ]. Nejprve dokážeme
85
indukcí, že pro pro každé j ≥ 0 je ξj > 1 kvadratické číslo se sdruženým kořenem
ξj0 ∈ (−1, 0). První krok indukce je triviální. Dále je třeba si uvědomit, že čísla ξj ,
j ∈ N, leží všechna ve stejném kvadratickém tělese Q(ξ) a jeho Galoisův automorfismus σ přiřazuje ξj jeho algebraicky sdružené číslo, σ(ξj ) = ξj0 . Ze vztahu (6.2) proto
odvodíme
0
ξj+1
=σ
³
1 ´
1
= 0
.
ξj − bj
ξj − bj
Protože z indukčního předpokladu máme ξj > 1 a ξ 0 ∈ (−1, 0), je bj = [ξj ] ≥ 1 a
0
ξj0 − bj < −1. Proto platí také ξj+1
= 1/(ξj0 − bj ) ∈ (−1, 0), čímž je indukce hotova.
Ze vztahu ξj0 = bj +
−
1
0
ξj+1
1
0
ξj+1
∈ (−1, 0) plyne pro j ≥ 0, že
− 1 < bj < −
j
1
0
ξj+1
,
a proto
bj =
−
1 k
0
ξj+1
,
což využijeme následovně. Z Věty 6.24 je zřejmé, že řetězový zlomek ξ je od jistého členu
periodický. Označme k, l ∈ N0 nejmenší indexy takové, že ξk = ξl a k < l. Stačí dokázat,
že k = 0. Pokud ale k > 0, můžeme psát
j
bk−1 =
−
1 k j 1k
= − 0 = bl−1 ,
ξk0
ξl
0
a proto ξk−1
= bk−1 +
1
1
0
= bl−1 + 0 = ξl−1
,
0
ξk
ξl
což implikuje ξk−1 = ξl−1 , a to je spor s volbou minimálního k. Proto k = 0 a řetězový
zlomek ξ je čistě periodický.
Poznámka 6.27. Je zajímavé, že na rozdíl od kvadratických čísel, o řetězových zlomcích
algebraických čísel řádu vyššího než 2 se neví téměř nic. Řetězový zlomek žádného z nich
nebyl explicitně popsán. Hypotéza praví, že koeficienty řetězového zlomku algebraického
čísla řádu n ≥ 3 nejsou omezené. Existují příklady transcendentních čísel, jejichž řetězové
zlomky jsou známé. Je to třeba Eulerovo číslo e, viz. Sekce 7.4.
Většina iracionálních čísel nemá nijak pravidelný řetězový zlomek. Nicméně Khinchin
dokázal, že pro skoro všechna reálná x má posloupnost ai , i ∈ N, překvapivou vlast¢1/n
¡Q
, je roven pevné konstantě K ≈
nost: jejich geometrický přůměr, tj. limn→∞ ni=1 ai
2.6854520010... nezávislé na x, které se říká Khinchinova konstanta.
Lévy zase dokázal, že pro skoro všechna x má n-tá odmocnina jmenovatele n-tého
√
sblíženého zlomku čísla x limitu limn→∞ n qn ≈ 3.2758229187.... Ta se nazývá Lévyho
konstanta.
86
6.5
Aplikace řetězových zlomků pro diofantické
rovnice
Kromě samozřejmého využití řetězových zlomků pro hledání dobrých racionálních aproximací k iracionálním číslům je jednou z nejdůležitějších aplikací řetězových zlomků hledání
řešení Pellovy rovnice. Uvedeme zde postup, nikoliv však všechny důkazy k použitým
tvrzením, protože jsou poněkud technické. Nejprve předvedeme, že pro ne příliš velkou
pravou stranu všechna řešení zovecněné Pellovy rovnice odpovídají nějakému sblíženému
zlomku kvadratického čísla.
Teorém 6.28. Nechť m ∈ N je takové, že
√
m ∈
/ N, a nechť B ∈ Z, |B| <
√
m. Pak
každé řešení (x, y) ∈ Z2 diofantické rovnice x2 − my 2 = B je tvaru (±pn , ±qn ), kde
√
nějaký sblížený zlomek čísla m.
Důkaz. Nechť p, q ∈ N splňují p2 − mq 2 = B. Uvažujme nejprve 0 < B <
³ p √ ´³ p √ ´ B
p2
−
m
=
+ m
− m = 2,
q2
q
q
q
a proto
√
pn
qn
je
m. Pak
√
m
p √
B
1
0< − m= 2 p √
< 2√ < 2 .
q
2q
q ( q + m)
2q m
√
Podle Věty 6.21 proto musí být zlomek pq roven některému ze sblížených zlomků čísla m.
√
B
Pokud − m < B < 0, stačí si uvědomit, že p2 − mq 2 = B implikuje q 2 − m1 p2 = − m
.
√
Protože 0 < −B/m < m, můžeme stejně jako před chvílí odvodit, že zlomek pq je sblížený
√
zlomek k číslu 1/ m. Ovšem řetězový zlomek k tomuto číslu je roven [0, a0 , a1 , . . . ], kde
√
[a0 , a1 , a2 , . . . ] je řetězový zlomek čísla m. To, spolu s definičními vztahy pro posloup√
nosti pn , qn , implikuje, že n-tý sblížený zlomek čísla m je převrácenou hodnotou (n − 1)√
ního sblíženého zlomku čísla 1/ m. Tím je tvrzení dokázáno.
Všimněme si, že předchozí věta neříká nic o tom, pro které pravé strany B, |B| <
√
m
řešení Pellovy rovnice existuje. Abychom toto rozhodli, musíme znát řetězový zlomek čísla
√
m. Není těžké si uvědomit, že je tvaru
√
m = [a0 , a1 , . . . , al−1 , 2a0 ] ,
kde l ∈ N .
√
m + [ m], máme ξ 0 ∈ (−1, 0). Podle Věty 6.26 má takové ξ čistě
¥√
√ ¦
√
periodický řetězový zlomek, jehož nultý koeficient je roven
m+b mc = 2b mc = 2a0 .
Položíme-li totiž ξ =
√
Následující věta ukazuje, že pro každé m existuje řešení Pellovy rovnice s pravou
√
stranou B = ±1, a dokonce ukazuje, kterému sblíženému zlomku čísla m odpovídá.
87
Teorém 6.29. Nechť m ∈ N,
[a0 , a1 , . . . , al−1 , 2a0 ]. Označme
√
pn
qn
√
m ∈
/ N. Nechť l ∈ N je minimální takové, že m =
√
n-tý sblížený zlomek čísla m. Je-li l sudé, pak rovnice
x2 − my 2 = −1 nemá řešení (x, y) ∈ Z2 a minimální řešení (x, y) Pellovy rovnice x2 −
my 2 = 1 je rovno (pl−1 , ql−1 ). Je-li l liché, pak minimální řešení rovnice x2 − my 2 = −1
je rovno (pl−1 , ql−1 ), a minimální řešení rovnice x2 − my 2 = 1 je rovno (p2l−1 , q2l−1 ).
Použití věty ilustrujeme na následujícím příkladě.
Příklad 6.30. Najděme minimální řešení Pellovy rovnice x2 − 29y 2 = ±1. Postupným
√
výpočtem podle algoritmu (6.2) najdeme řetězový zlomek čísla 29 ve tvaru
√
29 = [5, 2, 1, 1, 2, 10] ,
což odpovídá Větě 6.29. Řetězový zlomek čísla
√
29 je tedy periodický a minimální délka
√
periody je l = 5. Protože l je liché, měli bychom pomocí sblížených zlomků čísla 29 najít
minimální řešení dané Pellovy rovnice pro obě pravé strany, tj. +1 i −1. Snadno získáme
následující tabulku.
n
0
1
2
an
pn
qn
5
5
1
2 1
11 16
2 3
1 2
27 70
5 13
p2n − 29qn2
-4
5
4
-5
3
4
-1
5
6
10
2
727 1524
135 283
-4
-5
7
8
1
2251
418
1
3775
701
5
-4
9
10
2
10
9801 101785
1820 18901
1
-4
···
···
···
···
···
Vidíme, že opravdu pro n = l − 1 = 4 dává n-tý sblížený zlomek řešení (x, y) =
(p4 , q4 ) = (70, 13) Pellovy rovnice x2 − 29y 2 = −1. Že je to řešení minimální, plyne
z Věty 6.28. Podobně minimální řešení základní Pellovy rovnice je (x, y) = (p9 , q9 ) =
(9801, 1820).
Poznamenejme, že posloupnost (p2n − 29qn2 )n∈N je periodická s periodou délky 10, takže
√
podle Věty 6.28 jsou jediné pravé strany B, |B| < 29, pro které je zobecněná Pellova
rovnice x2 − 29y 2 = B řešitelná, rovny B = ±1, ±4, ±5.
Mezi další příklady použití řetězových zlomků patří důkaz následující věty.
Věta 6.31. Každé prvočíslo tvaru 4k + 1, k ∈ N, lze jednoznačně rozložit na součet dvou
čtverců.
Připomeňme, že existenci rozkladu prvočísla p ≡ 1 mod 4 na součet dvou čtverců
jsme dokázali již dříve, ve Větě 5.10. Pomocí řetězových zlomků lze tvrzení dokázat jiným
elegantním způsobem, a navíc lze ukázat i jednoznačnost rozkladu.
88
Důkaz. K důkazu využijeme následujících vlastností kontinuálních polynomů, které lze
snadno odvodit z definice,
Kn (x1 , x2 , . . . , xn−1 , xn ) = Kn (xn , xn−1 , . . . , x2 , x1 )
Kn (x1 , . . . , xn ) = K(x1 , . . . , xl )K(xl+1 , . . . , xn ) +
(6.19)
+ K(x1 , . . . , xl−1 )K(xl+2 , . . . , xn ) ,
přičemž druhý vztah platí pro n ≥ 2 a 1 ≤ l ≤ n − 1 .
Mějme nyní prvočíslo p = 4k + 1. Uvažujme řetězové zlomky racionálních čísel p/1,
p/2, . . . , p/(2k). Pro každé j ∈ {1, 2, . . . , 2k} je zlomek p/j ve zkráceném tvaru a navíc
p/j ≥ 2. Proto p/j = [a0 , . . . , an ] pro nějaké n ∈ N0 , přičemž koeficienty splňují ai ∈ N,
navíc a0 = [p/j] ≥ 2 a an ≥ 2, což plyne z Poznámky 6.5. Je tedy
p
K(a0 , . . . , an )
=
.
j
K(a1 , . . . , an )
Protože K(a0 , . . . , an ), K(a1 , . . . , an ) jsou zároveň čitatel a jmenovatel n-tého sblíženého
zlomku k číslu ξ = p/j, jsou to tedy čísla navzájem nesoudělná a můžeme psát p =
K(a0 , . . . , an ). Ze symetrie také p = K(an , . . . , a0 ). Zlomek
[an , . . . , a0 ] =
K(an , . . . , a0 )
K(an−1 , . . . , a0 )
tedy musí také odpovídat racionálnímu číslu p/i pro nějaké i ∈ {1, 2, . . . , 2k}. Číslo p/j
tedy můžeme spárovat s číslem p/i, který má k němu zrcadlově symetrický řetězový
zlomek. Samo číslo p/1 = [p] má ale palindromický řetězový zlomek, takže je spárováno
samo se sebou. Protože jmenovatelů j ∈ {1, 2, . . . , 2k} je sudý počet, musí tedy existovat
ještě další číslo p/j0 s palindromickým řetězovým zlomkem,
[b0 , . . . , bt ] =
p
= [bt , . . . , b0 ] .
j0
Ukažme, že t musí být sudé. Kdyby totiž t = 2l + 1, pak p/j0 = [b0 , . . . , bl , bl+1 , bl . . . , b0 ]
a platí
p = Kn (b0 , . . . , bl , bl+1 , bl , . . . , b0 ) =
= K(b0 , . . . , bl )K(bl+1 , . . . , b0 ) + K(b0 , . . . , bl−1 )K(bl , . . . , b0 ) =
¡
¢
= K(b0 , . . . , bl ) K(bl+1 , . . . , b0 ) + K(b0 , . . . , bl−1 ) .
Číslo p je tedy složené, protože b0 ≥ 2 znamená, že oba faktory jsou ≥ 2.
Proto t = 2l, pro nějaké l ≥ 1, řetězový zlomek p/j0 = [b0 , . . . , bl , bl . . . , b0 ] a máme
p = Kn (b0 , . . . , bl , bl , . . . , b0 ) =
= K(b0 , . . . , bl )K(bl , . . . , b0 ) + K(b0 , . . . , bl−1 )K(bl−1 , . . . , b0 ) =
¡
¢2 ¡
¢2
= K(b0 , . . . , bl ) + K(b0 , . . . , bl−1 ) .
89
Prvočíslo p je tedy součtem dvou čtverců.
Ukažme, že rozklad je jednoznačný. Předpokládejme, že p = a2 + b2 = c2 + d2 pro
nějaké a, b, c, d ∈ N. Bez újmy na obecnosti předpokládejme a > b a c > d. Protože
p je prvočíslo, platí a ⊥ b, c ⊥ d. Zlomky ab ,
c
d
jsou tedy ve zkráceném tvaru. Pomocí
Eukleidova algoritmu najdeme jejich řetězové zlomky
a
= [b0 , . . . , bt ]
b
a
c
= [d0 , . . . , ds ] ,
d
kde t, s ≥ 0 a b0 , . . . , bt , d0 , . . . , ds ∈ N. Navíc podle Poznámky 6.5 je bt , ds ≥ 2.
Uvažujme nejprve zlomek
a
K(b0 , . . . , bt )
=
.
b
K(b1 , . . . , bt )
Platí tedy a = K(b0 , . . . , bt ) a b = K(b1 , . . . , bt ). Po dosazení do p = a2 + b2 dostaneme s
použitím vlastností (6.19), že
p = a2 + b2 = K(bt , . . . , b0 )K(b0 , . . . , bt ) + K(bt , . . . , b1 )K(b1 , . . . , bt ) =
= K(bt , . . . , b0 , b0 , . . . , bt ) .
Z rekurentního vztahu pro kontinuální polynomy máme
p = K(bt , . . . , b0 , b0 , . . . , bt ) = K(bt , . . . , b0 , b0 , . . . , bt−2 ) + bt K(bt , . . . , b0 , b0 , . . . , bt−1 ) .
Pro x := K(bt , . . . , b0 , b0 , . . . , bt−1 ), tedy můžeme psát nerovnost p ≥ 2x + 1, kde jsme
využili bt ≥ 2. Platí proto 2 ≤ x ≤ (p − 1)/2. Nyní využijeme rovnost (6.6),
K(bt , . . . , b0 ,b0 , . . . , bt−1 )K(bt−1 , . . . , b0 , b0 , . . . , bt ) −
− K(bt , . . . , b0 , b0 , . . . , bt )K(bt−1 , . . . , b0 , b0 , . . . , bt−1 ) =
= x2 + p K(bt−1 , . . . , b0 , b0 , . . . , bt−1 ) = (−1)2t+1 ,
což znamená, že x2 ≡ −1 mod p.
Kdybychom uvažovali zlomek
c
d
= [d0 , . . . , ds ], stejným způsobem bychom odvodili,
že p = K(ds , . . . , d0 , d0 , . . . , ds ) a číslo y definované jako y := K(ds , . . . , d0 , d0 , . . . , ds−1 )
splňuje 2 ≤ y ≤ (p − 1)/2 a y 2 ≡ −1 mod p.
Dohromady tedy máme x2 − y 2 = (x − y)(x + y) ≡ 0 mod p. Protože p je prvočíslo,
musí platit buď x − y ≡ 0 mod p nebo x + y ≡ 0 mod p. S ohledem na nerovnosti
2 ≤ x, y ≤ (p − 1)/2 možnost x ≡ −y mod p vyloučíme a odvodíme x = y. Proto platí
K(bt , . . . , b0 , b0 , . . . , bt )
p
p
K(ds , . . . , d0 , d0 , . . . , ds )
= = =
.
K(bt−1 , . . . , b0 , b0 , . . . , bt )
x
y
K(ds−1 , . . . , d0 , d0 , . . . , ds )
90
Odvodili jsme tedy
[bt , . . . , b0 , b0 , . . . , bt ] = [ds , . . . , d0 , d0 , . . . , ds ] .
Rozvoj do řetězového zlomku je ale podle poznámky 6.5 jednoznačný, a proto t = s a
bi = di pro i = 0, . . . , t. To také implikuje
a = K(b0 , . . . , bt ) = K(d0 , . . . , ds ) = c
a
což jsme měli ukázat.
91
c = K(b1 , . . . , bt ) = K(d1 , . . . , ds ) = d ,
7
Transcendentní čísla
Množina racionálních čísel se ukazuje býti chudá ve dvou situacích:
• Polynomy s koeficenty v Q nemusejí mít v Q řešení.
• Cauchyovské posloupnosti racionálních čísel nemusejí mít v Q limitu.
Neexistence racionálního kořene polynomu má různé projevy. Např. o polynomu x2 − 2 už
Řekové dokázali, že nemá racionální kořen. Nicméně lze nalézt posloupnost racionálních
čísel (rn )n∈N takovou, že rn jsou “skoro kořeny”, v dnešní terminologii lim(rn2 − 2) = 0.
Naproti tomu pro polynom x2 + 1 se nám ani nepodaří najít posloupnost “skoro kořenů”.
Jak už víme z kapitoly o algebraických číslech, když definujeme množinu A jako množinu
všech kořenů polynomů s racionálními koeficienty a vhodně dodefinujeme operaci sčítání
a násobení, dostaneme tzv. těleso algebraických čísel. Toto těleso je už z pohledu kořenů
dostatečně bohaté, tj. každý polynom s koeficienty v A má kořen v A.
Když zavedeme na prostoru racionálních cauchyovských posloupností ekvivalenci
(xn )n∈N ∼ (yn )n∈N ,
pokud
lim(xn − yn ) = 0 ,
lze třídy ekvivalence opatřit sčítáním a násobením tak, že dostaneme těleso dnes značené
R a nazývané reálná čísla. Toto těleso je už z pohledu limit dostatečně bohaté, tj. každá
posloupnost reálných čísel má v R limitu.
Těleso A tedy řeší otázku existence kořenů, těleso R pak otázku existence limit, ale
ne naopak. O reálných číslech se jednoduše ukáže, že selhávají z pohledu hledání kořenů,
např. kořen polynomu x2 + 1 nemůže být reálný. Ukázat, že A neobsahuje limity všech
racionálních cauchyovských posloupností, se dlouho nedařilo, i když většina matematiků
o tom byla přesvědčena. Proto se ujala známá konstrukce, která uvažuje minimální těleso
obsahující R a kořen rovnice x2 + 1, tzv. imaginární jednotku i. Výsledkem je těleso
komplexních čísel C. Toto těleso je už bohaté z obou pohledů. Snadno se ukáže, že C
obsahuje limity všech komplexních cauchyovských posloupností. Slavný výsledek Gausse
92
z roku 1799, že každý polynom s koeficienty v C má v C kořen, pak vyjadřuje algebraickou
uzavřenost C.
Otázka, zda není zbytečné konstruovat C, neboli zda už náhodou neplatí A = C,
zůstala však i po Gaussovi nevyřešena. Prvky množiny C \ A, se nazývají transcendentní.
Nezodpovězena tedy byla otázka, zda existuje transcendentní číslo. Všichni tušili, že e a
π jsou transcendentní. Ale až v roce 1944 Joseph Liouville explicitně zkonstruoval transcendentní číslo. Průlomovým okamžikem v pohledu na transcendentní čísla byly Cantorovy výsledky spojené s definicí ekvivalence množin z roku 1873. Vedly k překvapivě
jednoduchému důkazu faktu, že téměř každé komplexní číslo je transcendentní. Cantorův
důkaz však naposkytuje návod, jak - byt’ jediné - transcendentní číslo zkonstruovat. Ve
stejném roce Ch. Hermit dokázal, že Eulerovo číslo e je transcendentní. Tento výsledek
ve své době zastínil Cantorův důkaz, který byl pouze existenční. V roce 1882 Hermitův
žák F. Lindemann odvodil transcendentnost čísla π. Proslavil se tak důkazem nemožnosti
kvadratury kruhu, viz kapitola o konstrukcích pomocí kružítka a pravítka.
7.1
Liouvilleova čísla
Liouville udělal elegantní pozorování, že algebraické číslo nemůže být příliš dobře aproximováno zlomkem s malým jmenovatelem.
Věta 7.1. Necht’ α je algebraické číslo řádu d ≥ 2. Pak existuje c = c(α) > 0 takové, že
¯
¯
¯α − p ¯ ≥ c
q
qd
pro každé
p
∈ Q.
q
Důkaz. Necht’ polynom f (x) = ad xd +. . .+a1 x+a0 s celočíselnými koeficienty je minimální
polynom čísla α. Protože f nemá žádný racionální kořen, je f (p/q) 6= 0. Proto
d
d−1
d−1
¯ ¡ p ¢¯
¯
+ a0 q d ¯¯
1
¯f
¯ = ¯ ad p + ad−1 p q + . . . + a1 pq
≥ d.
d
q
q
q
(7.1)
Použijeme-li Lagrangeovu větu o přírustku funkce na interval s krajními body α a p/q ,
dostaneme pro nějaké ξ z tohoto intervalu
¯ ¡ p ¢¯
¯ ¡ ¢
¯
¯
¡
¢¯
¯f
¯ = ¯f p − f (α)¯ = ¯f 0 (ξ) α − p ¯ .
q
q
q
Položme
©
c := min 1,
ª
1
maxξ∈[α−1,α+1]
93
|f 0 (ξ)|
.
(7.2)
Při této volbě c zřejmě platí
p
∈
/ [α − 1, α + 1]
q
¯
¯
¯α − p ¯ ≥ 1 ≥ 1 ≥ c
q
qd
qd
=⇒
a ze vztahů (7.1) a (7.2) také
p
∈ [α − 1, α + 1]
q
¯
1 ¯¯
p¯
p¯
|f 0 (ξ)| . ¯α − ¯ ≤
α− ¯
ξ∈[α−1,α+1]
q
c
q
1
≤
qd
=⇒
max
Nyní můžeme představit první známé transcendentní číslo.
Důsledek 7.2. Číslo
P+∞
1
n=1 10n!
je transcendentní.
Důkaz. Pro spor předpokládejme, že α :=
P+∞
1
n=1 10n!
je algebraické řádu d. Definujme pN
a qN pro každé N ∈ N takto
N
X
pN
pN
1
=
=
.
N
!
n!
10
qN
10
n=1
Z věty 7.1 dostaneme odhad
¯
c
c
pN ¯¯
= d ≤ ¯α −
=
N
!
d
(10 )
qN
qN
+∞
X
+∞
X
1
≤
n!
10
n=N +1
n=(N +1)!
1
1
10
=
.
n
(N
+1)!
10
10
9
Z toho plyne
10(N +1)!−d N ! ≤
10
.
9c
Protože exponent (N + 1)! − d N ! = N !(N + 1 − d) má limitu +∞, je limita posloupnosti
na levé straně +∞ a ta by měla být menší než konstanta
Poznámka 7.3. Když budeme uvažovat číslo α =
10
9c
- spor.
P+∞
an
n=1 10n! ,
kde (an )n∈N je libovolná
posloupnost z 0 a 1 obsahující nekonečně mnoho jedniček, dokážeme stejným postupem transcendentnost α. Tedy takto zkonstruujeme tolik transcendentních čísel, kolik
je posloupností z 0 a 1. Protože {0, 1}N je ekvivalentní s R, množina transcendentních
čísel má mohutnost kontinua. To dokázal už Cantor, ale narozíl od Cantorova důkazu,
umíme kontinuun transcendentních čísel zkonstruovat.
Důsledek 7.4. Necht’ α je iracionální číslo. Necht’ existuje prostá posloupnost racionálních
¡ ¢
čísel pqnn n∈N taková, že
¯
¯
¯α − pn ¯ ≤ 1
qn
qnn
pro každé n ∈ N .
Pak α je transcendentní.
94
Důkaz. Pro spor předpokládejme, že α je algebraické číslo. Protože α je iracionální, je
jeho řád d alespoň 2. Podle 7.1 existuje c > 0 tak, že pro každé n ∈ N platí
¯
¯
c
¯α − pn ¯ ≤ 1 .
≤
qnd
qn
qnn
To implikuje qnn−d ≤ 1/c. Jelikož nejvýše jedno qn může být jednička, je limita posloupnosti
qnn−d rovna +∞. To odporuje tomu, že je shora omezená konstantou 1/c.
Definice 7.5. Číslo α nazveme Liouvilleovým, když vyhovuje předpokladům důsledku
7.4.
Samozřejmě každé Liouvilleovo číslo je transcendentní. Všechna čísla
P+∞
an
n=1 10n!
definovaná
v poznámce za 7.2 jsou Liouvilleova, a tedy má množina Liuouvilleových čísel mohutnost
kontinua. Lze však ukázat, že tato množina má Lebesgueovu míru 0. Tedy většina transcendentních čísel není Liouvilleova. V této souvislosti je proto zajímavé zmínit následující
větu.
Věta 7.6. Každé reálné číslo lze zapsat jako součet dvou Liouvilleových čísel.
Důkaz. Z definice Liouvilleova čísla plyne, že když α je Liouvilleovo pak α + 1 a α − 1
jsou Liouvilleova též. Proto bez újmy na obecnosti stačí větu dokázat pro reálné číslo
β ∈ (0, 1]. Necht’
β = 0.d1 d2 d3 d4 . . .
je zápis čísla β v decimální soustavě, který obsahuje nekonečně mnoho nenulových koeficientů di (např.
1
2
= 0.249999999 . . .). Položme
L1 := 0 . 0 d2 d3 0 0 0 0 0 0 d10 d11 . . . d33 0
0
...
L2 := 0 . d1 0 0 d4 d5 d6 d7 d8 d9 0
0
... 0
d34 d35 . . .
Bloky nul mají v zápisech čísel L1 a L2 na střídačku délky 1!, 2!, 3!, 4!, . . .. Zřejmě platí
β = L1 + L2 . Ukažme, že L2 je Liouvilleovo číslo. Definujme
pn
pn
=
= 0.d1 00d4 . . . dI ,
I
10
qn
kde poslední index I je I = 1! + 2! + 3! + . . . + (2n − 1)!, tj. desetinný zápis pn /qn obsahuje
desetinná místa čísla L2 až po index I - na tomto indexu končí n-tý blok nenul v zápisu
L2 . Jmenovatele qn klademe 10I . Proto
L2 −
pn
= 0. 000
. . 000} dJ dJ+1 dJ+2 . . . ,
| .{z
qn
I+(2n)! nul
95
kde J = I + (2n)! + 1 .
Dostáváme kýžený odhad
0 < L2 −
pn
1
1
1
<
<
= n.
I+(2n)!
In
qn
10
10
qn
Využili jsme přitom platnost nerovnosti nI < I + (2n)!, kterou jedinnou zbývá ověřit:
nI = n
2n−1
X
k! < n
k=1
2n−2
X
k!+n(2n−1)! < n(2n−1)(2n−2)!+n(2n−1)! = (2n)! < I +(2n)! .
k=1
Důkaz liouvilleovskosti L1 je obdobný.
Poznámka 7.7. V předchozích důkazech liouvilleovskosti jsme podstatně využívali, že
desetinný zápis zkoumaného čísla obsahoval dlouhé bloky nul. Tato vlastnost samotná
však nestačí. V roce 1930 Kurt Mahler ukázal o čísle
M := 0.1234567891011121314151617181920212223 . . . ,
jež vznikne postupným psaním po sobě jdoucích přirozených čísel, že je transcendentní,
ale není Liouvilleovo. Přitom desetinný zápis Mahlerova čísla obsahuje bloky nul libovolné
délky.
Poznámka 7.8. Podle Liouvilleovy věty 7.1 se nelze k algebraickému číslu α řádu d ≥ 2
přiblížit racionálním číslem
rovnicích víme
p
q
pod hranici
¯
¯
¯α − p ¯ < 1
q
q2
c
.
qd
Na druhé straně z kapitoly o diofantických
pro nekonečně mnoho
Jak moc lze snížit exponent d ve jmenovateli
1
,
qd
p
∈ Q.
q
aby platila Liouvilleova nerovnost? Na
tuto otázku odpověděl v roce 1955 Klaus Roth. Dokázal, že pro každé algebraické číslo α
řádu d ≥ 2 a každé kladné ε existuje c = c(α, ε) > 0 takové, že
¯
¯
¯α − p ¯ ≥ c
q
q 2+ε
pro každé
p
∈ Q.
q
Bohužel tato vlastnost necharakterizuje algebraická čísla: stejné tvrzení platí, když v
Rothově větě zvolíme za α Eulerovo číslo e.
7.2
Transcendentnost Eulerova čísla e
Čtenář si jistě pamatuje důkaz iracionality čísla e z prvoročníkové analýzy. Pro závěrečný
spor poslouží jednoduchý fakt, že v intervalu (0, 1) neleží žádné celé číslo. Tento fakt je
používaný i v mnoha důkazech o transcendentnosti, proto jej např. v [3] nazývají ”základní
96
princip teorie čísel”. Budeme jej využívat i v našem důkazu. Důležitou technickou roli v
důkazu bude mít polynom definovaný pro libovolné přirozené číslo n a prvočíslo p > n
f (x) :=
xp−1
(x − 1)p (x − 2)p . . . (x − n), .
(p − 1)!
(7.3)
Polynom f je tedy polynom stupně (n + 1)p − 1. Dvě potřebné vlastnosti f v bodech
0, 1, 2, . . . , n dokážeme v následujících lemmatech.
Lemma 7.9. Pro derivace polynomu f v bodě 0 platí
1. f (r) (0) je celé číslo pro každé r ∈ N0 ,
2. f (p−1) (0) není dělitelné prvočíslem p ;
3. f (r) (0) je dělitelné prvočíslem p pro každé r ∈ N0 \ {p − 1}.
Důkaz. Případ r > (n + 1)p − 1.
Protože f je polynom stupně (n + 1)p − 1, jsou všechny jeho r-té derivace identicky rovny
nule. Pro takové r je číslo f (r) (0) = 0, a tedy celé a dělitelné číslem p.
Případ r < p − 1.
Připomeňme jednoduché tvrzení o polynomech: pokud číslo α je k násobný kořen polynomu q(x) pro nějaké k ∈ N, má derivace q 0 (x) číslo α za svůj (k − 1) násobný kořen.
Jelikož 0 je p − 1 násobným kořenem našeho polynomu f , je 0 kořenem všech jeho derivací
f (i) pro i = 0, 1, . . . , p − 2. Proto opět pro takové r je f (r) (0) = 0.
Pro zbylé případy spočítame r-tou derivaci f podle Newtonova vzorce pro výpočet
derivace součinu dvou funkcí:
¶(k) ³
r µ ¶µ
X
£
¤p ´(r−k)
r
xp−1
(r)
(x − 1)(x − 2) . . . (x − n)
.
f (x) =
k
(p
−
1)!
k=0
|
{z
}
(7.4)
A
Případ r = p − 1.
Dosad’me do rovnosti x = 0. V tomto případě je výraz A nenulový pouze pro sčítací index
k = p − 1. Pro takové k je hodnota A = 1. Proto dostaneme
£
¤p
f (p−1) (0) = (−1)(−2) . . . (−n) = (−1)np (n!)p ∈ Z .
Ted’ využijeme, že prvočíslo p > n. To zaručuje, že p nedělí f (p−1) (0).
Případ p − 1 < r ≤ (n + 1)p − 1.
97
Po dosazení 0 do vztahu (7.4) si opět zahraje pouze sčítací index k = p − 1 a A = 1.
Polynom
£
¤p
h(x) := (x − 1)(x − 2) . . . (x − n)
je pro r > p − 1 alespoň jednou zderivován. Z tvaru derivace
£
¤p−1 £
¤0
h0 (x) = p (x − 1)(x − 2) . . . (x − n)
(x − 1)(x − 2) . . . (x − n)
vidíme, že h0 (x) lze napsat jako pg(x), kde g(x) je polynom s celočíselnými koeficienty.
Takový polynom má všechny své derivace v celočíselných bodech celočíselné. Proto je
¡
¢(r−p+1)
h(x)
v bodě 0 násobkem p.
Lemma 7.10. Pro každé j ∈ {1, 2, . . . , n} a r ∈ N0 je f (r) (j) dělitelné prvočíslem p.
Důkaz. Upevněme j. Polynom f lze napsat ve tvaru
f (x) =
´
1 ³
Bp (x − j)p + Bp+1 (x − j)p+1 + . . . ,
(p − 1)!
kde Bp , Bp+1 , . . . ∈ Z
Jelikož číslo j je p násobným kořenem polynomu f (x), platí
f (r) (j) = 0
pro r = 0, 1, . . . , p − 1 .
Pro r ≥ p dostaneme
f (r) (j) =
1
Br r! = Br r(r − 1) . . . p ,
(p − 1)!
a tedy je to číslo dělitelné p.
Lemma 7.11. Necht’ q je libovolný polynom stupně s. Položme
F (x) := q(x) + q 0 (x) + . . . + q (s) (x) .
Pak
Z
x
ex−t q(t) dt = −F (x) + ex F (0)
0
Důkaz. Aplikujme metodu per partes
Z x
Z
x−t
x−t
x
e q(t) dt = [−e q(t)]0 +
0
x
Z
x−t 0
e
x
x
q (t) dt = e q(0) − q(x) +
0
0
a pak indukci na stupeň polynomu q.
98
ex−t q 0 (t) dt
Věta 7.12. Číslo e je transcendentní.
Důkaz. Pro spor předpokládejme, že existují celá čísla c0 , c1 , . . . , cn tak, že
c0 + c1 e + . . . + cn en = 0,
kde c0 6= 0 .
(7.5)
Tvrzení lemmatu 7.11 použijeme na polynom f definovaný v (7.3), kde za x postupně
dosadíme j = 0, 1, . . . , n. Po vynásobení koeficientem cj a sečtením dostaneme s přihlédnutím k (7.5)
n
X
Z
j
cj
j=0
e
j−t
f (t) dt = −
0
n
X
cj F (j) .
(7.6)
j=0
Podle Lemmat 7.9 a 7.10 je pravá strana rovnosti celé číslo, které je modulo p rovno
c0 F (0), a to pro každé prvočíslo p > n. Zvolíme-li prvočíslo p > c0 6= 0, je podle 7.9
pravá strana 6= 0 mod p. Proto je pravá strana celé nenulové číslo. Spor dostaneme tak,
že o levé strané rovnosti (7.6) ukážeme, že jí vhodnou volbou prvočísla p > c0 dokážeme
udělat v absolutní hodnotě menší než 21 . Odhadujme
Z j
n
¯X
¯
p−1 pn
n
¯
¯
j−t
n n
cj
e f (t) dt¯ ≤ (n + 1)n max |cj |e
.
¯
j=0,...,n
(p − 1)!
0
j=0
Uvědomme si, že n je pevné - je to řád čísla e, o kterém pro spor předpokládame, že je
algebraické. Protože
(nn+1 )p
= 0,
p7→+∞ (p − 1)!
lim
lze pro dostatečně velké prvočíslo p odhadnout levou stranu (7.6) zlomkem 21 .
7.3
Transcendentnost čísla π
Číslu π se v zemích s vlivem německé matematiky říká Ludolphovo číslo. Ludolph van
Ceulen byl německý matematik, který působil v holandském Leidenu. V roce 1596 určil
π s přesností na 20 míst. Myšlenky důkazu transcendentnosti π jsou stejné jako u čísla
e, jenom volba vhodného polynomu f je více rafinovaná. Využijeme faktu, že komplexní
číslo α je transcendentní právě tehdy, když iα je transcendentní. Budeme tedy sporem
dokazovat transcendentnost iπ.
Necht’ iπ je algebraické číslo řádu n. Označme iπ = α1 , α2 , . . . , αn kořeny jeho minimálního monického polynomu. V našich úvahách budeme využívat, že koeficienty minimálního polynomu jsou jednak racionální čísla a jednak jsou to hodnoty elementárních
99
symetrických polynomů v proměnných α1 , α2 , . . . , αn . Protože eiπ + 1 = 0, platí
¡
¢¡
¢ ¡
¢
eα1 + 1 eα2 + 1 . . . eαn + 1 = 0 .
(7.7)
Po roznásobení dostaneme na levé straně sumu mocnin čísla e, kde v exponentech jsou
součty všech možných výběru kořenů z množiny α1 , α2 , . . . , αn . Např. levá strana bude
obsahovat sčítance eαi +αj pro všechny i, j = 1, 2, . . . , n, i 6= j,. Koeficienty polynomu
g2 (x) :=
Y
(x − αi − αj )
i6=j
jsou symetrické polynomy v proměnných α1 , . . . , αn . Podle základní věty o symetrických
polynomech lze koeficienty polynomu g2 (x) vyjádřit jako polynomy v elementárních symetrických polynomech, které nabývají pro proměnné α1 , α2 , . . . , αn racionálních hodnot.
Proto g2 (x) je polynom s racionálními koeficienty. Podobně lze dokázat, že polynom g3 (x)
definovaný tak, aby měl za kořeny všechny sčítance αi + αj + αk tří různých kořenů, má
racionální koeficienty. Analogicky definujeme také racionální polynomy g4 , . . . , gn . Pak
rovnice
g1 (x)g2 (x) . . . gn (x) = 0
je polynomiální rovnice s racionálními koeficienty a má kořeny všechny možné sumy
vytvořené z α1 , α2 , . . . , αn . Označme β1 , . . . , βr všechny nenulové kořeny této polynomiální
rovnice. Zkrácením polynomu g1 (x)g2 (x) . . . gn (x) faktorem x umocněným na násobnost
nuly a vynásobením vhodným celým číslem dostaneme polynom stupně r s celočíselnými
koeficienty, označme jej g(x), tj.
g(x) = cxr + c1 xr−1 + . . . + cr ,
kde c, cr 6= 0 .
(7.8)
Nenulová čísla β1 , β2 , . . . , βr jsou tedy kořeny polynomu g a zároveň pro ně podle vztahu
(7.7) platí
eβ1 + eβ2 + . . . + eβr + e|0 + .{z
. . + e}0 = 0 ,
k
Nyní definujme polynom
f (x) := crp−1
kde k > 0 .
(7.9)
krát
¢p
xp−1 ¡
g(x) .
(p − 1)!
Na tento polynom stupně r(p + 1) − 1 aplikujeme lemma 7.11 pro hodnotu x = βj .
Dostaneme
Z
βj
βj
−F (βj ) + e F (0) =
0
100
eβj −t f (t) dt .
Po sčítání a využití (7.9)
−
r
X
F (βj ) − kF (0) =
r Z
X
j=1
j=1
βj
eβj −t f (t) dt .
(7.10)
0
Opět ukážeme, že při vhodné volbě prvočísla p pravou stranu rovnosti umíme udělat
menší než 12 . Za tímto účelem označme L minimální uzavřený kruh v komplexní rovině
s počátkem v 0, který obsahuje β1 , . . . , βr , tj. jeho poloměr je R := max{|βj |}. Hodnoty
holomorfních funkcí g(x), x a eβj −x můžeme omezit na kompaktu L v absolutní hodnotě
společnou konstantnou, označme ji M . Proto lze odhadnout
r Z βj
¯X
¯
M p−1
¯
¯
eβj −t f (t) dt ¯ ≤ rRM crp−1
Mp .
¯
(p
−
1)!
j=1 0
Pravá strana v naši nerovnosti má limitu 0 při rostoucím p, a tedy vhodnou volbou p lze
levou stranu udělat libovolně malou.
Abychom získali kýžený spor, potřebujeme ukázat, že levá strana v (7.10) je celé
nenulové číslo. Tento fakt bezprostředně plyne z těchto dvou lemmat.
Lemma 7.13. Pro každé t ∈ N0 platí
r
X
f (t) (βj ) je celé číslo dělitelné číslem p .
j=1
Důkaz. Jelikož každé βj je p násobný kořen polynomu f a tento polynom má stupeň
rp + p − 1, je tvrzení netriviální pouze pro derivace řádu t, kde p ≤ t ≤ rp + p − 1.
Uvažujme takové t. Derivace f (t) (βj ) je celočíselným polynomem v proměnné βj stupně
nanejvýš rp − 1. Navíc každý koeficient polynomu f (t) (βj ) je dělitelný faktorem p a crp−1 .
Pr
(t)
Suma
j=1 f (βj ) je symetrickým polynomem v proměnných β1 , . . . , βr , a proto lze
Pr
(t)
j=1 f (βj ) napsat jako celočíselný polynom stupně nanejvýš rp − 1, kde proměnné jsou
elementární polynomy v β1 , . . . , βr . Ze vztahu (7.8) plyne, že i-tý elementární polynom v
β1 , . . . , βr má hodnotu ci /c. Faktor crp−1 v definici polynomu f zaručuje, že po dosazení
ci /c, je výsledek celé číslo, které je dělitelné prvočíslem p.
Lemma 7.14. Necht’ p > max{cr , c} je prvočíslo. Pak f (t) (0) je celé číslo pro každé
t ∈ N0 . Navíc
• p dělí f (t) (0) pro každé t ∈ N0 \ {p − 1};
• f (p−1) (0) = cpr crp−1 a není dělitelné číslem p.
Důkaz. Toto lemma se dokazuje stejně jako lemma 7.9, úlohu polynomu h(x) ted’ hraje
polynom crp−1 g(x).
101
7.4
Řetězový zlomek Eulerova čísla e
Kdybychom spočítali několik prvních členů řetězových zlomků čísel e a π dostali bychom
e = [2, 1, 2, 1, 1, 4, 1, 1, 6, 1, 1, 8, 1, 1, 10, 1, 1, 12, 1, 1, 14, 1, 1, 16, 1, 1, 18, 1, 1, . . .
π = [3, 7, 15, 1, 292, 1, 1, 1, 2, 1, 3, 1, 14, 2, 1, 1, 2, 2, 2, 2, 1, 84, 2, 1, 1, 15, 3, 13,
1, 4, 2, 6, 6, 99, 1, 2, . . .]
U čísla e tušíme zákonitost, jak bude řada koeficientů dále pokračovat. Cílem této kapitoly
bude potvrdit toto tušení. Zato koeficienty v řetězovém zlomku čísla π vypadají velice
náhodně a zatím se nepodařilo nic zajímavého o nich vypozorovat.
Kromě kvadratických iracionalit, které mají řetězový zlomek od jistého místa periodický, má pravidelný tvar řetězového zlomku i další skupina čísel, jež umíme vyjádřit
pomocí známe funkce
tgh (x) =
sinh(x)
ex − e−x
= x
.
cosh(x)
e + e−x
Budeme využívat rozvojů funkcí sinh(x) a cosh(x) do Taylorovy řady, které odvodíme
snadno z rozvoje exponenciály:
sinh(x) =
+∞
X
k=0
x2k+1
(2k + 1)!
Věta 7.15. Řetězový zlomek čísla tgh
tgh
¡1¢
n
a
¡1¢
n
cosh(x) =
+∞
X
x2k
.
(2k)!
k=0
(7.11)
je
= [0, n, 3n, 5n, 7n, . . .] pro každé n ∈ N .
Důkaz. Pro parametr c ∈ R \ {0, −1, −2, −3, . . .} definujme funkci
F (c, x) :=
+∞
X
k=0
xk
.
c(c + 1) . . . (c + k − 1) k!
Nejdříve ověřme, že pro tuto funkci platí
x
F (c + 2, x) .
c(c + 1)
F (c, x) = F (c + 1, x) +
(7.12)
Protože se jedná o rovnost mezi mocninnými řadami, stačí ověřit, že se rovnají koeficienty
u mocnin xk pro každé k. K tomu stačí ověřit, že
1
c(c+1)···(c+k−1) k!
=
1
(c+1)(c+2)···(c+k) k!
+
102
1
1
c(c+1) (c+2)(c+3)···(c+2+k−2) (k−1)!
.
Po dosazení x = z 2 do (7.12) a jednoduché úpravě dostaneme
z F (c + 1, z 2 )
=
c F (c, z 2 )
1
c
z
+
z F (c+2,z 2 )
c+1 F (c+1,z 2 )
.
(7.13)
Aplikováním (7.13) s parametrem c zvýšeným o 1 na druhý sčítanec jmenovatele prvé
strany (7.13) dostaneme
z F (c + 1, z 2 )
=
c F (c, z 2 )
1
c
z
+
.
1
c+1
z F (c+3,z 2 )
+ c+2
z
F (c+2,z 2 )
V tomto postupu bychom mohli pokračovat libovolně dlouho. Pokud by navíc platilo, že
• výrazy zc ,
c+1 c+2 c+3
, z , z ,...
z
• pro každé k ∈ N patří
jsou přirozená čísla a
z F (c+k+1,z 2 )
c+k F (c+k,z 2 )
do intervalu (0, 1),
, c+2
, c+3
, . . .].
získali bychom řetězový zlomek [0, zc , c+1
z
z
z
Splnění předchozích podmínek nám zaručí volba c =
1
2
a z =
1
2n
pro libovolné n ∈ N:
z definice funkce F (c, x) totiž plyne, že pro kladné x a kladná c1 < c2 platí F (c1 , x) >
F (c2 , x). Nalezli jsme řetězový zlomek čísla
1 F ( 32 , 4n1 2 )
= [0, n, 3n, 5n, 7n, . . .] .
n F ( 12 , 4n1 2 )
(7.14)
Z definice funkce F a využitím (7.11) upravíme
F
¡3
F
¡1
2
,w
,w
2
¢
¢
=
=
+∞
X
3
k=0 2
+∞
X
1
k=0 2
Po nahrazení w =
dostaneme
+∞
X
w2k
(2w)2k
1
=
=
sinh(2w) ,
5
2k+1
(2k
+
1)!
2w
· 2 ··· 2 · 1 · 2 · 3···k
k=0
+∞
X
w2k
(2w)2k
=
= cosh(2w) .
(2k)!
· 32 · · · 2k−1
·
1
·
2
·
3
·
·
·
k
2
k=0
1
2n
v předchozích rovnostech a dosazením do levé strany (7.14)
sinh( n1 )
1 F ( 32 , 4n1 2 )
=
= [0, n, 3n, 5n, 7n, . . .] .
n F ( 12 , 4n1 2 )
cosh( n1 )
Věta 7.16. Pro řetězový zlomek [a0 , a1 , a2 , . . .] Eulerova čísla e platí: a0 = 2 a
a3k−2 = 1,
a3k−1 = 2k,
a3k = 1
103
pro každé k ∈ N .
e+1
e−1
Důkaz. Označme α :=
=
1
1
e 2 +e− 2
1
1
e 2 −e− 2
= cotg
¡1¢
2
. Z věty 7.15 získáme řetězový zlomek
α = [b0 , b1 , b2 , . . .] = [2, 6, 10, 14, . . .], tj. bk = 2 + 4k pro každé k ∈ N0 .
Definujme ξ jako číslo s řetězovým zlomkem [2, 1, 2, 1, 1, 4, 1, 1, 6, 1, 1, 8, . . .]. Pokud ukážeme, že ξ je rovno
Necht’
rn
sn
α+1
α−1
budeme hotovi, protože
je n-tý sblížený zlomek k číslu α a
rn
n→∞ sn
α = lim
pn
qn
α+1
α−1
= e.
je n-tý sblížený zlomek k číslu ξ, tj. platí
pn
.
n→∞ qn
a ξ = lim
(7.15)
Nejdříve ukážeme, že
p3n+1 = rn + sn
a
q3n+1 = rn − sn
pro každé n ∈ N0 .
(7.16)
Pro n = 0:
p1
q1
=2+
1
1
=
3
1
a
r0
s0
=
2
1
=⇒
p1 = 3, q1 = 1, r0 = 2, s0 = 1 ,
pro n = 1:
p4
q4
=2+
1
1+
1
1
2+ 1+1
=
19
7
a
r1
s1
=2+
1
6
=
13
6
=⇒
p4 = 19, q4 = 7, r1 = 13, s1 = 6 .
Tedy (7.16) platí pro n rovno 0 a 1. Z kapitoly o sblížených zlomcích víme, že posloupnost čitatelů (rn ) i posloupnost jmenovatelů (sn ) sblížených zlomků
rn
sn
vyhovují stejnému
rekurentnímu vztahu, v našem případě:
xn = (4n + 2)xn−1 + xn−2 .
(7.17)
Tento rekurentní vztah je lineární, a proto ho splňují i posloupnosti (rn + sn ) a (rn − sn ).
Když ukážeme, že (7.17) platí i pro posloupnosti (p3n+1 ) a (q3n+1 ), bude rovnost (7.16)
dokázána, protože když se dvě posloupnosti, které řeší stejnou lineární diferenční rovnici
druhého řádu, shodují v prvních dvou členech, pak jsou totožné. Potřebujeme tedy ověřit,
že
p3n+1 = (4n + 2)p3n−2 + p3n−5
a q3n+1 = (4n + 2)q3n−2 + q3n−5 .
Víme, že pro posloupnost (pn ) čitatelů platí
pn = an pn−1 + pn−2 ,
104
(7.18)
kde an jsou dány v tvrzení věty. Napišme rekurentní vztahy pro pět po sobě jdoucích
indexů. Vhodným vynásobením rovností a sečtením, jak je naznačeno níže získáme
p3n−3 = p3n−4 + p3n−5
×1
p3n−2 = p3n−3 + p3n−4
×(−1)
p3n−1 = 2n p3n−2 + p3n−3
×2
p3n
×1
= p3n−1 + p3n−2
p3n+1 = p3n + p3n−1
×1
P
p3n+1 = (4n + 2)p3n−2 + p3n−5
Podobně ověříme platnost (7.18) pro posloupnost (q3n+1 ). Ted’ můžeme provést poslední
krok, ve kterém využijeme (7.15) a (7.16)
p3n+1
rn + sn
ξ = lim
= lim
= lim
n→∞ q3n+1
n→∞ rn − sn
n→∞
105
rn
sn
rn
sn
+1
−1
=
α+1
= e.
α−1
8 Okruh celých čísel v číselném
tělese
8.1
Algebraická celá čísla
Definice 8.1. Číslo β ∈ C se nazývá algebraické celé, jestliže existuje monický polynom
f ∈ Z[x] tak, že f (β) = 0. Množinu všech algebraických celých čísel B.
Příklad 8.2. Každé celé číslo a ∈ Z je algebraické celé, protože je kořenem polynomu
x−a ∈ Z[x]. Je tedy Z ⊂ B. Pro rozlišení budeme někdy pro okruh celých čísel Z používat
název racionální celá čísla.
Pokud minimální polynom čísla α ∈ A leží v Z[x], pak α je algebraické celé číslo, tj.
α ∈ B. Platí i opačná implikace.
Věta 8.3. Číslo α ∈ A je algebraické celé, právě když jeho minimální polynom má koeficienty v Z.
Důkaz. Je-li α kořenem celočísleného monického polynomu g, pak minimální polynom f
čísla α dělí g. Z Věty 3.4 polynom f leží nutně v Z[x].
Následující tvrzení dává do vztahu algebraická a algebraická celá čísla.
Tvrzení 8.4. Pro každé α ∈ A existuje nenulové d ∈ Z tak, že dα ∈ B.
Důkaz. Necht’ α je algebraické číslo řádu n a necht’ f ∈ Q[x] je jeho minimální polynom,
n
f (x) = x +
n−1
X
ai xi ,
kde ai =
i=0
Položme d =
Qn−1
i=0
pi
∈ Q.
qi
qi . Rovnici f (α) = 0 vynásobíme číslem dn a dostaneme
n
0 = (dα) +
n−1
X
pi
i=0
Polynom g(x) = xn +
Pn−1
pi n−i i
x
i=0 qi d
qi
dn−i (dα)i .
je monický, má celočíselné koeficienty a číslo dα je
jeho kořenem. Proto dα ∈ B.
106
Je zřejmé, že množina algebraických celých čísel je podmnožinou všech algebraických
čísel. Podobně jako množina A má i množina B zajímavou algebraickou strukturu. Vzhledem k operacím sčítání a násobení v C je to okruh, což přímo vyplývá z Tvrzení 4.12.
Věta 8.5. Množina B je podokruh C. Ekvivalentně, nechť α, β ∈ B, potom α + β, α − β,
αβ leží v B.
Podobnou roli jako v tělese racionálních čísel hraje okruh Z, má množina algebraických celých čísel obsažená v algebraickém číselném tělese. Vzhledem k Větě 8.5 je to
samozřejmě okruh.
Definice 8.6. Necht’ α ∈ A. Pro těleso Q(α) = K nazveme okruhem celých čísel OK
množinu algebraických celých čísel v K, tj. OK := Q(α) ∩ B.
Následující věta charakterizuje prvky OK pomocí celočíselnosti koefcientů jejich tělesového polynomu v tělese K.
Věta 8.7. Necht’ α ∈ A, β ∈ Q(α). Pak β ∈ OK , právě když všechny koeficienty
tělesového polynomu čísla β jsou celočíselné.
Důkaz. Je-li tělesový polynom čísla β ∈ Q(α) prvek Z[x], pak z definice algebraických
celých čísel přímo plyne β ∈ OK . Naopak, je-li β ∈ OK , pak jeho minimální polynom má
podle Věty 8.3 celočíselné koeficienty. Ovšem, jak plyne z Tvrzení 4.33, tělesový polynom
čísla β je mocninou minimálního polynomu čísla β, takže musí rovněž patřit do Z[x].
Příklad 8.8. V případě kvadratických těles lze tvrzení Věty 8.7 přepsat následujícím
√
způsobem. Je-li K = Q( m), kde m ∈ Z neobsahuje čtverec, pak
√
√
√
√
OK = Q( m) ∩ B = {a + b m | a, b ∈ Q, N (a + b m) ∈ Z, T (a + b m) ∈ Z} .
Chceme-li explicitně popsat prvky okruhu OK , musíme tedy charakterizovat prvky tělesa
√
√
Q( m), které mají celočíselnou normu a stopu. Uvažujme a+b m, a, b ∈ Q. Požadujeme
√
N (a + b m) = a2 − mb2 ∈ Z
and
√
T (a + b m) = 2a ∈ Z .
Ze druhé podmínky máme rovnou a ∈ 12 Z. Z první podmínky máme po vynásobení 4,
√
√
√
4mb2 = 4a2 − 4N (a + b m) = T 2 (a + b m) − 4N (a + b m) ∈ Z .
107
Protože m neobsahuje čtverec, plyne z 4mb2 = m(2b)2 ∈ Z, že 2b ∈ Z. Jinak by totiž
2b =
2
p
q
pro nějaké p, q ∈ Z, q ≥ 2, p ⊥ q. Pak ale m(2b)2 = m pq2 ∈ Z implikuje q 2 |m, což
je spor.
Dokázali jsme tedy zatím, že
OK ⊂
¯
ª
√
¯ c, d ∈ Z .
(c
+
d
m)
2
©1
Pro opačnou inkluzi je třeba zjistit, pro které páry celých čísel c, d ∈ Z je N
¡
√ ¢
Z. (Protože T 21 (c + d m) = c ∈ Z vždy.) Máme
N
¡1
√ ¢ 1 2
(c
+
d
m) = (c − md2 ) ∈ Z
2
4
⇐⇒
¡1
√ ¢
(c+d
m) ∈
2
c2 − md2 ≡ 0 mod 4
Pokud jsou čísla c, d obě sudá, kongruence je splněna. Jestliže c nebo d je liché, je třeba
si uvědomit, že (2k + 1)2 = 4k 2 + 4k + 1 ≡ 0 mod 4. Snadno odvodíme, že kongruenci pak
lze splnit pouze pro m ≡ 1 mod 4, budou-li c i d lichá čísla.
Pro m 6≡ 1 mod 4 jsme tedy dokázali
OK =
©1
2
¯
ª ©
ª
√
√ ¯
(c + d m) ¯ c, d ∈ 2Z = a + b m ¯ a, b ∈ Z .
Pro m ≡ 1 mod 4 máme
OK =
√
¯
¯
ª ©
ª
√
¯ c, d ∈ Z , c ≡ d mod 2 = a + b 1+ m ¯ a, b ∈ Z .
(c
+
d
m)
2
2
©1
√
Pro kvadratické těleso Q( m) jsme v Příkladu 8.8 tedy našli čísla β1 , β2 taková, že
OK = {a1 β1 + a2 β2 | a1 , a2 ∈ Z}. Souboru takových čísel budeme říkat integrální báze
okruhu celých čísel.
√
Tvrzení 8.9. Necht’ K = Q( m), kde m ∈ Z neobsahuje čtverec. Integrální báze okruhu
OK je
√
1, m
√
1, 1+2 m
8.2
pro m 6≡ 1 mod 4 ,
pro m ≡ 1 mod 4 .
Integrální báze okruhu celých čísel
Nejjednodušším případem okruhu celých čísel číselného tělesa je Z = OQ . Obecněji, okruh
celých čísel číselného tělesa K řádu n je isomorfní Zn , jinými slovy je to volná abelovská
grupa ranku n. To znamená, že existuje soubor β1 , . . . , βn prvků z OK takový, že každý
prvek okruhu OK lze jednoznačně vyjádřit ve tvaru a1 β1 + · · · + an βn , ai ∈ Z. Tomuto
souboru se říká integrální báze. Abychom dokázali existenci integrální báze, budeme studovat pojem diskriminantu souboru čísel.
108
Definice 8.10. Necht’ K je číselné těleso řádu n. Pro soubor čísel β1 , . . . , βn ∈ K definujeme matici M (β1 , . . . , βn ) ∈ Qn×n ,
¡
¢
M (β1 , . . . , βn ) jk = T (βj βk ) .
Diskriminantem čísel β1 , . . . , βn rozumíme determinant matice M (β1 , . . . , βn ), značíme
∆(β1 , . . . , βn ) = det M (β1 , . . . , βn ) .
Poznámka 8.11. Protože stopa prvků tělesa K je racionální, tj. T (βj βk ) ∈ Q, je diskriminant každého souboru n čísel β1 , . . . , βn racionální číslo.
Diskriminant daného souboru čísel lze výpočítat přímo z definice. Následující věta
umožňuje výpočet diskriminantu výhodnějším způsobem.
Věta 8.12. Necht’ K je číselné těleso řádu n a necht’ β1 , . . . , βn ∈ K. Potom
¡
¢2
∆(β1 , . . . , βn ) = det N (β1 , . . . , βn ) ,
kde matice N (β1 , . . . , βn ) je definována
¡
¢
N (β1 , . . . , βn ) jk = σk (βj ) .
Důkaz. Označme pro jednoduchost M = M (β1 , . . . , βn ), N = N (β1 , . . . , βn ). Máme
(N N T )jk =
n
X
σi (βj )σi (βk ) =
i=1
n
X
σi (βj βk ) = T (βj βk ) .
i=1
Proto M = N N T a odtud det M = det N · det N T = (det N )2 .
Příklad 8.13. Necht’ α je algebraické číslo řádu n. Určíme ∆(1, α, α2 , . . . , αn−1 ) v tělese
K = Q(α). Označíme-li α1 = α, . . . , αn kořeny sdružené k α, máme
¯2
¯
¯
¯ 1
1
·
·
·
1
¯
¯
¯ α
α2 · · · αn ¯¯
¯
Y
2
¯
α22 · · · αn2 ¯¯ =
(αk − αj )2 6= 0 .
∆(1, α, α2 , . . . , αn−1 ) = ¯ α
¯
¯ ..
..
.
.
..
.. ¯
1≤j<k≤n
¯ .
.
¯
¯ n−1
n−1
¯ α
α2
· · · αnn−1 ¯
Diskriminant souboru 1, α, α2 , . . . , αn−1 je tedy Vandermondův determinant proměnných
α1 , . . . , αn . Ten je nenulový, protože sdružené kořeny čísla α jsou navzájem různé.
Lemma 8.14. Necht’ K je číselné těleso řádu n a necht’ β1 , . . . , βn ∈ K. Máme-li matici
P
B = (bjk ) ∈ Qn×n a čísla γ1 , . . . , γn definovaná předpisem γj = nk=1 bjk βk , pak
∆(γ1 , . . . , γn ) = (det B)2 ∆(β1 , . . . , βn ) .
109
Důkaz. Označme Nβ = N (β1 , . . . , βn ) a Nγ = N (γ1 , . . . , γn ). Protože γj =
Pn
k=1 bjk βk
a
zobrazení σi je izomorfismus, máme
à n
!
n
X
X
bjk βk =
bjk σi (βk ) .
σi (γj ) = σi
k=1
k=1
Proto Nγ = BNβ a z Věty 8.12 plyne tvrzení.
Věta 8.15. Necht’ K je číselné těleso řádu n. Pak soubor β1 , . . . , βn ∈ K tvoří bázi K
jako vektorového prostoru nad Q, právě když ∆(β1 , . . . , βn ) 6= 0.
Důkaz. Necht’ K = Q(α) pro nějaké α ∈ A řádu n. Pak 1, α, α2 , . . . , αn−1 tvoří bázi K jako
vektorového prostoru nad Q. Proto čísla β1 , . . . , βn lze vyjádřit jako lineární kombinaci
čísel 1, α, α2 , . . . , αn−1 s racionálními koeficienty, tedy
βj =
n
X
bji αi−1 ,
kde bji ∈ Q .
(8.1)
i=1
Označíme-li matici B = (bji ), pak z Lemmatu 8.14 máme
∆(β1 , . . . , βn ) = (det B)2 ∆(1, α, α2 , . . . , αn−1 ) .
Proto ∆(β1 , . . . , βn ) 6= 0 právě když det B 6= 0. To je ale přesně podmínka invertovatelnosti vztahu (8.1) a tedy podmínka pro to, aby soubor β1 , . . . , βn tvořil bázi prostoru K
nad tělesem Q.
Definice 8.16. Necht’ K je číselné těleso řádu n a necht’ OK je jeho okruh celých čísel.
Pak soubor β1 , . . . , βn ∈ OK tvoří integrální bázi okruhu OK , jestliže má každý prvek
P
γ ∈ OK jednoznačné vyjádření ve tvaru γ = nj=1 bj βj , pro nějaká bj ∈ Z.
Protože stopa algebraického celého čísla je v Z, je zřejmé, že diskriminant souboru
β1 , . . . , βn ∈ OK bude také celočíselný.
Věta 8.17. Necht’ K je číselné těleso řádu n. Pak existuje soubor β1 , . . . , βn ∈ OK , který
tvoří integrální bázi okruhu OK .
Důkaz. Nejprve ukážeme, že soubor β1 , . . . , βn ∈ OK s nejmenší nenulovou absolutní
hodnotou diskriminantu tvoří integrální bázi okruhu OK .
Necht’ β ∈ OK . Protože β1 , . . . , βn má nenulový diskriminant, je to báze tělesa K jako
P
prostoru nad Q. Proto existují koeficienty bi ∈ Q tak, že β = ni=1 bi βi . Stačí ukázat, že
bi ∈ Z. Sporem předpokládejme, že bj ∈ Q \ Z pro nějaké j ∈ {1, 2, . . . , n}, tedy bj = b + θ,
110
kde b ∈ Z a θ ∈ (0, 1). Položme γj = β − bβj =
Pj−1
i=1
bi βi + θβj +
Pn
i=j+1 bi βi
pro ostatní i ∈ {1, 2, . . . , n}. Máme

 

γ1
1
β1
 γ2  
  β2
1
 .  
 .
...
 .  
 .
 .  
 .

 

γ
1
 j−1  
  βj−1

=

 γj   b1 b2 · · · bj−1 θ bj+1 · · · bn   βj

 

1
 γj+1  
  βj+1
 .  
 .
..
 ..  
  ..
.
γn
1
βn
a γi = β i













Protože determinant matice přechodu je θ, platí s využitím Lemmatu 8.14
∆(γ1 , . . . , γn ) = θ2 ∆(β1 , . . . , βn ) .
Ovšem γi = βi ∈ OK pro i ∈ {1, 2, . . . , n}, i 6= j, ale i γj = β − bβj ∈ OK . Našli jsme tedy
v okruhu OK soubor čísel s menší absolutní hodnotou diskriminantu,
0 < |∆(γ1 , . . . , γn )| < |∆(β1 , . . . , βn )| ,
což je spor s volbou souboru β1 , . . . , βn .
Nyní stačí ukázat, že v okruhu OK existuje soubor čísel γ1 , . . . , γn , který má nenulový
diskriminant. Z Příkladu 8.13 víme, že v tělese K = Q(α) existuje soubor s nenulovým
diskriminantem, a to např. 1, α, α2 , . . . , αn−1 . Vezměme d ∈ Z z Tvrzení 8.4 takové, že
dα je algebraické celé číslo, a tedy dα ∈ OK . Položme γi = di−1 αi−1 pro i = 1, 2, . . . , n.
Pak soubor γ1 , . . . , γn zjevně patří do OK . Navíc z Lemmatu 8.14 platí ∆(γ1 , . . . , γn ) =
dn(n−1) ∆(1, α, . . . , αn−1 ) 6= 0.
Integrální báze okruhu celých čísel tělesa není dána jednoznačně. Platí ale následující
věta, která říká, že diskriminant všech integrálních bází je stejný.
Věta 8.18. Necht’ K je číselné těleso řádu n a necht’ β1 , . . . , βn je integrální báze jeho
okruhu celých čísel OK . Necht’ γ1 , . . . , γn ∈ OK . Pak γ1 , . . . , γn je integrální báze OK ,
právě když
∆(β1 , . . . , βn ) = ∆(γ1 , . . . , γn ) .
Důkaz. Označme opět vektory β T = (β1 , . . . , βn ) a γ T = (γ1 , . . . , γn ). Protože β1 , . . . , βn
je integrální báze okruhu OK , existuje celočíselná matice B = (bij ) tak, že γ = Bβ. Podle
Lemmatu 8.14 pak platí
∆(γ1 , . . . , γn ) = (det B)2 ∆(β1 , . . . , βn ) .
111
Ovšem det B = ±1, právě když matice B má inverzní matici C = B −1 ∈ Zn×n . Platí
β = Cγ a tedy soubor γ1 , . . . , γn tvoří integrální bázi okruhu OK .
Definice 8.19. Necht’ K je číselné těleso řádu n a necht’ OK je jeho okruh celých čísel.
Nenulové celé číslo ∆K = ∆(β1 , . . . , βn ), kde β1 , . . . , βn je nějaká integrální báze okruhu
OK , nazýváme diskriminant tělesa K.
√
Příklad 8.20. Vypočítejme diskriminant kvadratického tělsa K = Q( m). Musíme tedy
√
určit diskriminant integrální báze okruhu OK , tedy soboru β1 = 1, β2 = m, je-li m 6≡
√
1 mod 4, respektive β1 = 1, β2 = 12 (1 + m), pro m ≡ 1 mod 4.
Necht’ nejdříve m 6≡ 1 mod 4. Máme matici
Ã
! µ
√
¶
T (1) T ( m)
√
2 0
M (1, m) =
=
.
√
0 2m
T ( m) T (m)
Determinant této matice je hledaný diskriminant tělesa,
√
√
∆K = ∆(1, m) = det M (1, m) = 4m .
Necht’ nyní m ≡ 1 mod 4. Pak
¯
¡ √ ¢
¯
T 1+2 m
√
¡ 1+ m ¢ ¯ T (1)
∆K = det M 1, 2
= ¯¯ ¡ √ ¢
√ ¢
¡
¯ T 1+ m T 1+m+2 m
2
4
¯
¯ ¯
¯ ¯ 2
¯=¯
¯ ¯ 1
¯
1
1+m
2
¯
¯
¯ = m.
¯
√
Diskriminant tělesa K = Q( m) jsme v tomto případě počítali z definice. Šlo by
samozřejmě použít Věty 8.12 nebo Příkladu 8.13.
8.3
Hledání integrální báze
Lemma 8.14 implikuje, že jsou-li soubory β1 , . . . , βn a γ1 , . . . , γn dvě báze tělesa K jako
vektorového prostoru nad Q, a B matice přechodu těchto bází, pak se jejich diskriminanty
liší faktorem (det B)2 =
p2
q2
∈ Q. Je-li navíc soubor β1 , . . . , βn integrální bází okruhu OK
a γ1 , . . . , γn jsou prvky OK , pak diskriminanty obou souborů jsou celá čísla a platí
∆(γ1 , . . . , γn ) = k 2 ∆(β1 , . . . , βn ) ,
kde k = det B ∈ Z. Jako jednoduchý důsledek máme následující tvrzení.
Tvrzení 8.21. Necht’ β1 , . . . , βn je soubor čísel z okruhu OK takový, že jeho diskriminant
∆(β1 , . . . , βn ) ∈ Z neobsahuje čtverec. Pak β1 , . . . , βn tvoří integrální bázi okruhu OK .
112
Poznamenejme, že opačná implikace neplatí, jak je vidět z příkladu 8.20, protože
√
∆K = 4m, pro K = Q( m) a m 6≡ 1 mod 4.
Pro zjednodušení výpočtu diskriminantu souboru 1, α, α2 , . . . , αn−1 , kde α je generátor
číselného tělesa řádu n, poslouží následující tvrzení.
Tvrzení 8.22. Necht’ α je algebraické číslo řádu n s minimálním polynomem f . Pro
diskriminant souboru 1, α, α2 , . . . , αn−1 platí
∆(1, α, α2 , . . . , αn−1 ) = (−1)
n(n−1)
2
Důkaz. Zderivováním minimálního polynomu f (x) =
0
f (x) =
n
n
X
Y
¡
¢
N f 0 (α) .
Qn
j=1 (x
− αj ) čísla α máme
(x − αj )
k=1 j=1,j6=k
a po dosazení kořene αi dostaneme f 0 (αi ) =
Qn
j=1,j6=i (αi
− αj ). Můžeme proto pokračovat
ve výpočtu z příkladu 8.13,
∆(1, α, α2 , . . . , αn−1 ) =
Y
(αi − αj )2 = (−1)
1≤i<j≤n
= (−1)
n(n−1)
2
Y
n(n−1)
2
(αi − αj ) =
1≤i,j≤n, i6=j
n
Y
f 0 (αi ) = (−1)
n(n−1)
2
¡
¢
N f 0 (α) .
i=1
Příklad 8.23. Necht’ α je algebraické číslo s minimálním polynomem x3 +x+1. Ověříme,
že soubor 1, α, α2 tvoří integrální bázi okruhu celých čísel v tělese K = Q(α). Z příkladu 8.13 a Tvrzení 8.22 víme, že
Y
∆(1, α, α2 ) =
(αk − αj )2 = −N (3α2 + 1) = (3α12 + 1)(3α22 + 1)(3α32 + 1) =
1≤j<k≤3
= −27α12 α22 α32 − 9(α12 α22 + α12 α32 + α22 α32 ) − 3(α12 + α22 + α32 ) − 1 .
Diskriminant souboru 1, α, α2 je tedy symetrický polynom v proměnných α1 , α2 , α3 , což
jsou kořeny sdružené k α. Podle hlavní věty o symetrických polynomech (Věta 3.22) lze
tento polynom vyjádřit jako polynom v elementárních symetrických funkcích e1 , e2 , e3 v
proměnných α1 , α2 , α3 . To by ovšem bylo poměrně zdlouhavé. Můžeme si ale všimnout,
že diskriminant už je zapsaný ve formě kombinace elementárních symetrických funkcí
ẽ1 , ẽ2 , ẽ3 v proměnných α12 , α22 , α32 , a to konkrétně jako
∆(1, α, α2 ) = −27ẽ23 − 9(ẽ22 − 2ẽ1 ẽ3 ) − 3(ẽ21 − 2ẽ2 ) − 1 .
113
(8.2)
Hodnoty funkcí ẽ1 , ẽ2 , ẽ3 ovšem nelze přímo vyčíst z minimálního polynomu čísla α. Potřebujeme polynom, který by měl za kořeny čísla α12 , α22 , α32 . Ten ovšem snadno nalezneme.
Q
Máme-li totiž polynom f (x) = (x−αi ) s kořeny αi , vynásobením polynomem g(x) =
Q
Q
(x + αi ) s kořeny −αi dostaneme polynom f g(x) = (x − αi2 ) s kořeny αi2 . Přitom je
z Viètových vztahů jasné, že polynom g má oproti f jen střídavě zaměněná znaménka u
koeficientů. Je tedy
f (x)g(x) = (x3 + x + 1)(x3 + x − 1) = x3 + 2x2 + x − 1 .
Odtud zjistíme
ẽ1 = α12 + α22 + α32 = −2 ,
ẽ2 = α12 α22 + α12 α32 + α22 α32 = 1 ,
ẽ3 = α12 α22 α32 = 1 ,
a po dosazení do (8.2) ∆(1, α, α2 ) = −31. To je celé číslo neobsahující čtverec. Podle
Tvrzení 8.21 je tedy soubor 1, α, α2 integrální bází okruhu OK . Lze tedy psát
OK = {a + bα + cα2 | a, b, c ∈ Z} .
Naneštěstí ne každé číselné těleso má diskriminant bez čtverce (jako příklad jsme viděli
√
těleso Q( m), kde m 6≡ 1 mod 4). Lze ale dokázat, že diskriminant číselného tělesa K
splňuje ∆K ≡ 0 nebo 1 mod 4. Ani to nám ovšem neumožní vždy rozhodnout o tom, zda
nalezený soubor už je integrální bází uvažovaného tělesa. Existuje dokonce těleso, jehož
okruh celých čísel nemá žádnou integrální bázi ve tvaru 1, β, β 2 . Příkladem takového tělesa
je K = Q(α), kde α je kořenem polynomu f (x) = x3 + x2 − 2x + 8. Diskriminant souboru
1, α, α2 je roven ∆(1, α, α2 ) = 2012 = 4 · 503. Tento soubor ovšem není integrální bází
tělesa K, protože lze ukázat, že ∆K = 503.
Čtenář se může divit, proč jsme jako příklad neuvedli žádné těleso, jehož diskriminant
by byl roven ±1. Důvodem je to, že všechna tělesa generovaná algebraickým celým číslem
mají diskriminant ≥ 3. Neexistuje totiž žádný monický polynom f ∈ Z[x] stupně n > 1 s
kořenem α takovým, že ∆(1, α, . . . , αn−1 ) = ±1.
8.4
Integrální báze v cyklotomických tělesech
Kromě kvadratických těles, v nichž je okruh celých čísel dobře popsán, je známa integrální
báze také u další třídy algebraických číselných těles, se kterou jsme se seznámili, a to u těles
cyklotomických, generovaných n-tým kořenem z jedničky. Protože ζ = e
114
2πi
n
je kořenem
n-tého cyklotomického polynomu Φn ∈ Z[x], který je monický, je samo ζ algebraické
celé číslo. Popíšeme integrální bázi okruhu celých čísel tělesa Q(ζ) a vypočítáme jeho
diskriminant. Postup ovšem provedeme pouze v nejjednodušším případě, kdy n = p je
prvočíslo. Pak
Φp (x) = x
p−1
+x
p−2
+ ··· + x + 1 =
p−1
Y
(x − ζ j ) ,
j=1
číslo ζ = e
2πi
p
je řádu p − 1 a sdružené kořeny jsou ζ j , 1 ≤ j ≤ p − 1. Polynom Φp je
zároveň tělesovým polynomem čísla ζ v tělese Q(ζ), a proto můžeme rovnou vyčíst normu
a stopu čísla ζ v tomto tělese. Kromě toho využijeme i znalost normy a stopy čísla 1 − ζ.
Lemma 8.24. Necht’ p je liché prvočíslo, ζ = e
2πi
p
. Potom v tělese Q(ζ) platí T (ζ) = −1,
N (ζ) = 1, T (1 − ζ) = p, N (1 − ζ) = p.
Důkaz. Norma a stopa čísla ζ jsou dány koeficieny polynomu Φp (x) = xp−1 + xp−2 + · · · +
x + 1. Dále máme
T (1 − ζ) = T (1) − T (ζ) = p ,
N (1 − ζ) =
p−1
Y
(1 − ζ j ) = Φp (1) = p .
j=1
Věta 8.25. Necht’ p je liché prvočíslo, ζ = e
2πi
p
. Potom pro okruh celých čísel tělesa
K = Q(ζ) platí
OK = {a1 + a2 ζ + · · · + ap−2 ζ p−2 | a1 , . . . , ap−1 ∈ Z} =: Z[1, ζ, . . . , ζ p−2 ] ,
a tedy soubor 1, ζ, ζ 2 ,. . . ,ζ p−2 tvoří integrální bázi okruhu OK .
Důkaz. Je zřejmé, že množina {a0 + a1 ζ + · · · + ap−2 ζ p−2 | aj ∈ Z} je podmnožinou
okruhu celých čísel OK . Abychom ukázali opačnou inkluzi, vezměme β ∈ OK . Protože
soubor 1, ζ, ζ 2 ,. . . ,ζ p−2 tvoří bázi tělesa K, jako prostoru nad Q, musí existovat racionální
P
j
koeficienty b0 , . . . , bp−2 tak, že β = p−2
j=0 bj ζ . Musíme ukázat, že bj ∈ Z.
Protože ζ −k = ζ p−k , je číslo βζ −k − βζ ∈ OK . Stopa tohoto čísla je tedy celočíselná,
T (βζ
−k
− βζ) = T
p−2
³X
bj ζ
j−k
−
p−2
X
j=0
= T (bk ) +
´
bj ζ j+1 =
j=0
p−2
X
bj T (ζ
j−k
)−
p−2
X
j=0
j=0,j6=k
p−2
= (p − 1)bk +
X
j=0,j6=k
115
bj T (ζ j+1 ) =
bj (−1) −
p−2
X
j=0
bj (−1) = pbk ,
kde jsme využili vlastností stopy a Lemmatu 8.24. Odvodili jsme tedy, že pbk ∈ Z pro
každé k ∈ {0, 1, . . . , p − 2}. Chceme ale ukázat, že i bk ∈ Z. Označme λ = 1 − ζ. Pak
pβ = p
p−2
X
k
bk ζ =
k=0
p−2
X
k
pbk (1 − λ) =
p−2
X
cj λj ,
(8.3)
j=0
k=0
kde z binomické věty a záměnou sum získáme
cj = (−1)
p−2 µ ¶
X
k
j
k=j
j
pbk ,
pro j ∈ {0, 1, . . . , p − 2} .
Protože λ = 1 − ζ, analogickým argumentem odvodíme, že platí
j
pbj = (−1)
p−2 µ ¶
X
k
k=j
j
ck ,
pro j ∈ {0, 1, . . . , p − 2} .
(8.4)
Výše jsme odvodili, že pbk ∈ Z, a proto jsou koeficienty cj celá čísla. Díky vztahu (8.4)
tedy stačí ukázat, že všechny koeficienty c0 , . . . , cp−2 jsou dělitelné p. To provedeme matematickou indukcí. Pro c0 máme
c0 =
p−2
X
¡
¢
¡
¢
pbk = p pb0 − (p − 1)b0 + b1 + · · · + bp−2 = p pb0 − T (β) ,
k=0
a protože pb0 i T (β) ∈ Z, vidíme, že p dělí c0 . Předpokládejme, že p|cj pro j ≤ k − 1. Ze
vztahu (8.3) plyne
k
ck λ = pβ −
k−1
X
p−2
X
j
cj λ −
j=0
cj λj .
(8.5)
j=k+1
Všimněme si, že
p = Φp (1) =
p−1
Y
j=1
j
p−1
(1 − ζ ) = (1 − ζ)
p−1
Y
(1 + ζ + · · · + ζ j−1 ) = λp−1 κ ∈ λp−1 OK
j=1
Protože však p = λp−1 κ dělí c0 , . . . , ck−1 , máme z (8.5) ck λk = λk+1 κ0 , pro nějaké κ0 ∈ OK .
Proto ck = λκ0 a znormováním tohoto vztahu dostaneme
cp−1
= N (ck ) = N (λ)N (κ0 ) = pN (κ0 ) .
k
Protože κ0 ∈ OK , je N (κ0 ) ∈ Z, z čehož plyne p|cp−1
k . Protože p je prvočíslo, máme p|ck a
důkaz je hotov.
Důsledek 8.26. Necht’ p je liché prvočíslo, ζ = e
∆K = (−1)
p−1
2
pp−2 .
116
2πi
p
. Diskriminant tělesa K = Q(ζ) je
Důkaz. Diskriminant tělesa je z definice diskriminant nějaké jeho integrální báze. Díky
Tvrzení 8.22 je tedy
2
∆K = ∆(1, ζ, ζ , . . . , ζ
p−2
) = (−1)
(p−1)(p−2)
2
p−1
Y
¡
¢
N Φ0p (ζ) .
i=1
Protože
µ
Φ0p (x)
=
xp − 1
x−1
¶0
=
pxp−1 (x − 1) − (xp − 1)
,
(x − 1)2
máme Φ0p (ζ) = pζ p−1 /(ζ − 1), kde jsme použili ζ p = 1. Znormováním dostaneme pomocí
Lemmatu 8.24
¢ N (p)N p−1 (ζ)
¡
N Φ0p (ζ) =
= pp−2 .
N (ζ − 1)
Protože p je liché, platí (−1)
(p−1)(p−2)
2
= (−1)
p−1
2
a důkaz je hotov.
Studovali jsme okruh celých čísel v cyklotomickém tělese Q(ζ), kde ζ = e2πi/p pro p
liché prvočíslo. Obdobná tvrzení platí pro cyklotomické těleso generované m-tým kořenem
z jedničky pro libovolné m ∈ Z, m > 2. Vyslovíme následující větu bez důkazu.
Věta 8.27. Necht’ m ∈ Z, m > 2, a necht’ ζ = e2πi/m . Potom soubor 1, ζ, ζ 2 , . . . , ζ ϕ(m)−1
je integrální bází okruhu celých čísel OK v tělese K = Q(ζ) a diskriminant tohoto tělesa
je roven
∆K = (−1)
ω(m)ϕ(m)
2
Q
mϕ(m)
,
ϕ(m)/(q−1)
q|m q
kde ω(m) je počet různých prvočíselných faktorů čísla m.
117
9 Dělitelnost a faktorizace
v okruhu celých čísel
V této kapitole se budeme zabývat zobecňováním pojmů dělitelnosti, faktorizace, prvočísel
z oboru Z na obory celých čísel v číselných tělesech. Množství algebraických pojmů a
tvrzení jsme připomněli již v Kapitole 2.2. Některá tvrzení se ovšem v případě číselných
oborů dají vylepšit, a použitím normy. Budeme se také podrobněji zabývat dělitelností v
okruzích celých čísel kvadratických těles, které jsme popsali v Tvrzení 8.9. Jednoznačnou
faktorizaci v kvadratických tělesech
9.1
Jednotky
Pokud máme studovat dělitelnost v okruzích celých čísel číselných těles, musíme nejdřív
vyjasnit pojem jednotka. K popisu grupy jednotek U (OK ) nám velmi pomůže norma v
tělese K.
Věta 9.1. Necht’ K je číselné těleso. Prvek β ∈ OK je jednotka, právě když N (β) = ±1.
Důkaz. Nechť β ∈ U (OK ). To znamená, že β i 1/β patří do OK , a proto N (β), N (1/β) ∈
Z. Pak ale máme N (β)N (1/β) = N (1) = 1, tudíž nutně N (β) = N (1/β) = ±1 .
Naopak předpokládejme, že β ∈ OK splňuje N (β) = ±1. Potom
±1 = N (β) =
n
Y
σj (β) = β
j=1
n
Y
σj (β) ,
(9.1)
j=2
kde n je řád tělesa K a σj jsou jeho Q-isomorfismy. Z rovnosti (9.1) je vidět, že 1/β =
Q
± nj=2 σj (β) ∈ K. Zároveň ale 1/β je algebraické celé číslo, protože β ∈ B a čísla σj (β)
mají stejný minimální polynom (viz Tvrzení 4.32). Proto 1/β ∈ K ∩ B = OK a tedy
β ∈ U (OK ).
Jako nejjednodušší příklad můžeme uvést těleso K = Q, s okruhem celých čísel OK =
Z. To je obor integrity, ve kterém množinu jednotek tvoří U (OK ) = {±1}. To odpovídá
118
faktu, že norma na tělese Q splývá s absolutní hodnotou a |m| = 1 pro m ∈ Z, právě když
m = ±1. Existují ale i tělesa K, jejichž okruhy OK mají nekonečnou grupu jednotek.
√
√
Příklad 9.2. V tělese K = Q( 2) tvoří okruh celých čísel prvky tvaru β = a+b 2, a, b ∈
√
Z. Snadno ověříme, že kromě ±1 splňuje podmínku N (β) = −1 také číslo β = 1 + 2.
Protože β > 1 a množina jednotek je uzavřená na násobení, platí {β n | n ∈ N} ⊂ U (OK ), a
jednotek je tedy nekonečné mnoho. Později uvidíme, že dokonce U (OK ) = {±β n | n ∈ Z}.
√
To, že všechny jednotky v okruhu tělesa Q( 2) lze zapsat až na znaménko jako mocninu jednoho generátoru, není náhoda, jak plyne z následující obecné věty, jejíž důkaz však
daleko přesahuje možnosti tohoto textu.
Věta 9.3 (Dirichletova věta o jednotkách). Nechť K je algebraické číselné těleso a nechť
α je jeho primitivní prvek, tj. K = Q(α). Nechť minimální polynom čísla α má r1 reálných
a 2r2 komplexních kořenů. Pak grupa jednotek v okruhu OK je tvaru
¯
©
ª
U (OK ) = ξ j η1j1 · · · ηrjr ¯ j ∈ Z j1 , . . . , jr ∈ Z ,
kde r = r1 + r2 − 1, čísla η1 , . . . , ηr > 0 jsou tzv. fundamentální jednotky a ξ je k-tý kořen
z jedničky pro maximální k takové, že e
2πi
k
∈ K.
Je zřejmé, že pro imaginární kvadratická tělesa r1 = 0, r2 = 1 a proto r = r1 + r2 − 1 =
0, tudíž nemají žádnou fundamentální jednotku. Pro reálná kvadratická tělesa je r1 = 2,
r2 = 0, tj. r = r1 +r2 −1 = 1. Explicitně popíšeme grupu jednotek v okruzích kvadratických
těles v sekci 9.2.
9.2
Jednotky v kvadratických tělesech
Jednotky v imaginárních kvadratických tělesech lze popsat snadno.
Věta 9.4. Nechť m ∈ Z, m < 0, neobsahuje čtverec.

{±1, ±i}


 ©
4πi ª
2πi
U (OK ) =
±1, ±e 3 , ±e 3


 {±1}
√
Je-li K = Q( m), pak
pro m = −1 ,
pro m = −3 ,
jinak .
Důkaz. Tvar množiny jednotek snadno odvodíme pomocí Věty 9.1. Rozlišíme případy
m 6≡ 1 mod 4 a m ≡ 1 mod 4. Pro m 6≡ 1 mod 4 je obecný prvek okruhu OK tvaru
√
√
a + b m. Rovnost N (a + b m) = a2 + |m|b2 = ±1 má jediná řešení (a, b) = (±1, 0)
119
kromě m = −1, kdy lze navíc volit (a, b) = (0, ±1). Je zřejmé že tato řešení odpovídají
√
jednotkám ±1 a pro m = −1 navíc ± −1 = ±i.
√
Jestliže m ≡ 1 mod 4, je obecný prvek okruhu OK tvaru 12 (c + d m), kde c, d jsou
celá čísla se stejnou paritou. Řešíme tedy rovnost
√
¡ c + d m ¢ c2 + |m|d2
N
=
= ±1
⇐⇒
2
4
c2 + |m|d2 = ±4 .
Jediná možná řešení jsou nyní (c, d) = (±2, 0), kromě případu m = −3 ≡ 1 mod 4, kdy
lze navíc (c, d) = (±1, ±1). Ťemto řešením odpovídají opět jednotky ±1 a pro m = −3
navíc
±
1+
√
−3
2
= ±e
2πi
3
√
4πi
−1 + −3
±
= ±e 3 ,
2
a
což jsme měli dokázat.
Popsat grupu jednotek v reálných kvadratických tělesech je mnohem obtížnější. Existence alespoň jedné jednotky ξ > 1 vyplývá z existence řešení základní Pellovy rovnice.
Věta 9.5. Nechť K je reálné kvadratické těleso. Pak existuje η ∈ OK , η > 1, takové, že
U (OK ) = {±η j | j ∈ Z} .
Důkaz. Existuje alespoň jedna jednotka ξ > 1 z Pellovy rovnice nebo Minkowskeho teoremu. Ukažme, že existuje pouze konečně mnoho jednotek ε ∈ OK takových, že 1 < ε ≤ ξ.
√
Ať už je m jakékoliv, je obecná jednotka ε v OK tvaru 21 (c + d m) pro nějaké c, d ∈ Z.
Máme pak
√
1
ε = (c + d m) ∈ OK
2
√
1
1/ε = ± (c − d m) ∈ OK .
2
a
Odtud plyne c = ε+1/ε, a protože 1 < ε ≤ ξ, platí 1/ε ∈ (0, 1) a odtud dále 0 < c < ξ +1.
Proto je pouze konečný počet možností volby celého čísla c. To ale určuje d jednoznačně
až na znaménka. Celkově je tedy konečně mnoho možností pro ε.
Nechť nyní η je nejmenší jednotka splňující 1 < η ≤ ξ. Protože takových jednotek je
konečný počet, η existuje. Chceme ukázat, že všechny ostatní jednotky jsou už tvaru ±η j
pro j ∈ Z. Nechť δ je libovolná jednotka. Protože −δ je také jednotka, lze bez újmy na
obecnosti předpokládat, že δ > 0. Platí
(0, +∞) =
[
[η j , η j+1 ) ,
j∈Z
a proto jistě existuje j ∈ Z takové, že
η j ≤ δ < η j+1 .
120
Odtud 1 ≤ δη −j < η. Přitom ale číslo δη −j je jednotka. To vyplývá z faktu, že množina
jednotek je multiplikativní grupa. Protože ale η je minimální jednotka větší než jedna,
musí platit δη −j = 1. Proto jsou všechny jednotky tvaru ±η j .
Definice 9.6. Číslo η z Věty 9.5 se nazývá fundamentální jednotka.
√
Poznámka 9.7. Pokud hledáme jednotky v tělese Q( m), pro m ≡ 1 mod 4, nemusí
odpovídat fundamentální jednotka řešení základní Pellovy rovnice, protože η je obecně
√
√
tvaru η = a+b2 m . Ale i kdyby a, b bylo liché, je η 3 už element Z[1, m], tj. odpovídá
celočíselnému řešení Pellovy rovnice s pravou stranou ±1 a číslo η 6 dokonce řešení základní
Pellovy rovnice. Platí totiž
µ
√ ¶3
√
√ ¢
a+b m
1¡
= a3 + 3a2 b m + 3ab2 m + b3 m m =
2
8
a(a2 + 3mb2 ) b(3a2 + b2 m) √
=
+
m=
8
8
a(a2 − mb2 + 4mb2 ) b(−a2 + b2 m + 4a2 ) √
=
+
m=
8
8
a(±1 + mb2 ) b(∓1 + a2 ) √
=
+
m,
2
2
√
2
2
kde jsme využili fakt, že N ( a+b2 m ) = a −mb
= ±1, tj. a2 − mb2 = ±4. Nyní je ovšem
4
¡ √ ¢3
√
zřejmé, že a+b2 m = c + d m, protože a, b i m jsou lichá čísla.
√
Příklad 9.8. Najděme fundamentální jednotku v tělese Q( 29). Protože 29 ≡ 1 mod 4,
√
hledáme tedy číslo η = 12 (a+b 29), a, b ∈ Z takové, že N (η) = 41 (a2 −29b2 ) = ±1. Řešíme
tedy zobecněnou Pellovu rovnici x2 −29y 2 = ±4. Z toho, co jsme odvodili v Příkladu 6.30,
víme, že minimální takové pozitivní řešení je (x, y) = (5, 1), což odpovídá fundamentální
√
jednotce η = 21 (5 + 29).
√
√
√
Výpočtem snadno zjistíme, že η 3 = 70 + 13 29 ∈ Z + 29Z a η 6 = 9801 + 1820 29,
což odpovídá minimálním řešením Pellovy rovnice x2 − 29y 2 = −1 a x2 − 29y 2 = 1.
9.3
Prvočísla, ireducibilní prvky, faktorizace
Následující lemma obsahuje velmi jednoduché tvrzení, které ovšem budeme hustě používat, protože nám bude usnadňovat práci při počítání v OK .
Lemma 9.9. Necht’ β, γ ∈ OK . Jestliže β|γ v OK , pak N (β)|N (γ) v Z.
Důkaz. Nechť γ = βδ pro nějaké δ ∈ OK . Pak také N (γ) = N (βδ) = N (β)N (δ). Protože
všechny vystupující normy jsou celočíselné, platí N (β)|N (γ) v Z.
121
Poznámka 9.10. Opačná implikace neplatí. Jako příklad můžeme vzít čísla β = 1 + 2i
√
a γ = 1 − 2i v okruhu OK pro K = Q( −1). Máme N (β) = N (γ) = (1 + 2i)(1 − 2i) =
1 + 22 = 5, proto N (β)|N (γ) v Z. Pokud by ale mělo β dělit γ v OK , musely by být prvky
β a γ asociované, tj. γ = βξ pro nějaké ξ ∈ U (OK ) = {±1, ±i}. Snadno ověříme, že toto
není možné.
Důsledek 9.11. Necht’ pro β ∈ OK platí, že N (β) je prvočíslo v Z. Potom β je ireducibilní
v OK .
Poznámka 9.12. Opačná implikace neplatí. Příkladem je třeba číslo 3 ∈ Z[1, i], které
je ireducibilní v Z[1, i], ale jeho norma přitom není prvočíselná, N (3) = 9. Ireducibilitu
čísla β = 3 v Z[1, i] můžeme ověřit například takto: Kdyby bylo β reducibilní pak existují
δ, γ ∈ Z[1, i] \ {±1, ±i} takové, že 3 = γδ. Porovnáme-li normu čísel na obou stranách,
dostaneme 9 = N (3) = N (γ)N (δ). Protože γ, δ nemají být jednotky, muselo by N (γ) =
N (δ) = ±3. To ale není možné, protože norma čísla v Z[1, i] je tvaru a2 + b2 , a, b ∈ Z.
Věta 9.13. Necht’ β ∈ OK je prvočíslo v OK , pak existuje právě jedno prvočíslo p v Z,
takové, že β dělí p v OK .
Důkaz. Je zřejmé, že β dělí alespoň jedno racionální celé číslo, přotože je-li K číselné
Q
Q
těleso řádu n, máme N (β) = β ni=2 σi (β), a přitom ni=2 σi (β) ∈ OK .
Necht’ p je nejmenší přirozené číslo takové, že β|p v OK . Ukážeme, že p je prvočíslo
v Z. Zřejmě p 6= 1. Jinak by totiž β|1, tj. β ∈ U (OK ), což je spor s předpokladem, že β
je prvočíslo v OK . Kdyby p bylo číslo složené, tedy β|p = p1 p2 , pak by z prvočíselnosti β
plynulo β|p1 nebo β|p2 v OK . To by ovšem byl spor s volbou čísla p. Proto p je prvočíslo
v Z.
Necht’ β dělí dvě různá racionální prvočísla p, q. Protože p ⊥ q, musí existovat x, y ∈ Z
tak, že px + qy = 1. Pak by ale β|1, což vede ke sporu.
Věta 9.14. Nechť K je číselné těleso a nechť β ∈ OK \ U (OK ), β 6= 0. Potom existují
ireducibilní prvky γ1 , . . . , γr ∈ OK tak, že β = γ1 · · · γr .
¯
¯
Důkaz. Použijeme indukci na ¯N (β)¯, což je pro β ∈ OK nezáporné celé číslo. Protože
¯
¯
β ∈
/ U (OK ), β 6= 0, je ¯N (β)¯ ≥ 2. Pokud β je samo ireducibilní, položíme r = 1 a
γ1 = β. Jesliže je β reducibilní, pak existují nenulová čísla β1 , β2 ∈ OK \ U (OK ) taková,
¯
¯ ¯
¯
¯
¯ ¯
¯¯
¯
že β = β1 β2 . Pak ale ¯N (β1 )¯, ¯N (β2 )¯ > 1 a protože ¯N (β)¯ = ¯N (β1 )¯¯N (β2 )¯, musí být
122
¯
¯ ¯
¯ ¯
¯
¯N (β1 )¯, ¯N (β2 )¯ < ¯N (β)¯. Z indukčního předpokladu existují faktorizace čísel β1 , β2 na
ireducibilní prvky. Jejich kombinací dostaneme faktorizaci čísla β.
Podle předchozí věty lze v okruhu celých čísel každého číselného tělesa nalézt faktorizaci libovolného prvku na konečný součin ireducibilních prvků. Na příkladě ovšem
ukážeme, že ne vždy je faktorizace na ireducibilní prvky jednoznačná, takový okruh celých
čísel pak není Gaussův obor.
Příklad 9.15. Příkladem tělesa, jehož okruh celých čísel není Gaussův obor, je K =
√
Q( −5). Platí
√
√
(1 + 2 −5)(1 − 2 −5) = 21 = 3 · 7 .
(9.2)
√
√
čísla 1 + 2 −5, 1 − 2 −5, 3, 7 jsou ireducibilní v OK . Jejich normy jsou totiž po řadě
rovny 21, 21, 9 a 49. Měla by-li existovat faktorizace některého z nich, označme ho γ,
na součin γ = βδ, β, δ ∈ OK \ U (OK ), musely by normy N (β), N (δ) patřit do množiny
√
√
{±3, ±7}. To ale v tělese Q( −5) není možné, protože N (a + b −5) = a2 + 5b2 . To,
že faktorizace dané rovností (9.2) jsou neekvivalentní souvisí opět s normami, protože
asociované prvky mají stejné normy.
√
Všimněme si, že číslo γ = 1 + 2 −5 dělí v okruhu OK součin 3 · 7, ale nedělí žádný z
činitelů. Prvek γ je tedy sice ireducibilní v OK , ale není tam prvočíslem.
√
√
Jiným příkladem nejednoznačnosti je faktorizace −6 · (− −6) = 6 = 2 · 3 v okruhu
√
celých čísel tělesa Q( −6). Argumenty dokazující nejednoznačnost faktorizace jsou zde
√
obdobné jako u tělesa Q( −5).
Jak jsme viděli v příkladu, nejednoznačnost faktorizace na ireducibilní prvky souvisí s
tím, že obecně ne všechny ireducibilní prvky jsou prvočísla. Tato souvislost není náhodná,
jak je zřejmé z následující věty.
Věta 9.16. Okruh OK je okruh s jednoznačnou faktorizací, právě když každý ireducibilní
prvek v OK je prvočíslo v OK .
Důkaz. Necht’ OK je okruh s jednoznačnou faktorizací a necht’ β ∈ OK je libovolný
ireducibilní prvek. Jestliže existují γ, δ ∈ OK tak, že β|γδ, lze psát αβ = γδ pro nějaké
α ∈ OK . Po rozkladu obou stran této rovnosti na součin ireducibilních prvků máme
α1 · · · αr β = γ1 · · · γs δ1 · · · δt
123
pro nějaké r, s, t ∈ N. Protože OK je okruh s jednoznačnou faktorizací, musí β být asociované s jedním z ireducibilních prvků na pravé straně rovnosti, např. γi . Pak ale β|γ v
OK , tzn. β je prvočíslo v OK .
Pro opačnou implikaci uvažujme libovolné nenulové β ∈ OK \ U (OK ). Použijeme
indukci na |N (β)| ∈ N. Je-li číslo β samo ireducibilní v OK , je tvrzení zřejmé. Necht’
tomu tak není a necht’ γ1 · · · γs = δ1 · · · δt jsou dva rozklady čísla β na součin ireducibilních
prvků. Pak γ1 dělí δ1 · · · δt a protože γ1 je z předpokladu prvočíslo v OK , musí dělit jedno
z čísel δ1 , . . . , δt , bez újmy na obecnosti δ1 . Můžeme tedy psát δ1 = ξγ1 pro nějaké ξ ∈ OK .
Ovšem δ1 je ireducibilní, tedy ξ nebo γ1 musí být jednotka. Ale γ1 je ireducibilní prvek,
proto ξ ∈ U (OK ).
Máme tedy
β/γ1 = γ2 · · · γs = (ξδ2 )δ3 · · · δt ,
což jsou dva rozklady čísla β/γ1 ∈ OK na součin ireducibilních prvků. Přitom |N (β/γ1 )| =
|N (β)|/|N (γ1 )| < |N (β)|, kde poslední nerovnost plyne z faktu, že γ1 ∈
/ U (OK ). Lze tedy
použít indukční předpoklad a tvrdit, že γ2 · · · γs = (ξδ2 )δ3 · · · δt jsou ekvivalentní rozklady
na ireducibilní prvky. Potom ale i γ1 · · · γs = δ1 · · · δt jsou ekvivalentní rozklady a důkaz
je hotov.
Ověřovat platnost jednoznačné faktorizace, či ekvivalentní podmínky o splývání ireducibilních prvků a prvočísel není přímočaré. Věta 2.16 je proto užitečnou postačující podmínkou: jednoznačnou faktorizaci v OK zaručuje jeho eukleidovskost. Následující tvrzení
dává kritérium eukleidovskosti číselného okruhu, kde roli funkce φ v Definici 2.15 hraje
norma. Poznamenejme, že Věta 9.17 nic neříká o tom, zda okruh OK nemůže být eukleidovský s jinou funkcí φ.
Věta 9.17. Okruh celých čísel v číselném tělese K je eukleidovský s funkcí φ = |N |, právě
když pro každé µ ∈ K existuje δ ∈ OK splňující
¯
¯
¯N (µ − δ)¯ < 1 .
Důkaz. Nejprve je třeba si uvědomit, že první podmínka z Definice 2.15 pro funkci ϕ = |N |
je automaticky splňena ve všech okruzích celých čísel číselných těles, což je přímý důsledek
Lemma 9.9.
Předpokládejme nyní, že OK je eukleidovský s funkcí φ = |N |. Nechť µ ∈ K. Pak
µ = β/γ pro nějaké prvky β, γ ∈ OK , γ 6= 0. Z vlastnosti eukleidovského okruhu existují
124
¯
¯ ¯
¯ ¯
¯
δ, ε ∈ OK tak, že ¯N (ε)¯ = ¯N (β − δγ)¯ < ¯N (γ)¯. Proto
¯
¯
¯
¯ ¯
¯ ¯ N (β − δγ) ¯
¯N (µ − δ)¯ = ¯N (β/γ − δ)¯ = ¯
¯
¯ N (γ) ¯ < 1 .
Pro opačnou implikaci předpokládejme, že pro každé µ ∈ K existuje δ ∈ OK tak, že
¯
¯
¯N (µ − δ)¯ < 1. Nechť β, γ jsou libovolné prvky z OK takové, že γ 6= 0. Položme µ = β/γ.
¯
¯
Pak z předpokladu existuje δ ∈ OK splňující ¯N (µ − δ)¯ < 1. Položme ε = β − δγ. Potom
¯
¯ ¯
¯ ¯
¯¯
¯ ¯
¯
¯N (ε)¯ = ¯N (β − δγ)¯ = ¯N (γ)¯¯N (µ − δ)¯ < ¯N (γ)¯ ,
a proto okruh OK splňuje Definici 2.15 s funkcí φ = |N |.
√
Příklad 9.18. Jak jsme viděli v Příkladu 9.15, okruh celých čísel tělesa K = Q( −6)
není Gaussův obor. Proto nemůže být ani Eukleidovým oborem. Podle předchozí Věty 9.17
¯
¯
tedy musí existovat µ ∈ K tak, že pro každé δ ∈ OK platí ¯N (µ − δ)¯ < 1. Ukážeme, že
√
√
za toto µ lze volit µ = 21 (1 + −6). Libovolný prvek δ ∈ OK je tvaru δ = a + b −6,
a, b ∈ Z. Pak máme
¯
¯
¯N (µ − δ)¯ = (1/2 − a)2 + 6(1/2 − b)2 ≥ 1 + 6 > 1 ,
4 4
kde jsme použili faktu, že |c − 1/2| ≥ 1/2 pro každé celé číslo c.
O problému faktorizace v okruzích celých čísel číselných těles by se dalo říct ještě
mnoho dalších faktů. Jejich hloubka však přesahuje možnosti tohoto textu. Zmiňme pouze,
že u číselných okruhů splývají pojmy okruh hlavních ideálů a Gaussův obor, ačkoliv v
obecném případě mezi nimi platí pouze vztah daný Větou 2.14.
9.4
Faktorizace v kvadratických tělesech
Zaměřme se nyní podrobněji na zkoumání jednoznačnosti faktorizace v okruzích celých
čísel kvadratických těles. Tato otázka je v popředí zájmu matematiků už více než 200
let a dodnes není kompletně vyřešena. Algebraická teorie čísel však byla snahami o její
zdolání obohacena o mnoho zajímavých výsledků. Zde si předvedeme jen zlomek toho, co
je známo.
√
Věta 9.19. Okruh celých čísel OK v imaginárním kvadratickém tělese K = Q( m) pro
m = −1, −2, −3, −7, −11 je eukleidovský.
125
Důkaz. Ukážeme, že za funkci ϕ z definice eukeidovského okruhu stačí vzít ϕ = |N | a k
√
tomu použijeme Větu 9.17. Nechť µ ∈ K, tj. µ = a + b m, a, b ∈ Q. K němu musíme
¯
¯
najít δ ∈ OK tak, aby ¯N (µ − δ)¯ < 1. Rozlišíme dva případy, podle m mod 4.
√
Nechť m 6≡ 1 mod 4, tj. m = −1, −2. Hledáme δ tvaru δ = c+d m, c, d ∈ Z. Zvolímeli c jako nejbližší celé číslo k racionálnímu číslu a a podobně d jako nejbližší celé číslo k
b, platí |a − c| ≤
1
2
a |b − d| ≤
1
2
a odtud už plyne
¯
¯ ¯
√
√ ¯
¯N (µ − δ)¯ = ¯N (a + b m − c − d m)¯ = (a − c)2 − m(b − d)2 ≤ 1 + |m| ≤ 3 < 1 .
4
4
4
√
Pro m ≡ 1 mod 4, tj. m = −3, −7, −11, hledáme δ tvaru δ = c + d 1+2 m , c, d ∈ Z.
Protože nyníje
√ ¯ ³
´2
³
´2
¯
¯ ¯ ¡
¢
√
¯N (µ − δ)¯ = ¯¯N a + b m − c − d 1 + m ¯¯ = a − c − d − m b − d ,
2
2
2
provedeme volbu c, d ∈ Z jemněji. Vezmeme
d
2
jako nejbližší polocelé číslo k číslu b a
následně c jako nejbližší celé číslo k číslu a − d2 . Potom platí |b − d2 | ≤
a odtud
1
4
a |a − c − d2 | ≤
1
2
¯
¯
¯N (µ − δ)¯ ≤ 1 + |m| ≤ 15 < 1 .
4
16
16
√
Věta 9.20. Okruh celých čísel OK v reálném kvadratickém tělese K = Q( m) pro m =
2, 3, 5, 13 je eukleidovský.
Důkaz. Postup je analogický důkazu Věty 9.19. Opět podle Věty 9.17 k danému µ =
¯
¯
√
a + b m ∈ K, a, b ∈ Q hledáme δ ∈ OK tak, aby ¯N (µ − δ)¯ < 1.
√
Pro m = 2, 3 je libovolné δ ∈ OK tvaru δ = c + d m, a proto
N (µ − δ) = (a − c)2 − m(b − d)2 .
Je-li c nejbližší celé číslo k a a podobně d nejbližší celé číslo k b, pak
1
3
− ≤ −m(b − d)2 ≤ N (µ − δ) ≤ (a − c)2 ≤ ,
4
4
¯
¯ 3
což implikuje ¯N (µ − δ)¯ ≤ 4 < 1.
√
Je-li m = 5, 13, hledáme δ tvaru δ = c + d m, c, d ∈ Z. Opět volíme
d
2
jako nejbližší
polocelé číslo k číslu b a následně c jako nejbližší celé číslo k číslu a − d2 . Potom
√
³
¡
√
1 + m¢ ³
d ´2
d ´2
N (µ − δ) = N a + b m − c − d
= a−c−
−m b−
,
2
2
2
126
a tu lze odhadnout
³
³
13
d ´2
d ´2 1
− ≤ −m b −
≤ N (µ − δ) ≤ a − c −
≤ ,
16
2
2
4
¯
¯ 13
což implikuje ¯N (µ − δ)¯ ≤ 16 < 1.
Poznamenejme, že z nerovností v důkazech Vět 9.19 a 9.20 je zřejmé, že postup nelze
zobecnit na další m ∈ Z. To ale neznamená, že okruhy celých čísel v ostatních kvadratických tělesech nemohou být eukleidovské. Otázkou eukeidovosti a jednoznačné faktorizace
se zabýval už Gauss. Ve svých 19 letech publikoval práci Disquisitiones Arithmeticae,
ve kterých rozvinul velmi zajímavé a komplikované koncepty, na kterých staví moderní
algebraická teorie čísel, a vyslovil hypotézy, z nichž některé zůstávají dodnes nedokázány.
Následující poznámka shrnuje, co je známo o faktorizaci v kvadratických tělesech.
Poznámka 9.21.
• Dodnes není známý úplný popis těch m ∈ Z, pro které je okruh OQ(√m) eukleidovský.
Jsou známé pouze částečné výsledky.
• Je-li m < 0, pak okruh celých čísel OQ(√m) je eukleidovský obor, právě když m =
−1, −2, −3, −7, −11.
• Je-li m > 0, pak okruh OQ(√m) je eukleidovský s funkcí φ = |N |, právě když m =
2, 3, 5, 6, 7, 11, 13, 17, 19, 21, 29, 33, 37, 41, 55, 73.
√
• Okruh OK v tělese K = Q( 69) je eukleidovský s jinou funkcí φ. Není známo, zda
existují ješte další m s touto vlastností.
√
• Okruh OK v tělese K = Q( −19) má jednoznačnou faktorizaci, ale není euklei√
dovský. Podobně okruh OK v tělese K = Q( 14) má jednoznačnou faktorizaci,
není eukleidovský s funkcí φ = |N |, ale není známo, zda není eukleidovský s jinou
funkcí.
• Je-li m < 0, pak okruh OQ(√m) má jednoznačnou faktorizaci, právě když m =
−1, −2, −3, −7, −11, −19, −43, −67, −163. Jednoznačnou faktorizaci u těchto těles
prokázal už Gauss a vyslovil hypotézu, že jsou jediná s touto vlastností. Jeho hypotézu později dokázalo nezávisle několik matematiků.
127
• Není známo, zda existuje nekonečně mnoho m > 0 takových, že okruh OQ(√m) má
jednoznačnou faktorizaci. Hypotézu, že tomu tak je, vyslovil opět už Gauss, dodnes
tato otázka ovšem nebyla vyřešena. Poznamenejme, že není ani známo, zda vůbec
existuje nekonečně mnoho číselných těles (libovolného řádu), jejichž okruhy mají
jednoznačnou faktorizaci.
Důkazy Vět 9.19 a 9.20 nám dávají návod, jak získat podíl a zbytek při dělení dvou
√
čísel z OK v daném tělese K = Q( m), jehož obor celých čísel je eukleidovský s funkcí
φ = |N |. Postup ilustrujeme na případě K = Q(i). Okruh celých čísel je v tomto případě
roven OK = {a + bi | a, b ∈ Z} a jeho prvkům se někdy říká Gaussova celá čísla.
Příklad 9.22. V Gaussových celých číslech vydělme se zbytkem číslo β = 7 + 5i číslem
γ = 3 + i. Máme
β
7 + 5i
(7 + 5i)(3 − i)
1
=
=
= (13 + 4i) .
γ
3+i
10
5
Číslo δ = c + di ∈ Z[i] splňující |N (β/γ − δ)| < 1, najdeme tak, že vezmeme celá čísla c, d
nejbližší k a =
13
,
5
b = 45 , a tedy c = 3, d = 1. Pak δ = 3 + i. ‘Zbytek’ ε při dělení získáme
snadno, jako
ε = β − γδ = 7 + 5i − (3 + i)(3 + i) = 7 + 5i − (8 + 6i) = −1 − i .
Snadno ověříme, že N (ε) = 2 < N (γ) = 4 .
Pro úplné popsání aritmetiky v oboru Gaussových celých čísel ještě potřebujeme popsat ireducibilní prvky, které jsou v tomto případě shodné s prvočísly.
Věta 9.23. Prvočísla v okruhu Gaussových celých čísel jsou právě ta čísla β ∈ OQ(i) ,
která jsou asociovaná s právě jedním z následujících prvků.
• 1+i
• p, kde p je racionální prvočíslo p ≡ 3 mod 4.
• a + bi, kde a > 0 je sudé, a a2 + b2 = p, kde p je racionální prvočíslo p ≡ 1 mod 4.
Důkaz. Nechť β je prvočíslo v Z[i]. Podle Věty 9.13 existuje právě jedno racionální prvočíslo p takové, že β dělí p v Z[i]. Diskusi rozdělíme na případy podle typu p.
Nechť p = 2. Jestliže β = a + bi dělí 2 v Z[i], pak N (β) = a2 + b2 dělí 4 v Z. Pro pár
©
ª
(a, b) ∈ Z2 máme tedy možnosti (a, b) ∈ (±1, ±1), (±2, 0), (0, ±2) . Ovšem čísla daná
128
páry (±2, 0), (0, ±2) nejsou ireducibilní, protože 2 = (1 + i)(1 − i). Zbývá pár (±1, ±1), tj.
čísla ±1±i, která jsou ovšem asociovaná, protože 1+i = −(−1−i) = i(1−i) = −i(−1+i).
Stačí tedy vybrat jeden z nich, např. 1 + i. To je prvek ireducibilní v Z[i], protože jeho
norma N (1 + i) = 2 je racionální prvočíslo.
Nechť nyní p ≡ 3 mod 4. Potom β|p implikuje N (β) = a2 + b2 = p nebo a2 + b2 = p2 .
První z možností je nepřípustná kvůli Větě 5.11. Proto a2 + b2 = p2 . Protože ale Z[i] je
obor jednoznačné faktorizace, musí být p̌rvek a + bi asociovaný s p.
Nechť na závěr p ≡ 1 mod 4. V tomto případě opět β|p implikuje N (β) = a2 + b2 = p
nebo a2 + b2 = p2 . Tentokrát ovšem p lze (podle Věty 5.10) rozložit na součet dvou
čtverců, a proto p není ireducibilní v Z[i]. Možnost a2 + b2 = p2 tedy odpadá, protože
pak by β = a + bi byl prvek asociovaný s p, a tudíž by nebyl ireducibilní. Proto tedy
p = a2 + b2 , kde právě jedno z a, b je sudé. Lze proto volit a > 0 sudé, ostatní řešení
{±a ± bi, ±ai ± b} jsou asociované.
Na závěr této kapitoly uvedeme ještě jeden příklad, a to okruh celých čísel v tělese
√
K = Q( −3), jehož prvky se někdy nazývají Eisensteinova celá čísla. Příklad ilustruje,
že nevhodnou volbou číselného oboru můžeme ztratit cennou vlastnost jednoznačné faktorizace.
©
ª
√
√
Příklad 9.24. Nechť K = Q( −3). Okruh OK = 21 (a + b −3) | a, b ∈ Z je podle
Věty 9.19 eukleidovský a proto v něm platí jednoznačná faktorizace. Uvažujme nyní jeho
√
nevlastní podokruh, R = Z + −3 Z. S překvapením zjišťujeme, že v tomto okruhu už
jednoznačná faktorizace není! Máme totiž
(1 +
Prvky 1 ±
√
−3)(1 −
√
−3) = 4 = 2 · 2 .
(9.3)
√
−3, 2 jsou ireducibilní v R, protože mají normu rovnu 4 a jejich reducibilita
√
by implikovala existenci prvku a + −3b ∈ R, a, b ∈ Z, takového, že a2 + 3b2 = ±2, což je
spor. Rozklady na levé a pravé straně (9.3) jsou ale neasociované. Grupa jednotek v R je
totiž průnikem U (OK ) ∩ R = {±1}. Eisensteinova celá čísla OK oproti okruhu R obsahují
√
√
další jednotky, a to 21 (±1 ± −3), a proto jsou čísla 1 + −3 a 2 v OK asociovaná.
Nejednoznačnost faktorizace u oboru Z +
√
−3 Z není překvapující pro toho čtenáře,
který zná pojem integrální uzavřenosti okruhů. Je-li K podílové těleso okruhu R, pak
o R řekneme, že je integrálně uzavřený, pokud každý element α ∈ K, který je kořenem
monického polynomu s koeficienty v R, sám leží také v R. Lze ukázat, že každý obor s
129
√
jednoznačnou faktorizací je integrálně uzavřený. Protože podílové těleso Q( −3) oboru
√
√
Z + −3 Z obsahuje prvek 12 (1 + −3), který je kořenem polynomu x2 + x + 1 ∈ (Z +
√
√
√
−3 Z)[x], ale nepatří do Z + −3 Z, obor Z + −3 Z tedy není integrálně uzavřený a
nemůže tedy splňovat jednoznačnou faktorizaci.
Není těžké ověřit, že okruh celých čísel každého číselného tělesa je integrálně uzavřený,
a proto má největší šanci mít vlastnost jednoznačné faktorizace. Jak jsme ovšem viděli
√
např. na tělese Q( −5) v Příkladu 9.15, integrální uzavřenost není postačující podmínka
pro jednoznačnost faktorizace.
130
10
Aplikace algebraických těles
10.1
Řešení diofantických rovnic
Nejprve uvedeme velmi jednoduchý příklad diofantické rovnice, kterou úplně vyřešíme
elementárními metodami.
Příklad 10.1. Najděme všechna celočíselná řešení rovnice x2 − y 2 = 35. Obě strany
rovnosti rozložíme na součin, (x − 3y)(x + 3y) = 5 · 7. Protože pravou stranu dále faktorizovat nelze, máme pouze několik možností řešení. Ze znaménkové symetrie stačí uvažovat
pouze dvě soustavy lineárních rovnic,
x − y = 5,
x + y = 7,
a
x − y = 1,
x + y = 35 .
První soustava má řešení x = 6, y = 1; druhá soustava x = 18, y = 17. Všechna řešení
rovnice x2 − y 2 = 35 jsou tedy (±6, ±1), (±18, ±17).
Tento příklad jsme snadno vyřešili s použitím faktorizace čísla 35 na prvočísla. V
dalších příkladech uvidíme, že metoda postupu je obdobná, potřebujeme ovšem faktorizaci
v obecnějších číselných okruzích.
Následující příklad je zobecněná Pellova rovnice. V Důsledku 5.20 jsme viděli způsob,
jak z jednoho řešení vyrobit nekonečně mnoho řešení. Nebylo však zdaleka zřejmé, zda
daná rovnice vůbec nějaké řešení má, a jestli množina řešení získaná naším postupem je
úplná.
Příklad 10.2. Najděme všechna celočíselná řešení rovnice x2 − 29y 2 = 35. Levou stranu
√
√
opět faktorizujeme, tentokrát na součin (x − 29y)(x + 29y). Je zřejmé, že výhodou
√
bude znalost vlastností okruhu celých čísel tělesa K = Q( 29), tj. okruhu OK = { 12 (a +
√
b 29) | a, b ∈ Z}. Připomeňme, jak vypadají jednotky v tomto oboru, což jsme popsali v
Příkladu 9.8. Platí
√
U (OK ) = {±( 5+2 29 )k | k ∈ Z} ,
√
√
U (OK ) ∩ (Z + 29Z) = {±(70 + 13 29)k | k ∈ Z} .
131
Z tabulky v Příkladu 6.30 popisující řetězový zlomek čísla
√
29 lze dále vyčíst, že
√
√
5 = (11 + 2 29)(11 − 2 29) ,
√
přičemž čísla 11 ± 2 29 jsou ireducibilní v OK , protože mají prvočíselnou normu. Navíc
také
7 = (6 +
√
29)(6 −
√
29) ,
√
přičemž čísla 6 ± 29 jsou ze stejného důvodu rovněz ireducibilní v OK . Zadnaná rovnice
lze tedy napsat jako
(x −
√
29y)(x +
√
√
√
√
√
29y) = (11 + 2 29)(11 − 2 29)(6 + 29)(6 − 29) .
Hledejme nyní rozklad na ireducibilní prvky jednotlivých faktorů z levé strany. Protože
√
okruh celých čísel tělesa Q( 29) je eukleidovský, stačí rozdělit ireducibilní prvky z pravé
strany na dvě skupiny. Ne všechny možnosti jsou ale přípustné.
√
√
Nejdříve ukažme, že čísla 11 ± 2 29 nemohou zároveň dělit x + 29y. Použitím au√
tomorfismu σ tělesa Q( 29) totiž máme
√
√
(11 − 2 29)|(x + 29y)
√
√
√
√
σ(11 − 2 29) = 11 + 2 29|σ(x + 29y) = x − 29y .
⇒
√
√
√
Proto by tedy 11 + 2 29 dělilo x + 29y i x − 29y a tudíž i jejich součet 2x a rozdíl
√
2 29y. Normováním ovšem získáme
√
√
(11 + 2 29) | 2x
⇒ N (11 + 2 29) = 5 | N (2x) = 4x2
⇒ 5|x,
√
√
√
√
(11 + 2 29) | 2 29y ⇒ N (11 + 2 29) = 5 | N (2 29y) = 4 · 29y 2 ⇒ 5 | y .
Proto by platilo 25|(x2 − 29y 2 ) = 35 a to je spor.
√
√
Obdobným způsobem ukážeme, že čísla 6 ± 29 nemohou zároveň dělit x + 29y.
√
√
√
√
Jinak by totiž 6 + 29 dělilo x + 29y i x − 29y, a tedy i součet 2x a rozdíl 2 29y.
Platí
(6 +
√
29) | 2x
√
√
(6 + 29) | 2 29y
7 | 4x2
⇒
⇒
což je opět spor. Protože x −
7 | 4 · 29y
√
2
7|x
⇒
√
7|y
)
⇒ 49 | (x2 − 29y 2 ) = 35 ,
29y), musí i rozklad tohoto čísla na ire√
ducibilní prvky být obrazem rozkladu čísla x + 29y. Máme proto následující možnosti,
√
√
29)(11 + 2 29) = 124 + 23 29 ,
√
√
√
√
x + 29y = (6 − 29)(11 − 2 29) = 124 − 23 29 ,
√
√
√
√
x + 29y = (6 + 29)(11 − 2 29) = 8 − 29 ,
√
√
√
√
x + 29y = (6 − 29)(11 + 2 29) = 8 + 29 .
x+
√
29y = σ(x +
⇒
29y = (6 +
√
132
Každé z těchto řešení ještě můžeme vynásobit libovolnou jednotkou, pro kterou součin
√
nevypadne z množiny Z + 29Z. Proto
o
√
√ k
x+ 29y, x− 29y ∈ ±(8± 29)(70+13 29) , ±(124±23 29)(70+13 29) , k ∈ Z .
√
n
√
√
√
k
Dalším typem příkladu je diofantická rovnice kombinující druhé a vyšší mocniny neznámých. Opět nejprve uvedeme příklad řešitelný elementárními metodami.
Příklad 10.3. Najděme všechna celočíselná řešení rovnice y 2 + 5 = x3 . Takové řešení
musí splňovat y 2 ≡ x3 − 1 mod 4. Protože čtverec celého čísla je vždy roven 0 nebo 1
modulo 4, musí být x3 rovno 1 nebo 2 modulo 4. Kongruence x3 ≡ 2 mod 4 ale nemá
řešení, a proto máme x3 ≡ 1 mod 4. Číslo x je tedy liché. Možnost x = 4k + 3 vede
snadno ke sporu, a tudíž x ≡ 1 mod 4. Rovnici y 2 + 5 = x3 můžeme přepsat ve tvaru
y 2 +4 = x3 −1 = (x−1)(x2 +x+1). Protože x2 +x+1 ≡ 3 mod 4, musí existovat prvočíslo
p ≡ 3 mod 4 tak, že p | y 2 + 4. Násobíme-li obě strany kongruence y 2 + 4 ≡ 0 mod p druhou
mocninou prvku 2−1 inverzního k prvku 2 v tělese Zp , dostaneme (y · 2−1 )2 + 1 mod p. To
je ovšem spor, protože pro p ≡ 3 mod 4 číslo −1 není kvadratickým reziduem. Celočíselné
řešení rovnice y 2 + 5 = x3 proto neexistuje.
V Příkladu 10.3 jsme měli štěstí, že rovnice neměla řešení. Obecně lze říci, že dokázat
neexistenci řešení bývá mnohem jednodušší, než nějaké řešení najít, natož popsat všechna
řešení. Uvedeme několik příkladů, kde k hledání celočíselných řešení využijeme právě
jednoznačnou faktorizaci v okruzích celých čísel kvadratických těles.
Příklad 10.4. Najděme všechna celočíselná řešení rovnice y 2 +2 = x3 . Je zřejmé, že x a y
mají stejnou paritu. Kdyby x, y byla sudá čísla, pak y 2 +2 ≡ 2 mod 4 a x3 ≡ 0 Ale xmod 4
√
√
a to je spor. Proto x, y jsou lichá čísla. Opět budeme faktorizovat, (y + −2)(y − −2) =
√
x3 , tentokrát v okruhu celých čísel tělesa K = Q( −2), což je opět eukleidovský obor
a tedy v něm platí jednoznačná faktorizace. Připomeňme, že jediné jednotky v OK jsou
±1.
√
−2 = ±β1a1 β2a2 · · · βkak je faktorizace na ireducibilní prvky, βi ∈ OK jsou
√
navzájem neasociované, ai ∈ N. Odtud s použitím automorfismu tělesa Q( −2) plyne
Nechť y +
x3 = (y +
√
−2)(y −
√
−2) = β1a1 β2a2 · · · βkak σ(β1 )a1 σ(β2 )a2 · · · σ(βk )ak .
(10.1)
Ukažme, že v tomto součinu není βi asociované s žádným σ(βj ). Kdyby totiž βi = ±σ(βj ),
√
√
√
muselo by číslo βi dělit y + −2, ale také y − −2, a proto βi |2 −2. Znormováním
133
dostaneme N (βi )|8. Zároveň ale znormováním βi |(y +
√
−2) odvodíme N (βi )|(y 2 + 2),
to je ale liché číslo. Jediná možnost pro N (βi ) je tedy N (βi ) = ±1. To ale není možné,
protože βi je ireducibilní prvek, tj. βi ∈
/ U (OK ). Rovnost (10.1) tedy dává faktorizaci
čísla x3 na ireducibilní prvky, kde všechny činitele už jsou navzájem neasociované. Z
jednoznačné faktorizace v okruhu OK plyne, že faktorizace x3 = (faktorizace x)3 , a tudíž
√
exponenty ai v (10.1) musí být dělitelné třemi. Odtud plyne, že y + −2 = ±γ 3 pro
√
nějaké γ = a + b −2, a, b ∈ Z. Máme proto
√
√
√
√
y + −2 = ±(a + b −2)3 = ±(a3 + 3a2 b −2 − 3 · 2ab2 − b3 2 −2) =
³
´
(10.2)
√
= ± (a3 − 6ab2 ) + −2(3a2 b − 2b3 ) .
Protože zápis čísla z OK pomocí integrální báze je jednoznačný, můžeme porovnat koeficienty u 1,
1 = ±(3a2 b − 2b3 ) = ±b(3a2 − 2b3 )
⇒
b = ±1 = (3a2 − 2b2 ) ,
což implikuje řešení a = ±1, b = ±1. Dosazením do rovnice vzniklé z rovnice (10.2)
porovnéním koeficientů u 1 odvodíme
y = ±(a3 − 6ab2 ) = ±a(a2 − 6b2 ) = ±5 .
Číslo x lze k tomuto y dopočítat snadno ze zadané rovnice x3 = y 2 + 2 = 27, a tedy x = 3.
Rovnice má tedy jediné celočíselné řešení, a to x = 3, y = ±5.
Příklad 10.5. Velmi známá je diofantická rovnice Ramanujan-Nagellova, x2 + 7 = 2n .
Ramanujan v roce 1913 vyslovil hypotézu, že jediná řešení (x, n) ∈ Z2 jsou (±1, 3), (±3, 4),
(±5, 5), (±11, 7) a (±181, 15). Tuto hypotézu pak ve 40. letech dokázal norský matematik
Trygve Nagell. Naznačme postup řešení. Bez újmy na obecnosti lze uvažovat pouze kladné
x a n > 3.
Případ sudého n lze vyřešit snadno. Potom 2n − x2 = (2n/2 − x)(2n/2 + x) = 7. Protože
2n/2 + x > 2n/2 − x, musí být 2n/2 + x = 7 a 2n/2 − x = 1. Odtud 2 · 2n/2 = 8, a tedy n = 4.
Pak je nutně x = 3.
Pro řešení při lichém n lze použít jednoznačnou faktorizaci v oboru celých čísel tělesa
√
√
K = Q( −7), tedy OK = {a + b 1+ 2 −7 | a, b ∈ Q}. Pro zjednodušení značení položme
m = n − 2 ≥ 2. Potom můžeme psát
³ x + √−7 ´³ x − √−7 ´ x2 + 7
³ 1 + √−7 ´m ³ 1 − √−7 ´m
m
=
=2 =
,
2
2
4
2
2
134
√
kde jsme využili fakt, že 2 = N ( 1+ 2 −7 ). Protože 2 je prvočíslo v Z, podle Důsledku 9.11
√
√
jsou prvky α := (1 + −7)/2 a β := (1 − −7)/2 ireducibilní v OK . Navíc ani jedno z
√
√
nich nemůže dělit zároveň čísla (x + −7)/2 a (x − −7)/2, protože pak by dělilo i jejich
√
√
rozdíl −7. A to nelze, protože N (α) = N (β) = 26 | N ( −7) = 7. Jelikož U (OK ) = {±1},
√
je rozklad čísla (x + −7)/2 na ireducibilní prvky roven
(x +
√
−7)/2 = ±αm
a odpovídající rozklad čísla (x −
(x −
√
√
nebo
(x +
√
−7)/2 = ±β m ,
−7)/2 je po řadě
−7)/2 = ±β m
nebo
(x −
√
−7)/2 = ±αm ,
kde znaménko je vždy stejné u obou rozkladů. Po odečtení těchto rozkladů dostaneme
√
± −7 = αm − β m . Dokážeme, že tato rovnost platí pouze se znaménkem minus na levé
√
√
straně. Předpokládejme pro spor, že αm − β m = −7. Protože také α − β = −7, je
αm − α = β m − β .
(10.3)
Všimněme si, že α2 = (1 − β)2 = 1 − 2β + β 2 = 1 − αβ 2 + β 2 = 1 + β 2 (1 − α) = 1 + β 3 ,
kde jsme využili, že N (α) = αβ = 2. Proto
αm − α = α(α2 )(m−1)/2 − α = α(1 + β 3 )(m−1)/2 − α = β 3 γ ,
pro nějaké γ ∈ OK . Po dosazení do (10.3) máme β m − β = αm − α = β 3 γ, odkud plyne
β m−1 − 1 = β 2 γ a posléze 1 = β(β m−2 − βγ). Tudíž β dělí 1 v OK . To je ale spor, protože
jak jsme řekli výše, β je ireducibilní prvek v OK . Tím jsme dokázali
³ 1 + √−7 ´m ³ 1 − √−7 ´m
√
m
m
− −7 = α − β =
−
.
2
2
Potom platí
−2
m
√
−7 = (1 +
√
m
−7) − (1 −
√
m
m
X
X
√
√
i
−7) =
( −7) −
(− −7)i .
m
i=0
Protože se členy se sudým exponentem odečtou, platí
µ ¶
µ ¶
³µm¶
´
m
m
2 m
−2 = 2
−7
+7
− ···
=⇒
1
3
5
i=0
2m−1 ≡ −m mod 7 .
(10.4)
Protože ale platí 23k ≡ 1 mod 7, 23k+1 ≡ 2 mod 7 a 23k+2 ≡ 4 mod 7, pro k ∈ N,
může (10.4) platit pouze pro m ≡ 6 nebo 5 nebo 3 mod 7. V případě m ≡ 6 mod 7 musí
135
být 2m−1 ≡ −6 ≡ 1 mod 7 a to nastane jen pro m − 1 = 3k pro nějaké k ∈ N, a tedy
m ≡ 1 mod 3. Dohromady proto
m ≡ 1 mod 3
7m ≡ 7 mod 21
⇒
m ≡ −1 mod 7
3m ≡ −3 mod 21
⇒
m ≡ 13 mod 21 .
Podobně v případě m ≡ 5 mod 7 je 2m−1 ≡ −5 ≡ 2 mod 7, což implikuje m ≡ 2 mod 3,
takže
m ≡ 2 mod 3
m ≡ −2 mod 7
7m ≡ 14 mod 21
⇒
⇒
3m ≡ −6 mod 21
m ≡ 26 ≡ 5 mod 21 .
Poslední případ m ≡ 3 mod 7 dává 2m−1 ≡ −3 ≡ 4 mod 7, což implikuje m ≡ 0 mod 3, a
tedy
m ≡ 0 mod 3
m ≡ 3 mod 7
⇒
7m ≡ 0 mod 21
3m ≡ 9 mod 21
⇒
m ≡ −18 ≡ 3 mod 21 .
Tím jsme odvodili, že exponenty n, pro které existuje celočíselné řešení x RamanujanNagellovy rovnice, splňují n = m+2 ≡ 5 nebo 7 nebo 15 mod 21. K hodnotám n = 5, 7, 13
snadno najdeme odpovídající x = 5, 11, 181. Je ovšem třeba ukázat, že žádná jiná n
celočíselné řešení x neumožnují. Postup by využíval podobné metody jako doposud, je
ovšem technicky ještě náročnější, a tak si ho odpustíme.
10.2
Lucas-Lehmerův test prvočíselnosti
Metody, které jsme viděli v předchozích příkladech, lze využít i k důkazu zajímavého
kritéria pro prvočíselnost Mersennových čísel Mn = 22 − 1. Snadno ověříme, že Mn má
šanci být prvočíslem, pouze pokud n samo je prvočíslo. Je-li totiž n složené, tedy n = ab
pro a, b > 1, pak
(2ab − 1) = (2a − 1)(1 + 2a + 22a + · · · + 2(b−1)a ) .
Protože a, b ≥ 2, je 2a − 1 ≥ 3 a 1 + 2a + 22a + · · · + 2(b−1)a ≥ 5, a číslo 2n − 1 je tedy
rovněz složené. Zdaleka ovšem neplatí, že Mp je prvočíslo pro každé prvočíslo p. Dnes je
známo na 46 prvočísel tvaru Mn . Prvních osm z nich jsou
M2 = 3,
M3 = 7,
M17 = 131071,
M5 = 31,
M7 = 127,
M19 = 524287,
M13 = 8191,
M31 = 2147483647 .
(10.5)
Jejich prvočíselnost tipoval už v roce 1644 francouzský matematik Marin Mersenne, podle
kterého dnes nesou jméno. Mersenne dále předpokládal, že prvočísly jsou i M67 , M127 a
136
M257 a žádná další Mp pro p < 257. Zde se ovšem mýlil, protože prvočísly jsou kromě (10.5)
ještě M61 , M89 , M107 a M127 , a nikoliv M67 a M257 . Tuto chybu bylo ovšem možno odhalit
až o tři století později.
Největší známé prvočíslo vůbec je dnes (březen 2009) číslo Mp , kde p = 43112609.
Toto prvočíslo má 12978189 cifer! V posledních letech bylo největší známé prvočíslo vždy
Mersennovo číslo. Důvodem je to, že pro Mp existuje následující jednoduchý test prvočíselnosti.
Teorém 10.6 (Lucas–Lehmerův test). Definujme posloupnost (an )n∈N předpisem a1 = 4
a an+1 = a2n − 2 pro n ≥ 1. Nechť p je liché prvočíslo. Potom Mp = 2p − 1 je prvočíslo,
právě když ap−1 ≡ 0 mod Mp .
Ověrit nebo vyvrátit prvočíselnost Mp tedy vyžaduje “pouze” p − 1 kroků, i když
jednotlivé kroky vyždaují operace s obrovskými čísly. Přesto nám počítání modulo Mn
n
výrazně zjednoduší výpočet. Prvky posloupnosti an se totiž řádově rovnají 22 , přitom v
testu nikdy není nutné použít číslo větší než Mn2 ≈ 22n .
Příklad 10.7. Ověřme prvočíselnost Mersennova čísla M17 = 217 − 1 = 131071. Máme
a1 = 4 ,
a2 = 14 ,
a3 = 194 ,
a4 = 37634 ,
a5 = 218767 ≡ 95799 mod M17 ,
a6 = 957992 − 2 = 9177448399 ≡ 119121 mod M17 ,
a7 = 66179 mod M17 ,
a8 = 53645 mod M17 ,
a9 = 122218 mod M17 ,
a10 = 126220 mod M17 ,
a11 = 70490 mod M17 ,
a12 = 69559 mod M17 ,
a13 = 99585 mod M17 ,
a14 = 78221 mod M17 ,
a15 = 130559 mod M17 ,
a16 = 0 mod M17 .
V šestnácti krocích jsme tedy ověřili, že M17 je prvočíslo. Podle velikosti je to šesté prvočíslo tvaru Mp . Kdybychom chtěli prvočíselnost M17 zjistit faktorizací na prvočinitele,
√
museli bychom ověřit dělitelnost všemi prvočísly menšími než [ M17 ] = 362, kterých je
je 72. Kdybychom podobně dokazovali prvočíselnost už jen osmého Mersennova prvočísla
M31 = 231 −1, stačilo by nám 30 kroků. Rozklad na prvočinitele by ale tentokrát vyžadoval
√
ověřit dělitelnost π( M31 ) = 4792 prvočísly!
Poznamenejme, že kromě čistě estetické hodnoty jsou Mersennova prvočísla i užitečná.
Používají se například v generátorech pseudo-náhodných čísel, jako je Mersennův twister,
využívaný v programech typu Matlab.
137
10.3
Konstrukce pomocí kružítka a pravítka
Nemožnost vyjádřit délku uhlopříčky čtverce s jednotkovou stranou pomocí podílu dvou
√
racionálních čísel, jinými slovy iracionálnost čísla 2, přispěla k tomu, že se matematici
v antice zaměřili na velikosti, které bylo možné zkonstruovat geometricky. Hned vznikla
otázka, které velikosti lze zkonstruovat. Dvě úlohy, na které se antice nepodařilo dát
odpověd’, jsou známé pod názvy zdvojení krychle a kvadratura kruhu. Úloha zdvojení
krychle vyžaduje zkonstruovat stranu krychle, která by měla dvojnásobný objem než
krychle jednotková; vyřešit kvaraturu kruhu znamená zkonstruovat čtverec tak, aby měl
stejnou plochu jako kruh s jednotkovým poloměrem.
V první části této kapitoly dokážeme, že zkonstruovat lze pouze algebraická čísla,
jejichž řád je mocninou dvojky. To má za okamžitý důsledek nemožnost zdvojení krychle,
√
protože 3 2 je algebraická iracionalita řádu 3. Nemožnost kvadratury kruhu pak ze zmíněného výsledku vyplynula, až když F. Lindemann dokázal transcendentnost čísla π.
V druhé části se budeme věnovat otázce konstrukcí pravidelných n-úhleníků. Dokážeme
slavnou Gaussovu větu z roku 1796:
Věta 10.8. Necht’ n ∈ N, n ≥ 3. Pak pravidelný n-úhelník lze zkonstruovat pomocí
pravítka a kružítka právě tehdy, když n je mocnina dvojky nebo
n = 2j Fk1 Fk2 . . . Fkm ,
(10.6)
kde j ∈ N0 a Fk1 , Fk2 , . . . , Fkm jsou navzájem různá Fermatova prvočísla.
n
Připomeňme, že Fermatovo číslo je číslo tvaru Fn = 22 + 1 pro n = 0, 1, 2, . . .. Je-li
Fn prvočíslo, nazývame jej Fermatovo prvočíslo. Čísla
F0 = 3, F1 = 5, F2 = 17, F3 = 257, F4 = 65637
jsou prvočísla. Pierre de Fermat (1601-1665) tvrdil, že všechna Fn jsou prvočísla. V roce
1732 Leonhard Euler toto tvrzení vyvrátil, když ukázal, že F5 = 641 × 6700417.
Definice 10.9. Číslo α ∈ C nazveme konstruovatelné, pokud lze v pravouhlé souřadné
soustavě roviny se zadanou jednotkovou vzdáleností zkonstruovat pomocí kružítka a pravítka bod, jehož x-ová souřadnice je <α a y-ová souřadnice je =α.
Prvítko nám slouží jenom na to, abychom mohli spojit úsečkou dva body a abychom
mohli úsečku dostatečně prodloužit. Nevyužíváme centimetrovou škálu, ani rysku pro
138
vztyčování kolmic. I tak umíme zkonstruovat k zadané přímce p a bodu B ∈
/ p rovnobežku
k p resp. kolmici na p, která prochází bodem B.
Poznámka 10.10. α ∈ C je konstruovatelné právě tehdy, když jsou konstruovatelná čísla
<α a =α.
Připomeňme znalosti se středoškolské geometrie. Když jsou konstruovatelná reálná
čísla α a β, pak jsou jednoduše konstruovatelná i α ± β. Podobností trojúhelníků lze
využít na konstrukci αβ a α/β. Protože aritmetické operace v komplexních číslech jsou
definovány pomocí operací v reálných číslech, umíme zkonstruovat α ± β, αβ a α/β, pro
libovolné konstruovatelné α, β ∈ C.
Poznámka 10.11. Množina konstruovatelných čísel tvoří podtěleso tělesa C. Speciálně
je konstruovatelné každé racionální číslo.
Množina konstruovatelných čísel je však větší než Q. Z Eukleidovy věty pro výšku
pravoúhlého trojúhelníka plyne, že umíme zkonstruovat i odmocninu z libovolného reálného konstruovatelného čísla. A protože pomocí kružítka a pravítka umíme půlit úhel, je
√
konstruovatelná také α pro libovolné konstruovatelné komplexní číslo α. Ze vzorečku
pro výpočet kořenů kvadratické rovnice plyne následující tvrzení.
Lemma 10.12. Necht’ a, b, c jsou konstruovatelná čísla a 6= 0. Pak jsou konstruovatelné
i kořeny kvadratické rovnice ax2 + bx + c = 0.
Věta 10.13. Necht’ α ∈ C. Číslo α je konstruovatelné právě tehdy, když existuje posloupnost podtěles Q = T0 ⊂ T1 ⊂ T2 ⊂ . . . ⊂ Tr ⊂ C taková, že α ∈ Tr a [Ti : Ti−1 ] = 2 pro
každé i = 1, 2, . . . , r.
Důkaz. (⇐) Postupujme indukcí na r. Tvrzení pro r = 0 je obsaženo v 10.11. Necht’ r > 0
a α ∈ Tr . Bez ztráty obecnosti předpokládejme, že α ∈
/ Tr−1 . Protože [Tr : Tr−1 ] = 2, je
1 a α bází vektorového prostoru Tr nad tělesem Tr−1 , tedy speciálně pro α2 ∈ Tr existují
a, b ∈ Tr−1 takové, že α2 = aα + b, tj. α je kořen kvadratické rovnice x2 − ax − b = 0. Z
indukčního předpokladu jsou a, b konstruovatelná a podle 10.12 je konstruovatelné také
α.
(⇒) Nyní postupujme indukcí na počet kroků konstrukce. Každý nový bod, který
vytvoříme, vznikne bud’ jako průsečík dvou přímek, nebo jako průsečík dvou kružnic,
139
nebo jako průsečík přímky a kružnice. Tedy jeho souřadnice (x0 , y0 ) jsou řešením systému
dvou rovnic:
y = a1 x + b1
a y = a 2 x + b2
nebo rovnic
y = a1 x + b1
a (x − c1 )2 + (y − d1 )2 = r12
nebo rovnic
a (x − c2 )2 + (y − d2 )2 = r22 .
(x − c1 )2 + (y − d1 )2 = r12
V každém případě po vyloučení proměnné y hledáme x0 jako kořen nanejvýš kvadratické
rovnice a y0 pak dopočítáme pomocí x0 z lineární rovnice. Všechny parametry ai , bi , ci , di ,
ri , které vystupují v rovnicích, jsou podle indukčního předpokladu už konstruovatelná čísla
patřící nějakému tělesu Tr , které tvoří poslední těleso v posloupnosti do sebe vnořených
těles. Bud’ x0 ∈ Tr , a tím je důkaz hotov. V opačném případě je x0 kořenem kvadratického
polynomu ireducibilního nad Tr , a se značením Příkladu 2.34 můžeme psát x0 ∈ Tr+1 :=
Tr (x0 ). Pro toto těleso platí [Tr+1 : Tr ] = 2.
Důsledek 10.14. Necht’ α je konstruovatelné číslo. Pak α je algebraické číslo, jehož řád
je mocnina dvojky.
Pravidelný n-úhelník vepsaný jednotkové kružnici má v komplexní rovině vrcholy
2π
ei n k ,
kde k = 0, 1, . . . , n − 1, .
2π
Tedy n-úhelník umíme zkonstruovat právě tehdy, když je n-tý kořen z jedničky ω := ei n
konstruovatelné číslo. Q(ω) je cyklotomické těleso studované v kapitole 4.6. Jeho řád je
roven hodnotě Eulerovy funkce ϕ(n). Přímým důsledkem 10.14 je následující věta.
Věta 10.15. Necht’ lze pomocí pravítka a kružítka zkonstruovat pravidelný n-úhelník,
n ≥ 3. Pak ϕ(n) = 2r pro nějaké r ∈ N.
Popis čísel, pro které je hodnota Eulerovy funkce mocninou dvojky, nám poskytne nutnou podmínku na počet vrcholů n-úhelníka konstruovatelného podle pravítka a kružítka.
Věta 10.16. Necht’ n ∈ N. Pak ϕ(n) je mocninou dvojky právě tehdy, když n je mocnina
dvojky nebo
n = 2j Fk1 Fk2 . . . Fkm ,
kde j ∈ N0 a Fk1 , Fk2 , . . . , Fkm jsou navzájem různá Fermatova prvočísla.
140
(10.7)
Důkaz. Necht’ n = q1a1 q2a2 . . . qsas je rozklad n na prvočísla, tj. q1 , q2 , . . . , qs jsou různá
prvočísla a a1 , . . . , as ≥ 1. Hodnotu Eulerovy funkce lze určit podle vzorce
ϕ(n) = q1a1 −1 (q1 − 1)q2a2 −1 (q2 − 1) . . . qsas −1 (qs − 1) .
Když n = 2k , je ϕ(n) = 2k−1 . Když n je tvaru (10.7), jsou exponenty ai u všech lichých
¢¡
¢ ¡
¢
¡
prvočísel rovny 1, a proto ϕ(n) = 2j−1 Fk1 − 1 Fk2 − 1 . . . Fkm − 1 je mocnina dvojky.
`
(Připomeňme, že `-té Fermatovo číslo je definováno jako F` = 22 + 1.)
Pro důkaz obrácené implikace předpokládejme, že ϕ(n) = 2r . Tato rovnost vynucuje
pro prvočíslo qi ≥ 3 exponent ai = 1 a samotné prvočíslo je tvaru qi = 2ki + 1 pro nějaké
ki ∈ N. Jelikož snadno dokážeme, že číslo 2k + 1 je provčíslo, pouze když k je mocnina
dvojky, je nutně qi Fermatovo prvočíslo.
Tedy zkonstruovatelné n-úhelníky mají n tvaru (10.7). Dokázat platnost obrácené
implikace v Gaussově větě, bude složitější. Nejdříve uved’me jedno jednoduché pozorování.
Lemma 10.17. Necht’ s a t jsou nesoudělná přirozená čísla. Pokud lze zkonstruovat
pravidelný s-úhelník a t-úhelník, pak lze zkonstruovat i pravidelný (st)-úhelník.
Důkaz. Nesoudělnost s a t implikuje existenci čísel x, y ∈ Z takových, že sx + ty = 1, a
tedy
2iπ
³x
t
+
y´
1
= 2iπ
s
st
=⇒
y
x
1
e2iπ t e2iπ s = e2iπ st
Periodičnost exponenciály zaručuje, že najdeme k ∈ {0, 1, . . . , t − 1} a ` ∈ {0, 1, . . . , s − 1}
x
k
y
`
k
`
tak, aby platilo e2iπ t = e2iπ t a e2iπ s = e2iπ s . Protože e2iπ t a e2iπ s jsou vrcholy t resp.
1
s-úhelníka, a ty umíme zkonstruovat, umíme zkonstruovat i jejich součin e2iπ st . To je
vrchol pravidelného (st)-úhelníka.
Již v antice bylo známo, že lze zkonstruovat libovolný n-úhelník, kde n je tvaru
2j 3k 5` , pro j ∈ N0 , k, ` ∈ {0, 1}. Z pravidelného n-úhelníka lze totiž snadno zkonstruovat
pravidelný (2n)-úhelník. A protože Řekové uměli zkonstruovat rovnostranný trojúhelník,
čtverec a pravidelný pěti úhelník, předchozí pozorování jim umožňilo zkonstruovat libovolný n-úhelník, kde n je zmíněného tvaru.
Nám předchozí lemma říká, že pro důkaz Gaussovy věty stačí ukázat konstrukci
pravidelného n-úhelníka, kde n je Fermatovo prvočíslo. K tomu však potřebujeme složitější
matematický aparát.
141
2π
Věta 10.18. Necht’ p je Fermatovo prvočíslo. Označme p − 1 = 2r a ω = ei p . V grupě
Aut Q(ω) existuje posloupnost automorfizmů Id = γ0 , γ1 , . . . , γr a posloupnost podgrup
G0 ⊂ G1 ⊂ . . . ⊂ Gr taková, že G0 = {Id}, Gr = Aut Q(ω) a pro každé i = 1, 2, . . . , r
platí
Gi = hGi−1 , γi i
a
γi2 ∈ Gi−1 .
(10.8)
Důkaz. Podle Věty 4.40 je grupa Aut Q(ω) izomorfní s multiplikativní grupou tělesa Zp .
Proto stačí zkonsturovat grupy Gi a prvky γi s vlastností (10.8) v grupě Zp \ {0} s operací
násobení modulo p.
Využijeme toho, že multiplikativní grupa konečného tělesa je cyklická, tj. existuje
prvek x ∈ Zp \ {0} takový, že Zp \ {0} = {x, x2 , x3 , . . . , xp−1 = 1}. Stačí proto položit
Gi := hγ0 , γ1 , . . . , γi i ,
kde γi = x
p−1
2i
r−i
= x2
pro i = 0, 1, . . . r.
Věta 10.19. Necht’ p je Fermatovo prvočíslo. Pak lze pomocí pravítka a kružítka zkonstruovat pravidelný p-úhelník.
Důkaz. Využijeme tvrzení 10.13 a 10.18 a také jejich značení. Pro i = 0, 1, 2, . . . , r definujme tělesa
Ti := {x ∈ Q(ω) | γ(x) = x pro každé γ ∈ Gr−i } .
Snadno lze ověřit, že Ti jsou tělesa. Protože Gr−i = hGr−i−1 , γr−i i ⊃ Gr−i−1 , je Ti ⊂ Ti+1 .
Uvažujme x0 ∈ Ti+1 \ Ti , tj.
γr−i (x0 ) 6= x0
a γ(x0 ) = x0 pro každé γ ∈ Gr−i−1 .
(10.9)
Ukážeme však, že
A := x0 + γr−i (x0 ) ∈ Ti
a B := x0 .γr−i (x0 ) ∈ Ti .
Potřebujeme ověřit, že pro každé γ ∈ Gr−i−1 je γ(A) = A a navíc A = γr−i (A). Stejné
2
∈ Gr−i−1 a (10.9).
vlastnosti mají platit i pro B. Nejdříve využijeme faktu, že γr−i
¡
¢
2
(x0 ) = γr−i (x0 ) + x0 = A .
γr−i (A) = γr−i x0 + γr−i (x0 ) = γr−i (x0 ) + γr−i
Ted’ využijeme komutativity automorfizmů
¡
¢
¡
¢
¡
¢
γ(A) = γ x0 + γr−i (x0 ) = γ(x0 ) + γ γr−i (x0 ) = x0 + γr−i γ(x0 ) = x0 + γr−i (x0 ) = A .
142
Stejně ověříme, že B ∈ Ti . Protože x0 ∈
/ Ti+1 je kořenem kvadratické rovnice
¡
¢¡
¢
¡
¢
¡
¢
x − x0 x − γ(x0 ) = x2 − x0 + γ(x0 ) x + x0 .γ(x0 )
|
{z
}
| {z }
=A
=B
s koeficienty v Ti , podle Příkladu 2.34 platí [Ti (x0 ) : Ti ] = 2. Z inkluze Ti+1 ⊃ Ti (x0 )
plyne, [Ti+1 : Ti ] ≥ 2. Abychom mohli použít Větu 10.18, potřebujeme ukázat rovnost
[Ti+1 : Ti ] = 2, která je ekvivalentní s rovností Ti+1 = Ti (x0 ). K tomu využijeme tvrzení
2.26. Podle něj, z nerovností [Ti+1 : Ti ] ≥ 2, které platí pro každé i = 0, . . . , r − 1, plyne
[Tr : T0 ] ≥ 2r . Protože však Tr = Q(ω) a T0 = Q, je [Tr : T0 ] rovno řádu algebraického
čísla ω, a ten je 2r . Tedy nutně [Ti+1 : Ti ] = 2 pro každé i = 0, . . . , r − 1. Tím je důkaz
hotov.
Gaussova věta převedla otázku konstruovatelnosti pravidelného n-úhelníka na úlohu
popsat Fermatova prvočísla. Čísla Fn pro 0 ≤ n ≤ 4 jsou prvočísla a jsou to jediná známa
Fermatova prvočísla. Euler v roce 1732 ukázal, že číslo F5 není prvočíslo a zároveň našel
jeho rozklad na prvočísla F5 = 641 × 6700417. V roce 1855 Clausen ukázal, že číslo F6 je
složené, rozklad čísla F6 na prvočísla byl však nalezen až v roce 1970 s použitím počítače.
Dnes se ví, že Fn je složené číslo pro 5 ≤ n ≤ 32. Rozklad na prvočísla je znám u čísel Fn
pro 5 ≤ n ≤ 11. Nepodařilo se zatím ani dokázat ani vyvrátit existenci dalšího Fermatova
prvočísla.
10.4
Nekomutativní tělesa
Nejznámějším nekomutativním tělesem jsou kvaterniony. Popíšeme toto těleso v maticové
formě.
Uvažujme množinu matic
K :=
½³
¾
¯
α β ´
2×2 ¯
∈ C
¯ α, β ∈ C
−β α
spolu se standardním sčítaním a násobením v C2×2 . Snadno lze ověřit, že K je uzavřeno
na obě tyto operace.
Zřejmě je K s operací sčítaní komutativní grupa s neutrálním prvkem
Protože
³ 0 0 ´
.
0 0
³ α β ´
det
= αα + ββ ≥ 0 ,
−β α
je každá matice z K kromě matice ze samých nul regulární. Platí navíc
³ α β ´−1
³ α −β ´
1
=
∈ K.
−β α
β
α
αα + ββ
143
To ovšem znamená, že K bez neutrálního prvku je spolu s nasobením grupou. Tedy K je
těleso. Není však komutativní, protože např.
³ 0 1 ´³ i 0 ´ ³ i 0 ´³ 0 1 ´
6=
0 −i
−1 0
−1 0
0 −i
Prvek tělesa K je popsaán čtyřmi reálnými parametry, a to reálnými a imaginárními
složkami čísel α a β. Proto se prvkům tělesa K říká kvaterniony.
Pro reálné parametry x1 , x2 , x3 , x4 a y1 , y2 , y3 , y4 definujme
α := x1 − ix2 , β := −x3 − ix4 , γ := y1 + iy2 , δ := y3 + iy4 .
Uvažujme součin kvaternionů
³ α β ´³ γ δ ´ ³ αγ − βδ αδ + βγ ´
=
−δ γ
−β α
−αδ − βγ αγ − βδ
Ze vzorce pro determinant součinu matic plyne.
¡
¢¡
¢
¡
¡
¢ ¡
¢¡
¢
αα + ββ γγ + δδ = αγ − βδ) αγ − βδ + αδ + βγ αδ + βγ
Po dosazení za α, β, γ, δ dostaneme tzv. Eulerovu identitu, kterou využijeme při reprezentaci čísla jako součtu čtyř čtverců.
Lemma 10.20. Pro libovolná reálná čísla x1 , x2 , x3 , x4 a y1 , y2 , y3 , y4 platí
¡
¢¡
¢
¡
¢2
x21 + x22 + x23 + x24 y12 + y22 + y32 + y42 = x1 y1 + x2 y2 + x3 y3 + x4 y4 +
¡
¢2 ¡
¢2 ¡
¢2
+ x1 y2 − x2 y1 − x3 y4 + x4 y3 + x1 y3 − x3 y1 + x2 y4 − x4 y2 + x1 y4 − x4 y1 − x2 y3 + x3 y2
Kdybychom při konstrukci kvaternionů místo 4 reálých parametrů uvažovali pouze
ta α a β, která mají reálné a imaginární složky v Q, dostali bychom také těleso. To by
bylo nekomutativní a spočetné. Analogicky Q lze nahradit libovolným tělesem T ⊂ R a
konstrukci zopakovat. Pokaždé dostaneme nekomutativní těleso, které bude nekonečné.
Zkonstruovat konečné nekomutativní těleso se nám nepodaří. Toto tvrzení dokázal v roce
1905 Wedderburn. Elegantní důkaz, který uvádíme, však pochází od Ernsta Witta z roku
1931.
Věta 10.21. Každé konečné těleso je komutativní.
Důkaz. Větu dokážeme sporem. Necht’ F je konečné nekomutativní těleso. Označme
Cs := {x ∈ F | xs = sx}
144
pro každé s ∈ F .
Z definice tělesa plyne, že 0 ∈ Cs , 1 ∈ Cs ; dále −x ∈ Cs pro libovolné x ∈ Cs a x−1 ∈ Cs
pro libovolné x ∈ Cs , 0 6= x. Využitím distributivního zákona dostaneme pro x, y ∈ Cs
(x + y)s = xs + ys = sx + ys = s(x + y)
=⇒
x + y ∈ Cs ,
využitím asociativního zákona pak
(xy)s = x(ys) = x(sy) = (xs)y = (sx)y = s(xy)
=⇒
xy ∈ Cs .
Množina Cs je tedy podtělesem tělesa F a průnik
C :=
\
Cs
s∈F
je navíc komutativním podtělesem tělesa F . Poznamenejme, že dokonce každý prvek x ∈ C
komutuje s libovolným s ∈ F . Tato vlastnost by se dala použít na ekvivalentní zavedení
C. Uvažujme tělesa Cs a F jako vektorové prostory nad tělesem C. Když označíme
ns := dim Cs ,
n := dim F
a q := #C ,
tak z předpokladu nekomutativity tělesa F je
n > 1,
#Cs = q ns
a #F = q n .
(10.10)
Na mutliplikativní grupě F ∗ := F − {0} zavedeme relaci equivalence
r ∼ r0
⇐⇒
r0 = x−1 rx pro nějaké x ∈ F ∗
Protože nenulové prvky z C komutují s kaž’.ym x, tvoří jednoprvkové třídy ekvivalence.
Jelikož F není komutativní těleso, existují i více prvkové třídy ekvivalence, jejich reprezentatny označme x1 , . . . , xt a třídy Tx1 , . . . , Txt . Zřejmě
Txi = {x−1 xi x | x ∈ F ∗ }
Abychom určili, jak je velká třída Txi , zavedeme zobrazení f : F 7→ Txi předpisem
f (x) := x−1 xi x .
Snadnými úpravami dostaneme pro x, y ∈ F − {0}
f (x) = f (y)
⇔
x−1 xi x = y −1 xi y
⇔
145
yx−1 xi = xi yx−1
⇔
yx−1 ∈ Cxi
Tedy y má stejný obraz jako x, když y ∈ (Cxi − {0}) x, proto vzor každého prvku z
množiny Txi má #Cxi − 1 prvků. To znamená
#F ∗ = #Txi · (#Cxi − 1)
=⇒
#Txi =
qn − 1
.
q nxi − 1
Protože F ∗ je disjunktním sjednocením všech tříd ekvivalence platí
t
X
qn − 1
q − 1 = #C − 1 +
.
q nxi − 1
i=1
n
(10.11)
Z faktu, že zlomek vyjádřující počet prvků třídy Txi je celé číslo, odvodíme nejprve,
že nxi dělí n. Označme r zbytek po dělní čísla n číslem nxi , tj. n = knxi + r pro nějaké
k ∈ N a 0 ≤ r < nxi . Potom
qn − 1
Z 3 nx
q i −1
k−1
X
q r (q knxi − 1) + q r − 1
qr − 1
r
nxi `
+
=
=
q
(q
)
q nxi − 1
q nxi − 1
`=0
{z
}
|
∈ Z
Jelikož 0 ≤ r < nxi , je 0 ≤
q r −1
q nxi −1
< 1. Z celočíselnosti tohoto zlomku pak plyne, že
r = 0, a tedy n je dělitelné číslem nxi .
Dopracovat se k závěrečnému sporu nám pomohou cyklotomické polynomy Φ` (x), viz
kapitolu 3.3. Jejich vlastnosti nám umožňují úpravu
xn − 1 =
Y
Φd (x) = Φn (x)
Y
Φd (x)
d|nxi
d|n
|
{z
= xnxi −1
}
Y
Φd (x)
(10.12)
d-nxi
d|n, d<n
Důležitou roli při úpravách hrála dělitelnost čísla n číslem nxi . Dosad’me do (10.12) za
proměnnou x = q počet prvků podtělesa C. Cyklotomické polynomy mají celočíselné
koeficienty, proto i hodnoty Φ` (q) jsou celočíselné. Dostaneme, že číslo q n − 1 i číslo
q n −1
q nxi −1
jsou dělitelné číslem Φn (q). Proto ze vztahu (10.11) plyne, že číslo #C − 1 = q − 1
je také dělitelné číslem Φn (q). Pro získání sporu ted’ už stačí ukázat, že |Φn (q)| > q − 1.
Podle definice cyklotomického polynomu je
Φn (x) =
Y
(x − ωnj ) ,
2π
kde ω = ei n .
j⊥n
1≤j<n
Ukážeme, že každý člen součinu po dosazení q je větší než q − 1:
Označme ωnj = a + ib. Jelikož |ωnj | = 1 = a2 + b2 a ωnj 6= 1, je reálná složka a < 1. Upravme
|q − ωnj |2 = |q − a − ib|2 = (q − a)2 + b2 = q 2 − 2qa + 1 > q 2 − 2q + 1 = (q − 1)2 .
146
Celkově dostaneme slíbený spor
|Φn (q)| =
Y
(x − ωnj ) > |q − 1| ,
j⊥n
1≤j<n
protože n > 1, viz (10.10), implikuje, že součin definující Φn (x) má alespoň jeden člen.
147
Literatura
[1] M. Aigner, G. M. Ziegler, Proofs from The Book, Third edition. Springer-Verlag,
Berlin, 2004.
[2] E. B. Burger, Exploring the Number Jungle: An Interactive Journey into Diophantine
Analysis, AMS Student Mathematical Library Series, Providence, 2000.
[3] E. B. Burger, R. Tubbs, Making transcendence transparent. An intuitive approach to
classical transcendental number theory, Springer-Verlag, New York, 2004.
[4] R. Chapman, Algebraic Number Theory – summary of notes,
http://www.secamlocal.ex.ac.uk/people/staff/rjchapma/notes/ant2.pdf
[5] P.Erdös, J. Surányi, Topics in the Theory of Numbers, Springer-Verlag, 2001.
[6] M. Filaseta, Algebraic Number Theory – instructor’s notes,
http://www.math.sc.edu/~filaseta/gradcourses/TheMath784Notes.pdf
[7] R. K. Guy, Unsolved problems in number theory, Third edition. Problem Books in
Mathematics. Springer-Verlag, New York, 2004.
[8] D. Hensley, Continued fractions, World Scientific, Hackensack, NJ, 2006.
[9] M. Klazar, Kaleidoskop teorie čísel, KAM-DIMATIA Series, UK, 2000.
[10] V. Kořínek Základy algebry, NČSAV, Praha, 1956.
[11] M. Křížek, F. Luca, L. Somer, 17 Lectures on Fermat Numbers: From Number Theory
to Geometry, CMS Books in Mathematics, vol. 9, Springer-Verlag, New York, 2001.
[12] J. Mareš, Algebra (Úvod do obecné algebry), 3. vyd. ČVUT, Praha, 1998.
[13] J. S. Milne, Algebraic Number Theory,
http://www.jmilne.org/math/CourseNotes/ANT301.pdf
148
[14] M. B. Nathanson, Elementary methods in number theory, volume 195 of Graduate
Texts in Mathematics. Springer-Verlag, New York, 2000.
[15] P. Ribenboim, Classical Theory of Algebraic Numbers, Springer-Verlag, 2001.
[16] T. Šalát, Reálne čísla, Alfa, Bratislava, 1982.
[17] G. Tenenbaum, M. Mendès France, The prime numbers and their distribution, AMS
Student Mathematical Library Series, Providence, RI, 2000.
149

Podobné dokumenty