Zde - Ústav matematiky

Transkript

Zde - Ústav matematiky
Matematika 2
Prof. RNDr. Jan Chvalina, DrSc.
RNDr. Zdeněk Svoboda, CSc.
RNDr. Michal Novák, Ph.D.
ÚSTAV MATEMATIKY
Matematika 2
1
Obsah
1 Funkce více proměnných
1.1 Definice a základní pojmy . . . . . .
1.2 Bodové množiny . . . . . . . . . . . .
1.3 Limita, spojitost . . . . . . . . . . .
1.4 Parciální derivace, derivace ve směru
1.5 Diferenciál funkce . . . . . . . . . . .
1.6 Některé aplikace pro řešení rovnic . .
1.7 Cvičení . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
3
. 3
. 6
. 6
. 9
. 12
. 14
. 16
2 Obyčejné diferenciální rovnice
2.1 Základní pojmy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2 Lineární diferenciální rovnice . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2.1 Nalezení obecného řešení homogenní lineární diferenciální rovnice s
konstantními koeficienty . . . . . . . . . . . . . . . . . . . . . . . .
2.2.2 Nalezení obecného řešení nehomogenní lineární diferenciální rovnice
2.3 Systémy diferenciálních rovnic . . . . . . . . . . . . . . . . . . . . . . . . .
2.4 Poznámka o stabilitě . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
19
19
21
23
25
27
31
3 Diferenční rovnice
33
3.1 Základní pojmy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.2 Lineární diferenční rovnice s konstantními koeficienty . . . . . . . . . . . . 35
4 Funkce komplexní proměnné
4.1 Základní pojmy . . . . . . . . . . . . . . . . . . . . . . .
4.2 Limita, spojitost a derivace . . . . . . . . . . . . . . . .
4.3 Elementární funkce komplexní proměnné . . . . . . . . .
4.4 Integrál funkce komplexní proměnné . . . . . . . . . . .
4.5 Řady v komplexním oboru a jejich využití při integrování
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
37
37
38
40
43
47
5 Integrální transformace
5.1 Matematický aparát pro signály . . . . . . . . . . . . . . .
5.1.1 Diracova zobecněná funkce δ(t), zobecněná derivace
5.1.2 Periodické a harmonické funkce . . . . . . . . . . .
5.1.3 Fourierovy trigonometrické řady . . . . . . . . . . .
5.1.4 Fourierův integrál . . . . . . . . . . . . . . . . . . .
5.2 Fourierova transfomace . . . . . . . . . . . . . . . . . . . .
5.2.1 Užití Fourierovy transformace . . . . . . . . . . . .
5.2.2 Slovník Fourierovy transformace . . . . . . . . . . .
5.3 Laplaceova transformace . . . . . . . . . . . . . . . . . . .
5.3.1 Zpětná Laplaceova transformace . . . . . . . . . . .
5.3.2 Užití Laplaceovy transformace k řešení rovnic . . .
5.3.3 Slovník Laplaceovy transformace . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
51
51
51
56
57
62
63
65
69
70
76
80
84
2
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
5.4
Cvičení . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
6 Z transformace
6.1 Souvislost Z a Laplaceovy transformace
6.2 Zpětná Z transformace . . . . . . . . .
6.2.1 Předmět k racionální funkci . . .
6.3 Řešení diferenčních a rekurentních rovnic
6.3.1 Cvičení . . . . . . . . . . . . . .
. . . .
. . . .
. . . .
. . .
. . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
7 Signály
7.1 Pojem signálu . . . . . . . . . . . . . . . . . . . . . . .
7.1.1 Zavedení pojmu a klasifikace signálu . . . . . .
7.2 Signály se spojitým časem . . . . . . . . . . . . . . . .
7.3 Periodické signály, harmonické signály a jejich spektra .
7.4 Aperiodické signály, spektrum signálu . . . . . . . . . .
7.5 Diskretní signály. . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
8 Systémy
8.1 Zavedení pojmu a klasifikace . . . . . . . . . . . . . . . . . . . . . . . .
8.2 Matematický model systému se spojitým časem . . . . . . . . . . . . .
8.3 Řešení vstupně-výstupní rovnice Laplaceovou transformací . . . . . . .
8.4 Impulsní a frekvenční charakteristika . . . . . . . . . . . . . . . . . . .
8.5 Vazby mezi systémy — sériové, paralelní spojení systémů, zpětná vazba
8.5.1 Sériové spojení . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.5.2 Paralelní spojení . . . . . . . . . . . . . . . . . . . . . . . . . .
8.5.3 Zpětnovazební (antiparalelní) spojení . . . . . . . . . . . . . . .
8.6 Matematický model systému se spojitým časem . . . . . . . . . . . . .
8.7 Stabilita spojitých systémů . . . . . . . . . . . . . . . . . . . . . . . . .
8.7.1 Hodnocení stability systému podle vnějšího projevu . . . . . . .
8.7.2 Stabilita ve smyslu Ljapunova . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
89
94
94
94
96
98
.
.
.
.
.
.
.
.
.
.
.
.
99
99
99
103
103
107
113
.
.
.
.
.
.
.
.
.
.
.
.
119
. 119
. 126
. 126
. 128
. 131
. 131
. 132
. 133
. 136
. 145
. 145
. 150
.
.
.
.
.
Kapitola 1
Funkce více proměnných
V této kapitole se stručně seznámíme se základními pojmy, které se týkají funkcí více
proměnných a jsou nezbytné pro výklad dalších tematických celků probíraných v rámci
předmětu AMA 2. To znamená, že i náplň kapitoly je tak poznamenána a neobsahuje
proto i některé standardně probírané pasáže a řešení některých typických příkladů. Dalším
omezením je zaměření se zejména při geometrických interpretacích na funkce pouze dvou
proměnných. Toto je motivováno zachováním názornosti, neboť při tomto omezení budou
naše úvahy probíhat v trojrozměrném Euklidovském prostoru.
1.1
Definice a základní pojmy
Definice 1 Reálnou funkcí n reálných proměnných rozumíme zobrazení f množiny D(f )
na množinu H(f ), tj. f : D(f ) → H(f ), kde D(f ) ⊆ Rn nazýváme definičním oborem a H(f ) ⊂ R oborem hodnot funkce f . Funkci obvykle zapisujeme ve tvaru y =
f (x1 , x2 , ..., xn ) nebo zkráceně f (x1 , ..., xn ). V případě funkce dvou proměnných resp. tří
proměnných obvykle preferujeme zápis z = f (x, y) resp. u = f (x, y, z).
Příklady takovýchto funkcí mohou být známé jednoduché vzorce. Objem V rotačního
válce je funkcí poloměru R podstavy a výšky v, což zapíšeme
V = V (R, v) = π · R2 · v.
Analogicky objem V komolého rotačního kužele je funkcí tří proměnných výšky v a poloměrů R, r jeho spodní a horní podstavy, což zapíšeme
V = V (R, v, r) =
π·v
R2 + Rr + r2 .
3
Funkci dvou proměnných z = f (x, y) obvykle znázorňujeme pomocí grafu jako množinu
bodů [x, y, f (x, y)] v Euklidovském prostoru dimenze 3 (E 3 ). Pro grafické znázornění využíváme často tzv. metodu rovinných řezů. Speciálním případem těchto křivek jsou vrstevnice, což jsou průsečnice grafu funkce s rovinami typu z = z0 . Interpretujeme-li zemský
povrch lokálně jako funkci dvou proměnných, kdy dvojici čísel, chápaných jako zeměpisná
3
4
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
šířka a délka bodu zemského povrchu, přiřadíme jeho nadmořskou výšku, je takto zavedená křivka vrstevnicí na mapě. Pro funkce n proměnných definujeme hladinu funkce y =
f (x1 , x2 , ..., xn ) na úrovni c ∈ R jako množinu bodů {[x1 , ..., xn ] ∈ D(f )|f (x1 , ..., xn ) = c}.
V následujících obrazcích je pro výše uvedenou funkci objemu rotačního válce v závislosti
na poloměru podstavy R ∈ [0, 2] a výšky tělesa v ∈ [0, 2] znázorněn graf a vrstevnice:
Obr. 1.1.1: :Graf a vrstevnice funkce objemu rotačního válce v závislosti na poloměru a
výšce.
Poznamenejme, že volba intervalů R ∈ [0, 2], v ∈ [0, 2] nezávisle proměnných byla
dána rozhodnutím autorů. Pokud není součástí zadání funkce stanovení definičního oboru
D(f ), např. u zmíněného příkladu je vhodné požadovat D(f ) = [0, ∞) × [0, ∞) ve shodě
s geometrickým významem proměnných R, v, má se za to, že jím je maximálně přípustná
množina. Nalezení D(f ) a vymezení oboru hodnot je H(f ) a vrstevnic je typickým příkladem.
Dalším důležitým pojmem je zobrazení z Rn do Rm
Definice 2 Nechť je definnována m-tice fi funkcí n reálných proměnných
yi = fi (x1 , . . . , xn ) pro i = 1, . . . , m s definičním oborem D(F ) ⊆ Rn . Tuto mtici nazveme zobrazením z Rn do Rm a funkce fi (X) nazveme jeho složkami a zapisujeme
je
Y = (y1 , . . . , ym ) = F (X) = (f1 (X), . . . , fm (X))
(1.1.1)
Množinu všech bodů Y ∈ Rm takových, že existuje bod X ∈ D(F ), pro který platí Y =
F (X) nazveme oborem hodnot zobrazení F a zapisujeme jej H(F ) = {Y ∈ Rm |∃X ∈
D(F ) takové, že Y = F (X)}
Je-li k = m, můžeme si takové zobrazení představit jako přemísťování bodů v krozměrném prostoru neboli jeho transformaci.
Matematika 2
5
Příklad 1 V matematice se často používá transformace do polárních souřadnic, která je
definována vztahy:
x = ρ cos ϕ
y = ρ sin ϕ.
p
Pro bod (x, y) ∈ R2 roviny, veličina ρ = x2 + y 2 značí vzdálenost bodu (x, y) od počátku
- pólu a ϕ značí úhel - azimut, který svírá vektor s počátečním bodem v pólu a koncovým
bodem (x, y) (polohový vektor), který můžeme určit ze vztahu tg ϕ = y/x.
Příklad 2 V třídimenzionálním prostoru se používají souřadnice
• cylindrické - válcové
x = ρ cos ϕ
y = ρ sin ϕ
z = z,
které se takto nazývají, neboť kvádru v proměnných ρ, ϕ, z odpovídá válec nebo jeho
část v proměnných x, y , z.
• sférické - kulové
x = ρ cos ϕ sin ψ
y = ρ sin ϕ sin ψ
z = ρ cos ψ,
které se takto nazývají, neboť kvádru v proměnných ρ, ϕ, ψ odpovídá koule nebo její
výseč v proměnných x, y , z. Geometrický význam veličin je:
– ρ je vzdálenost bodu (x, y, z) od počátku
– ϕ je úhel, který svírá průmět polohového vektoru do půdorysny (rovina obsahující osy x, y) s kladným směrem osy x.
– ψ je úhel, který svírá polohový vektor s kladným směrem osy z
Pro funkce resp. zobrazení, které mají neprázdný průnik definičních oborů, zavádíme
analogicky jako u funkce jedné reálné proměnné algebraické operace, což jsou funkce definované na tomto průniku vztahy:
(f ± g)(X) = f (X) ± g(X)),
α f (X) = α · f (X), α ∈ R
f (X)
f
(X) =
, je-li g(X) 6= 0,
(f g(X)) = f (X) · g(X),
g
g(X)
Při operaci skládání funkcí více proměnných resp. zobrazení je situace složitější. Situaci
popíšeme pro zobrazení neboť funkce více proměnných je speciální případ.
Uvažujme dvě zobrazení Y = F (Z), Z = G(x) takové, že platí H(G) ⊆ D(f ) potom
zobrazení přiřazující každému X ∈ D(G) bod Y ∈ H(F ) předpisem Y = F (G(X))
nazveme složeným zobrazením. Poznamenejme, že bod Z musí ležet současně v oboru
hodnot zobrazení G, které nazýváme vnitřním, a v definičním oboru zobrazení F , které
nazýváme vnějším, to znamená, že počet složek vnitřního zobrazení musí být stejný jako
dimenze definičního oboru vnějšího zobrazení.
6
1.2
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
Bodové množiny
Při studiu „lokálních“ vlastností funkcí více proměnných je vhodné zavést některé pojmy
popisující vlastnosti podmnožin v Rn . Základním pojmem jevzdálenost dvou bodů :
p
v(X, Y ) = v([x1 , ..., xn ], [y1 , ..., yn ]) = (x1 − y1 )2 + .. + (xn − yn )2 .
δ−okolím bodu X0 nazýváme množinu U (X0 , δ) = {X ∈ Rn |v(X, X0 ) < δ}, případně
redukovanýmδ-okolím bodu X0 nazýváme množinu U ∗ (X0 , δ) = {X ∈ Rn |0 < v(X, X0 ) <
δ}. Dále řekneme, že bod X0 je vnitřním bodem množiny A, jestliže existuje δtakové,že
U (X0 , δ) ⊂ A , dále jej nazveme hromadným bodem množiny A, jestliže v každém redukovaném δ-okolím bodu X0 , existuje bod X1 takový, že X1 ∈ A, nazveme jej hraničním
bodem množiny A, jestliže v každém δ-okolím bodu X0 , existují body X1 , X2 takové,
že X1 ∈ A a současně X2 ∈
/ A a konečně X0 nazveme bodem uzávěru A množiny A,
jestliže pro každé δ-okolí bodu X0 platí, že U (X0 , δ) ∩ A 6= ∅. Množinu A nazveme otevřenou množinou, jestliže každý její bod je vnitřním bodem množiny, nazveme uzavřenou,
jestliže A ⊆ A. Hranicí ∂A množiny A nazveme množinu všech jejích hraničních bodů.
1.3
Limita, spojitost
Při zavádění pojmů limity a spojitosti postupujeme analogicky jako u funkce jedné proměnné. Řekneme, že funkce f (X)má v bodě A, který je hromadným bodem D(f ), limitu
L, jestliže
∀U (L) ∃U ∗ (A) : ( f (U ∗ (A)) ⊂ U (L) ),
tj. ke každému ε > 0, existuje δ > 0 takové, že pro každý bod X ∈ U ∗ (A, δ) platí
f (X) ∈ U (L, ε), což zapisujeme lim f (X) = L.
X→A
Je vhodné si uvědomit, pro funkci více proměnných je limitou číslo a pro zobrazení
z Rn do Rm je limitou m-tice čísel. jako u funkce jedné proměnné, lze z definice limity
přímo dokázat mnohá tvrzení. Například f (X) má v bodě A nejvýše jednu limitu.
Pro algebraické operace funkcí platí následující rovnosti, přičemž z existence výrazů
vpravo plyne existence výrazů vlevo:
lim (f (X) + g(X)) = lim f (X) + lim g(X),
X→A
X→A
X→A
(1.3.1)
α∈R
(1.3.2)
lim (f (X) g(X)) = lim f (X) lim g(X),
(1.3.3)
lim αf (X) = α lim f (X),
X→A
X→A
X→A
X→A
X→A
lim f (X)
f (X)
= X→A
,
X→A g(X)
lim g(X)
lim
je-li lim g(X) 6= 0
X→A
(1.3.4)
X→A
Řekneme, že funkce f (X) resp. zobrazení je spojité v bodě A, pro který A ∈ D(f ), jestliže
má v tomto bodě limitu a platí
lim f (X) = f (A).
X→A
Matematika 2
7
Poznamenejme, že vzhledem existenci limit funkcí, které jsou výsledky s algebraickými
operacemi s funkcemi majících limitu, platí také, že výsledekem algebraické operace se
spojitými funkcemi je spojitá funkce. Pro složenou funkci resp. zobrazení platí:
Existuje-li kompozice F (G(X)), lim G(X) = B a navíc je zobrazení F spojité v bodě
X→A
b, potom také
lim F (G(X)) = F (B).
X→A
Tato věta spolu s předcházející poznámkou umožňuje tvrdit: elementární funkce jsou
spojité tam kde jsou definované, přičemž za elementární funkce považujeme mocninou
funkci, funkce goniometrické, exponenciální, hyperbolické dále funkce k nim inverzní a
funkce, které vznikly konečným počtem algebraických operací a operací skládání z těchto
funkcí. Podobně řekneme, že zobrazení je elementární, jsou-li elementární všechny jeho
složky. Tato skutečnost je podstatná při stanovení postupu při výpočtu limity, kdy
nejdříve u „školních příkladů“ zkusíme vypočíst hodnotu zobrazení v bodě, v němž
zjišťujeme limitu, a existuje-li tato funkční hodnota potom existuje i limita a jsou si
rovny.
Příklad 3 Vypočtěte limitu zobrazení z R3 do R2 :
!
p
x3 + y 2 − z
,x + y + z =
lim
(x,y,z)→(2,−3,1)
x + y ln z
!
p
23 + (−3)2 − 1
, 2 − 3 + 1 = (2, 0)
2 − 3 ln 1
Zobrazení má limitu mám limitu (je spojité), právě když mají limitu (jsou spojité)
všechny složky tohoto zobrazení. Proto se v další zaměříme pouze na existenci limit funkce
více proměnných.
V úvahách o existenci limit funkce více proměnných je vhodné užívat speciálního
pojmu limity funkce f (x) vzhledem k množině.
Definice 3 Řekneme, že funkce f (X)má v bodě A, který je hromadným bodem D(f ),
limitu L vzhledem k množině M , pro níž M ⊆ D(f ) a navíc je bod A jejím hromadným
bodem, jestliže
∀U (b) ∃U ∗ (A) : ( f (U ∗ (A) ∩ M ) ⊂ U (b) ),
tj. ke každému ε > 0, existuje δ > 0 tak, že pro každý bod X ∈ U ∗ (A, δ) ∩ M platí
f (X) ∈ U (L, ε), což zapisujeme lim f (X) = L.
X→A
X∈M
Z existence lim f (X) = L, plyne pro každou podmnožinu M ⊂ D(f ), jejímž hromadným
X→A
bodem je bod A také existence
lim f (X) = lim f (X).
X→A
X∈M
X→A
Speciální volbou množiny M = {(x1 (t), ..., xn (t))|t ∈ I}, kde xi (t) jsou spojité funkce a
existuje t0 ∈ I tak, že platí A = (x1 (t0 ), ..., xn (t0 )]), je možné při výpočtu limity funkce
8
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
více proměnných vzhledem k množině M využít postupů výpočtu limit neurčitých výrazů
pro funkci jedné proměnné. Platí:
lim f (X) = lim f (x1 (t), ..., xn (t)).
t→a
X→A
X∈M
Tato skutečnost se s výhodou použije při dokazování neexistence limity. Viz. následující
ukázka.
Příklad 4 Vypočtěte limitu
2xy
lim
2
2.
(x,y)→(0,0) x +y
Vyšetříme všechny limity vzhledem k přímkám pk procházejícím počátkem y = kx.
Potom platí
lim
2xy
2xy
xkx
2k
= lim
= lim 2
=
2
2
2
2
2
x→0 x + k x
(x,y)→[0,0] x + y
+y
1 + k2
(x,y)→(0,0) x2
(x,y)∈pk
. Protože hodnota limity v bodě [0, 0] vzhledem k přímce pk závisí na volbě k, tedy je pro
různá k odlišná, vyšetřovaná limita neexistuje.
Viz. následující obrázek
Obr. 1.3.2: :Graf uvedené funkce s průsečniceni s rovinami y = kx.
V uvedené ukázce je poměrně snadno ukázáno, že limita neexistuje. Pro opačný výsledek, že limita existuje, je třeba ukázat, že po všech křivkách má limita vzhledem k této
křivce stejnou hodnotu. Ověřit tuto skutečnost pouze pro určitou třídu křivek (např.
přímek) nestačí.
Obecně při výpočtu limity je nutné vycházet z definice limity a pracovat s okolími. V
případě funkce dvou proměnných je možné okolí bodu [x0 , y0 ] vhodně popsat pomocí tzv.
polárních souřadnic ve tvaru
x = x0 + ρ cos ϕ,
y = y0 + ρ sin ϕ,
Matematika 2
9
kdy bod [x0 , y0 ] nazýváme pólem. Výhodou tohoto popisu je, že potom limitní přechod
[x, y] → [x0 , y0 ] lze nahradit limitním přechodem ρ → 0. Uvedený postup ilustruje následující ukázka.
Příklad 5 Vypočtěte limitu
1−cos2 (x2 +y 2 )
(x2 +y 2 )2
(x,y)→(0,0)
lim
.
Protože v tomto případě funkční hodnota neexistuje (po dosazení je ve jmenovateli 0),
použijeme transformaci do polárních souřadnic. Po nahrazení proměnných x, y má funkce
tvar:
1 − cos2 (ρ2 )
1 − cos2 (x2 + y 2 )
=
,
ρ4
(x2 + y 2 )2
proto výpočet uvedené limity nahradíme výpočtem limity funkce jedné proměnné a při
výpočtu můžeme použít aparát funkce jedné proměnné, v tomto případě L’Hospitalovo
pravidlo.
2 (x2 +y 2 )
1−cos2 (ρ2 )
4ρ sin(ρ2 ) cos(ρ2 )
=
lim
=
lim
lim 1−cos
2
4
2
2
ρ
4ρ3
(x +y )
ρ→0
ρ→0
(x,y)→(0,0)
.
2
)
= lim sin(ρ
· lim cos(ρ2 ) = 1
ρ2
ρ→0
ρ→0
Poznamenejme, že v případě kdy výsledek závisí na ϕ limita neexistuje viz. ukázka 2.2.
Dále je nutné uvědomit si, že limitní přechod pro ρ → 0 musí obecně zohlednit i možnou
závislost ϕ(ρ), viz ukázka 2.3. Analogicky lze postupovat i u limity funkce 3 proměnných
s využitím sférických souřadnic.
1.4
Parciální derivace, derivace ve směru
Pro funkce více proměnných se zavádí pojem parciální derivace, který využívá pojem
derivace funkce jedné proměnné.
Definice 4 Parciální derivací funkce y = f (x1 , x2 , ..., xn ) v bodě A = (a1 , ..., an ) podle
proměnné xi rozumíme derivací funkce jedné proměnné y(x) = f (a1 , .., ai−1 , x, ai+1 , ..., an )
v bodě ai . Tuto derivaci zapisujeme dvěma možnými způsoby:
fx0 i (A)
nebo
∂f
(A).
∂xi
Tedy všechny proměnné kromě proměnné xi „zafixujeme“,tj. nazíráme na ně při derivování
jako na konstanty a derivujeme pouze podle proměnné xi . Pro grafické vyjádření pojmu
parciální derivace se omezíme pouze na funkce dvou proměnných v bodě [x0 , y0 ]. V tomto
případě „zafixování“ proměnné x, resp. y značí omezit se na rovinu x = x0 , resp. y = y0 .
Potom ve shodě s geometrickým významem derivace funkce jedné proměnné je derivace
fx0 (x0 , y0 ) rovna směrnici tečny v bodě [x0 , y0 ] k průsečnici funkce f (x, y) s rovinou x = x0 .
Analogické úvahy platí i pro fy0 (x0 , y0 ). Situace je znázorněna na následujícím obrázku
Jestliže funkce y = f (X) má definovanou parciální derivaci podle proměnné xi v každém bodě množiny M,je funkce přiřazující každému bodu této množiny hodnotu této
parciální derivace nazývána parciální derivací funkce y = f (X) podle proměnné xi , což
10
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
Obr. 1.4.3: :Graf uvedené funkce s průsečniceni s rovinami y = kx.
Matematika 2
11
∂f
zapisujeme fx0 i (X) nebo ∂x
(X). Jedná se o funkci n proměnných, pro niž jsou studovány
i
další vlastnosti např. spojitost.
Zobecněním pojmu parciální derivace je derivace ve směru vektoru ~s.
Definice 5 Derivací funkce y = f (X) v bodě A = [a1 , ..., an ] ve směru ~s = (s1 , ..., sn )
rozumíme derivaci funkce jedné proměnné
y(t) =
f (a1 + ts1 , ..., an + tsn )
pro t =, 0
|(s1 , ..., sn )|
což zapisujeme f~s0 (A).
Volíme-li vektor ~s = (0, .., 1, .., 0) tvořený nulami s výjimkou i-té pozice (kde je 1), derivace
funkce y = f (X) v bodě A ve směru ~s = (0, .., 1, .., 0) je rovna parciální derivaci funkce
y = f (X) v bodě A podle proměnné xi . Abychom uvedli i souvislost parciálních derivací
s derivací ve směru, je vhodné zavést pojem gradientu funkce y = f (X).
Definice 6 Jestliže má funkce y = f (X) parciální derivace v bodě A podle všech proměnných xi , řekneme, že funkce y = f (X) má v bodě A gradient grad f , který je roven
vektoru parciálních derivací v tomto bodě podle jednotlivých proměnných:
∂f
∂f
(A), ...,
(A) .
grad f (A) =
∂ x1
∂ xn
Existuje-li nějaké okolí bodu A, v němž má funkce y = f (X) spojité parciální derivace
podle všech proměnných xi , potom pro libovolný vektor ~s = (s1 , ..., sn ) existuje derivace
funkce y = f (X)ve směru ~s a platí:
f~s0 (A) =
∂f
s1
∂f
sn
grad f (A) · ~s
=
(A) + ... +
(A) ,
|~s|
∂ x1
|~s|
∂ xn
|~s|
kde výraz grad f (A) · ~s označuje skalární součin těchto vektorů. Poznamenejme, že pro
vektor ~ss opačnou orientací dostáváme výraz s opačným znaménkem a hodnota směrové
derivace f~s0 (A) nezávisí na velikosti |~s| vektoru ~s. Z vlastností skalárního součinu plyne
fakt, že největší hodnoty nabývá f~s0 (A) pro vektor grad f . Gradient funkce f je tedy
směrem největšího růstu funkce f . Jak jsme již výše uvedli, lze parciální derivace chápat
jako funkci více proměnných na množině M . Jestliže funkce f má na této množině parciální
∂f
derivaci ∂x
(X), která má v bodě A ∈ M parciální derivaci podle proměnné xi , nazveme
j
tuto parciální derivaci parciální derivací druhého řádu funkce f podle xj , xi :
∂f
∂f
2
∂xj
∂ f
00
fxj xi (A) =
(a1 , a2 , ..., an ) =
(a1 , a2 , ..., an ).
∂xj ∂xi
∂xi
Opakováním uvedeného postupu definujeme rekurentně i parciální derivace vyšších řádů.
Pro parciální derivace vyšších řádů platí tzv. Schwarzova věta o záměně pořadí derivování.
00
Nechť v nějakém okolí U (A)bodu Aexistují parciální derivace fx0 , fy0 a fxy
je spojitá
00
v bodě A. Potom existuje i smíšená parciální derivace fyx a platí:
00
00
fyx
= fxy
.
12
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
Závěrem uvedeme důležité diferenciální operátory. Pro jednoduchý
zápis gra∂
∂
~
dientu se používá symbolického vektoru nabla ∇ =
, ..., ∂xn , který nej∂x1
∂
∂
∂
~ =
častěji používáme pro dimenzi 3 proměnných tj. ∇
,
,
. Gradient
∂x ∂y ∂z ~ = ∂ , ..., ∂
grad f zapisujeme potom jako součin symbolického vektoru ∇
a skaláru
∂x1
∂xn
f : gradf (A) = ∂∂x1 , ..., ∂ ∂xn f (A).Dalším důležitým operátorem Laplaceův operátor,
který můžeme symbolicky vyjádřit:
2
2
~ 2 = ∂ + ... + ∂ ,
∆=∇
∂x21
∂x2n
~2=
který je nejčastěji používán pro dimenze 2 ,3 tj. ∆ = ∇
∂2
∂x2
2
∂
+ ∂y
2 nebo ∆ =
∂2
∂x2
2
∂
+ ∂y
2 +
∂2
.
∂z 2
1.5
Diferenciál funkce
Diferenciál funkce jedné proměnné vnímáme jako nahrazení funkce tečnou a jeho existence
je rovnocenná existenci derivace. Situace v případě funkcí více proměnných je komplikovanější, i když budeme postupovat formálně stejně.
Nechť je funkce y = f (X) definována v nějakém okolí bodu A. Nechť pro každé
H = (h1 , . . . , hn ) ∈ U (0) existují konstanty D1 , ..., Dn ∈ R a funkce τ (H), pro kterou
platí lim τ (H) = 0 a okolí U (A) bodu A tak, že v něm platí:
H→0
f (A + H) − f (A) =
n
X
q
Di hi + τ (H) h21 + ... + h2n ,
i=1
kde A + H označuje bod, který má souřadnice ve tvaru součtu odpovídajících souřadnic
bodů A a H. Potom řekneme, že funkce y = f (x1 , x2 , ..., xn )je bodě A = [a1 , ..., an ]
diferencovatelná nebo, že v tomto bodě má totální diferenciál.
Platí, že diferencovatelnost funkce y = f (X) zaručuje spojitost této funkce a také
existenci všech parciální derivací prvního řádu spolu se splněním rovnosti
∂f
(A) = Di pro i=1,. . . ,n.
∂xi
Proto zavádíme pojem diferenciálu. Nechť je funkce y = f (X) diferencovatelná v bodě
A. Potom totálním diferenciálem funkce f v bodě A s diferencemi hi nazýváme výraz
df (A) =
∂f
∂f
(A)h1 + . . . +
(A)hn .
∂x1
∂xn
∂f
Výrazy ∂x
(A)hi , pro i = 1, ..., n nazývámeparciálními diferenciály.
i
Při geometrické interpretaci se opět omezíme pouze na funkci dvou proměnných.
V tomto případě diferenciál funkce z = f(x,y) v bodě [x0 , y0 ]obvykle zapisujeme ve zkrácené podobě
dz =
∂f
∂f
(x0 , y0 )h1 + . . . +
(x0 , y0 )h2 = fx0 (x0 , y0 )dx + fy0 (x0 , y0 )dy .
∂x
∂y
Matematika 2
13
Vyjádříme-li diferenciály dx = x − x0 , dy = y − y0 , dz = z − z0 a dosadíme do výše
uvedené rovnice vznikne nám pro proměnné x, y, z lineární rovnice, která popisuje tečnou
rovinu k funkci z = f(x,y) v bodě [x0 , y0 ].
Ukázka 2.4:Napište rovnici tečné roviny a normálové (kolmé k tečné rovině) přímky
k funkci z = arctg xy v bodě T = [1, 1, ?].
Nejdříve vypočteme třetí souřadnici tečného bodu arctg 11 = π4 . Tedy T = [1, 1, π4 ]. Dále
vypočteme parciální derivace prvního řádu.
∂ arctg xy
− xy2
−y
=
2 = 2
y
∂x
x + y2
1+ x
1
∂ arctg xy
x
x
=
2 = 2
y
∂y
x + y2
1+ x
Nyní dosadíme do výše uvedeného vztahu:
z−
−1
1
π
= 2
(x − 1) + 2
(y − 1)
2
4
1 +1
1 + 12
⇔
x − y + 2z −
π
= 0.
2
Normálový vektor tečné roviny ~n = (1, −1, 2)je směrovým vektorem normálové přímky což
spolu se znalostí jednoho bodu normály (T) umožňuje napsat např. kanonickou rovnici
normálové přímky
y − π4
x−1
y+1
=
=
.
1
−1
2
Kromě popisu tečné roviny můžeme využít totálního diferenciálu k symbolickému
odvozování „vzorců“ pro parciální derivování složených funkcí.Uvažujme funkci
f (U ) = f (u1 , ..., um ) m proměnných jako vnější složku složeného zobrazení s m-ticí
vnitřních složek (..., ui = ui (x1 , ..., xn ), ...) = U (X) funkcí n proměnných. Poté
f (U (X)) = f (u1 , ..., um )(x1 , ..., xn ) = f (u1 (x1 , ..., xn ), ..., um (x1 , ..., xn )) označuje
složenou funkci více proměnných. Při zavedení symbolického vyjádření parciální derivace
df
∂f
= dx
, které je analogické s funkcí jedné proměnné, dostáváme:
∂xi
i
∂f
m
X
duj + ..
... + ∂u
∂f (U (X))
df (U )
∂f duj
∂f ∂uj
j
=
=
= ... +
+ ... =
.
∂xi
dxi
dxi
∂uj dxi
∂uj ∂xi
j=1
Podobně lze postupovat i u parciálních derivací vyšších řádů.
~ 2 z = ∂ 2 z2 + ∂ 2 z2 do polárních
Ukázka 2.5:Transformujte Laplaceův operátor ∆z = ∇
∂x
∂y
souřadnic.
Uvažujme neznámou funkci z=z(x,y) a polární souřadnice ve tvaru dvojice funkcí dvou
proměnnýchp
x = ρ cos ϕ, y = ρ sin ϕ. Inverzní závislost proměnných x,y,ρ, ϕje popsána
vztahy: ρ = x2 + y 2 , ϕ = arctg xy . Začneme pomocným výpočtem, který je přímým použitím vzorce uvedeného výše dostáváme:
−y
+ y2
+
y
x
+ zϕ0 2
zy0 = zρ0 ρ0y + zϕ0 ϕ0y = zρ0 p
.
x + y2
x2 + y 2
zx0 = zρ0 ρ0x + zϕ0 ϕ0x = zρ0 p
x
x2
y2
+ zϕ0
x2
Při výpočtu vyšší derivace postupujeme podle definice vyšší derivace:
14
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
∂ 2z
∂
=
2
∂x
∂x
−y
zρ0 p
+ zϕ0 2
x + y2
x2 + y 2
x
∂√
zρ0
x
x2 +y 2
∂x
zρ0 q
!
=
∂zρ0
x
p
+
∂x x2 + y 2
−y
+
∂ x2 +y2
∂zϕ0 −y
x2
−xy
00
0
00
p
=
z
+
z
+
z
+
ρρ
ϕ
ρϕ
∂x x2 + y 2
∂x
x2 + y 2
(x2 + y 2 )2
−xy
y2
2xy
00
00
p
+ zϕρ
=
+ zϕϕ
+ zϕ0
2
2
2
2 + y 2 )2
2 + y 2 )3
(x + y )
3
(x
(x
2
2
(x + y )
y2
00
zρρ
x2
y2
2xy
00
00
q
+
z
+
−
z
ϕϕ
ρϕ
x2 + y 2
(x2 + y 2 )2
(x2 + y 2 )3
zρ0 q
y2
(x2 + y 2 )3
+ zϕ0
2xy
(x2 + y 2 )2
Analogicky dostáváme i parciální derivaci:
∂ 2z
y2
2xy
x2
00
00
00
q
+
=
z
+
z
+
z
ρρ 2
ρϕ
ϕϕ
2 + y 2 )2
∂y 2
x + y2
3
(x
2
2
(x + y )
x2
2xy
zρ0 q
− zϕ0
2
(x + y 2 )2
(x2 + y 2 )3
Po dosazení do Laplaciánu a úpravě (ρ =
00
00
00
00
zxx
+ zyy
= zρρ
+ zϕϕ
x2
p
.
x2 + y 2 ) dostaneme:
1 00
1
1
1
00
+ zρ0 p
= zρρ
+ 2 zϕϕ
+ zρ0
2
2
2
+y
ρ
ρ
x +y
Dalším možným užitím diferenciálu je přibližný výpočet funkční hodnoty funkce více
proměnných.
1.6
Některé aplikace pro řešení rovnic
Uvažme jednoduchou rovnici x2 = y 2 . Řešení této rovnice můžeme popsat pomocí funkcí
jedné proměnné, a to dvěma způsoby y = ±x nebo y = ±|x|. Uvážíme-li toto řešení
pouze v okolí nějakého bodu, který je řešením dané rovnice je tato funkce lokálně určena
jednoznačně. Toto platí s výjimkou jediného bodu (0, 0). Obecně platí:
Nechť má funkce y = f (x1 , x2 , ..., xn ) v okolí bodu A = [a1 , ..., an ], pro který platí
f (A) = 0, spojité parciální derivace prvního řádu (je diferencovatelná ⇒ je spojitá v tomto
∂f
bodě). Jestliže ∂x
(A) 6= 0potom existuje funkce xi = g(x1 , .., xi−1 , xi+1 , .., xn ) taková , že
i
ai = g(a1 , .., ai−1 , ai+1 , .., an )a graf této funkce je řešením dané rovnice, tj.
f (x1 , .., xi−1 , g(x1 , .., xi−1 , xi+1 , .., xn ), xi+1 , .., xn ) = 0.
Matematika 2
15
Navíc má funkce xi = g(x1 , .., xi−1 , xi+1 , .., xn ) spojité parciální derivace prvního řádu v
nějakém okolí bodu [a1 , .., ai−1 , ai+1 , .., an ] (je spojitá) a platí
∂f
∂g
∂x
= − ∂fj pro j = 1, . . ., i − 1, i + 1, . . ., n.
∂xj
∂x
i
Poznamenejme, že rovnice f (x, y) = x2 + y 2 = 0 má jediný bod řešení, kdy v jeho okolí
nelze řešení popsat jako graf funkce jedné proměnné, je jím [0, 0]. Platí tu
fx0 (0, 0) = 0 = fy0 (0, 0). To potvrzuje z obrázku patrný fakt, že toto řešení nelze popsat
jako y = g(x) nebo x = g(y).
Obr. 1.6.4: :Graf uvedené funkce s průsečniceni s rovinami y = kx.
Nejjednodušším příkladem užití je případ jedné rovnice o dvou proměnných, který
v následující kapitole je v některých případech „výsledkem“ příkladu, kdy řešení diferenciální rovnice je dáno v tzv. implicitním tvaru, tj. je zadáno rovnicí. Geometrická inter-
16
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
pretace tohoto řešení je křivka ležící v rovině. Jestliže navíc je funkce f (x, y)levé strany
rovnice f (x, y) = 0 má spojité parciální derivace až do řádu n má i funkce y(x)daná
implicitně touto rovnicí má derivace až do řádu n. Tyto derivace můžeme určit z rovnic,
které vzniknou postupným derivováním dané rovnice s tím, že její levou stranu chápeme
jako složenou funkci f (x, y(x)).
Geometrickou interpretací řešení rovnice f (x, y, z) = 0 je plocha v prostoru. Existujíli parciální derivace prvního řádu potom existence nenulového vektoru (fx0 , fy0 , fz )je do−
statečnou podmínkou existence tečné roviny v bodě řešení této rovnice a vektor →
n =
0
0
(fx , fy , fz )je normálovým vektorem tj. je kolmý k tečné rovině. Uvažme množinu řešení
popsané dvěmi rovnicemi o třech neznámých f1 (x, y, z) = 0, f2 (x, y, z) = 0. Jestliže obě
rovnice mají za řešení plochy, ke kterým existují tečné roviny popsané nenulovými normálovými vektory ~n1 , ~n2 , které jsou lineárně nezávislé, mají tyto plochy průsečnici, která je
křivkou v prostoru a existuje je k ní tečna. Tečný vektor ~t k této křivce je kolmý k oběma
normálovým vektorům ~n1 , ~n2 a je možné jej určit jako vektorový součin ~t = ~n1 × ~n2 .
1.7
Cvičení
p
Cvičení 1 Určete definiční obor funkce z =
1 − ln(|x| + |y|)
p
.
x2 + y 2 − 1
p
Cvičení 2 Určete vrstevnici funkce z = x2 + y 2 + 2x − 2y + 2 procházející bodem X =
[2, 5] a tuto načrtněte.Vypočtěte gradient dané funkce v bodě a rozhodněte o jejich vzájemné relaci.
Cvičení 3 Ukažte, že funkce z = ϕ(x2 + y 2 ), kde ϕ je diferencovatelná funkce, vyhovuje
rovnici
∂z
∂z
y
−x
= 0.
∂x
∂y
Cvičení
4 Ukažte, že funkce zadaná implicitně rovnicí 4x4 − 4x2 + y 2 = 0 a bodem
√
[1/ 2, 1] má v tomto bodě lokální maximum.
Výsledky
1Definiční obor Df = {[x, y]|x2 + y 2 > 1, −e ≤ x ≤ e, |x| − e ≤ y ≤ e − |x|}
Matematika 2
17
p
2Vrstevnice je dána rovnicí z(2, 5) = 5 = x2 + y 2 + 2x − 2y + 2 nebo–li (x + 1)2 +
(y − 1)2 = 5 což je rovnice kružnice se středem S = [−1, 1] o poloměru 5. Gradient
grad f (2, 5) = (3/5, 4/5) je kolmý na vrstevnici.
3 Dosazením parciálních derivací zx0 = 2xϕ0 (x2 + y 2 ), zy0 = 2yϕ0 (x2 + y 2 ) ověříme platnost
rovnice.
4 Pro funkci F (x, y) = 4x4 − 4x2 + y 2 platí vztahy F (2, 5) = 0, Fy0 (2, 5) = 10 6= 0,
které zaručí existenci funkce dané implicitně. Formálním derivováním rovnice podle x, za
předpokladu, že y je funkce proměnné x dostaneme rovnici 16x3 − 8x + 2yy 0 = 0, ze které
vypočteme derivaci
8x − 16x3
y0 =
, tj. y 0 (2, 5) = 0.
2y
Opakovaným derivováním analogicky dostáváme rovnici 48x2 − 8 + 2(y 0 )2 + 2yy 00 = 0 a
tedy
8 − 48x2 − 2(y 0 )2
8
y 00 =
, tj. y 00 (2, 5) = − .
2y
5
18
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
Kapitola 2
Obyčejné diferenciální rovnice
2.1
Základní pojmy
Ze střední školy znáte pojem rovnice. Rovnicí jste rozuměli algebraickou rovnici, tj. rovnici, jejímiž koeficienty i řešením byla čísla, a o jiných typech rovnic jste nehovořili. Na
komplexní popis fyzikálních jevů však pojem algebraické rovnice nestačí.
Definice 2.1.1 Obyčejnou diferenciální rovnicí nazýváme rovnici, v níž se vyskytuje neznámá funkce jedné proměnné, a to včetně svých derivací. Nejčastěji ji zapisujeme ve
tvaru
y (n) = f (x, y, y 0 , . . . , y (n−1) ),
(2.1.1)
kde f (x, z0 , z1 , . . . , zn−1 ) je funkce n + 1 proměnných definovaná na otevřené množině
Ω ⊂ Rn+1 a n ∈ N.1 Řádem obyčejné diferenciální rovnice nazýváme nejvyšší řád derivace
neznámé funkce, která se v dané rovnici vyskytuje.
Příklad 2.1.1 Příklady obyčejných diferenciálních rovnic různých řádů:
1. y 0 + 2y = cos x je obyčejnou diferenciální rovnicí prvního řádu,
2. y 00 + y 4 y 0 + 3y = x je obyčejnou diferenciální rovnicí druhého řádu,
3. 3y (8) + sin xy 000 + 5 ln xy 00 − y 10 y 0 = 0 je obyčejnou diferenciální rovnicí osmého řádu.
Pojem řešení diferenciální rovnice má na rozdíl od algebraických rovnic několik významů.
Příklad 2.1.2 Různé typy řešení diferenciální rovnice:
Mějme dánu rovnici y 0 = y. Je zřejmé, že funkcí, která se rovná své první derivaci, je
funkce y = ex . Není však jediná, tutéž vlastnost má funkce y = 2ex , y = 3ex , resp.
libovolná funkce y = cex , kde c ∈ R.
Tento tvar zápisu nazýváme explicitní. Je-li rovnice ve tvaru F (x, y, y 0 , . . . y (n) ) = 0, kde
F (x, z0 , z1 , . . . , zn ) je funkce n + 2 proměnných definovaná na otevřené množině Ω ⊂ Rn+2 a n ∈ N,
hovoříme o rovnici v implicitním tvaru.
1
19
20
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
Definice 2.1.2 Řešením obyčejné diferenciální rovnice řádu n na intervalu I nazýváme
každou n−krát diferencovatelnou funkci na intervalu I, která vyhovuje dané rovnici. Partikulárním řešením obyčejné diferenciální rovnice nazveme libovolné řešení dané rovnice.
Obecným řešením obyčejné diferenciální rovnice nazveme pomocí různých konstant obecně
zadaný předpis, z něhož lze vhodnou volbou konstant získat všechna partikulární řešení
dané rovnice.2
Příklad 2.1.3 Ukázka praktického problému vedoucího na řešení diferenciální rovnice:
Je dán elektrický RL obvod s cívkou o samoindukčnosti L, ohmickým odporem R a napětím
E. Popište průběh proudu i v závislosti na čase t.
Řešení: Podle prvního Kirhoffova zákona je algebraický součet všech elektromotorických
sil v uzavřeném obvodu roven nule, tj. hledaná závislost je řešením obyčejné diferenciální rovnice prvního řádu:
E
R
i0 + i =
L
L
R
,
Výsledná závislost (získaná postupem, který uvedeme v další kapitole) je i = ce L t + E
R
kde i je funkcí času t. Tato závislost představuje obecné řešení zadané diferenciální
rovnice.
V příkladě 2.1.3 jsme získali obecné řešení zadané diferenciální rovnice, tedy popis
obecné situace. Počáteční velikost proudu může být známá – v čase t = 0 může být proud
nulový nebo naopak mít nějakou nenulovou hodnotu.
Příklad 2.1.4 Pokračování příkladu 2.1.3:
Popište průběh proudu v situaci příkladu 2.1.3, víte-li, že v čase t = 0 byl proud nulový.
R
, kde i je funkcí času t, podmínka
Řešení: Závislost získaná v příkladu 2.1.3 je i = ce L t + E
R
ze zadání říká, že máme najít funkci proudu i v situaci, kdy t = 0. Dosazením
zjistíme, že v tom případě c = − E
, tj. hledaná závislost je:
R
i=
R
E
(1 − e− L t )
R
Tato závislost představuje partikulární řešení zadané diferenciální rovnice.
V případě, že na funkci získanou jako obecné řešení nějaké obyčejné diferenciální rovnice klademe další dodatečné podmínky, pak se (za splnění určitých předpokladů, které
uvedeme v následující kapitole) kombinace zadané diferenciální rovnice a těchto podmínek
nazývá podle situace počáteční úloha, Cauchyho úloha nebo okrajová úloha. 3
Úloha „Najděte řešení diferenciální rovnice (resp. počáteční úlohy, Cauchyho úlohy
nebo okrajové úlohy)ÿ není obecně řešitelná. V teorii obyčejných diferenciálních rovnic
se proto zavádí poměrně podrobná klasifikace typů diferenciálních rovnic. Postup hledání
2
Kromě pojmů obecné řešení a partikulární řešení diferenciální rovnice existuje ještě pojem singulární
řešení diferenciální rovnice.
3
Místo slova úloha se často používá termín problém.
Matematika 2
21
řešení dané rovnice pak závisí na tom, jakého konkrétního typu daná rovnice je. Řešit
přitom umíme jen rovnice některých typů, např. diferenciální rovnice se separovanými
proměnnými (např. y 0 + xy = 0), lineární
diferenciální
rovnice (např. 2y 0 + cos xy =
1 y+c1
e4x ), diferenciální rovnice typu y 0 = f a1ax+b
, Riccatiovu diferenciální rovnici (např.
2 +b2 +c2
y 0 − y 2 = −x2 + 1), exaktní diferenciální rovnice (např. (x3 + 3xy 2 )dx + (y 3 + 3x2 y)dy = 0)
a další.
V případě, že je nalezení řešení nějaké počáteční (resp. Cauchyho nebo okrajové) úlohy
obtížné nebo nemožné, můžeme přibližné řešení nalézt pomocí numerických metod.4 Tímto
postupem však nenalezneme funkci, která splňuje danou rovnici, ale její přibližné funkční
hodnoty v určitých předem zadaných bodech.
2.2
Lineární diferenciální rovnice
Velmi důležitým typem obyčejných diferenciálních rovnic jsou lineární diferenciální rovnice.5
Definice 2.2.1 Lineární diferenciální rovnicí n−tého řádu nazýváme rovnici tvaru6
y (n) + An−1 (x)y (n−1) + . . . + A1 (x)y 0 + A0 (x)y = f (x),
(2.2.1)
kde Ai (x), i = 0, 1, . . . n − 1 a f (x) jsou funkce. Pokud je f (x) ≡ 0, nazýváme tuto rovnici
homogenní, pokud je f (x) 6≡ 0, nazýváme tuto rovnici nehomogenní.
Definice 2.2.2 Nechť je dána diferenciální rovnice ve tvaru (2.1.1) a dále (n + 1)-tice
(x0 , y0 , y1 , . . . , yn − 1) ∈ Ω ⊂ R(n+1) . Pak úloha najděte řešení rovnice (2.1.1) definované
na nějakém intervalu I takovém, že x0 ∈ I a
y(x0 ) = y0 ,
y 0 (x0 ) = y1 ,
...,
y (n−1) (x0 ) = yn−1 ,
(2.2.2)
se nazývá Cauchyho počáteční úloha.7
Příklad 2.2.1 Příklad zadání Cauchyho počáteční úlohy:
Najděte řešení rovnice y 000 + 2y 00 + y 0 = −2xe−2x , y(0) = 2, y 0 (0) = 1, y 00 (0) = 0.
Poznamenejme, že řešením Cauchyho počáteční úlohy je partikulární řešení zadané
diferenciální rovnice. Je ovšem otázkou, zda vůbec existuje, resp. pokud ano, zda je jednoznačné.
4
Budou náplní předmětu Matematika 3 ; budete využívat program Matlab.
Z příkladů 2.1.1 a ?? vyplývá, že se jedná o velmi úzkou skupinu obyčejných diferenciálních rovnic.
6
Samozřejmě není nutné, aby funkce u členu y (n) byla identicky rovna 1. Pokud není, získáme
tvar (2.2.1) vydělením rovnice touto funkcí.
7
V Definici 2.2.2 se odkazujeme obecně na obyčejnou diferenciální rovnici, z čehož je patrné, že pojem
Cauchyho počáteční úloha se neomezuje jen na lineární diferenciální rovnice.
5
22
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
Věta 2.2.1 Nechť je dána lineární diferenciální rovnice (2.2.1), interval I a libovolná
čísla x0 ∈ I, y0 , y1 , . . . , yn−1 ∈ R. Jestliže jsou funkce Ai (x), i = 0, 1, . . . , n − 1, na
intervalu I spojité, pak rovnice (2.2.1) má právě jedno řešení y(x) splňující podmínky
y(x0 ) = y0 , y 0 (x0 ) = y1 , . . . , y (n−1) (x0 ) = yn−1 . Toto řešení existuje na celém intervalu I.
O obecném řešení lineární diferenciální rovnice platí následující tvrzení.
Věta 2.2.2 Nechť je dána nehomogenní lineární diferenciální rovnice (zkráceně
„NLDRÿ), tj. nechť ve vyjádření (2.2.1) je f (x) 6≡ 0. Dále nechť je k zadané nehomogenní
rovnici dána homogenní lineární diferenciální rovnice (zkráceně „HLDRÿ), tj. nechť ve
vyjádření (2.2.1) je f (x) ≡ 0. Označme yohldr (x) její obecné řešení a ypnldr (x) jedno její
partikulární řešení. Pak obecné řešení NLDR yohldr (x) má tvar
yonldr (x) = yohldr (x) + ypnldr (x).
(2.2.3)
Nalezení obecného řešení homogenní lineární diferenciální rovnice může být problematické. Platí sice následující věta:
Věta 2.2.3 Nechť je dána homogenní lineární diferenciální rovnice, tj. nechť ve vyjádření (2.2.1) je f (x) ≡ 0. Množina všech řešení této rovnice tvoří vektorový prostor
nad tělesem reálných čísel (vzhledem k operacím sčítání funkcí a násobení funkcí číslem).
Proto, jsou-li y1 (x) a y2 (x) dvě řešení dané homogenní lineární diferenciální rovnice, pak
také y1 (x) + y2 (x) a c1 y1 (x), kde c1 ∈ R, jsou řešení zadané rovnice. Je-li dáno n lineárně
nezávislých řešení nějaké homogenní lineární diferenciální rovnice řádu n – označme je
y1 (x), y2 (x), . . . yn (x) – pak každé řešení této rovnice má tvar
y(x) = c1 y1 (x) + c2 y2 (x) + . . . + cn yn (x),
(2.2.4)
kde c1 , c2 , . . . cn ∈ R.
Ovšem požadavek lineární nezávislosti jednotlivých řešení představuje problém.
Proto se v následujícím omezíme pouze na jednodušší situaci, kdy koeficienty
ai (x), i = 0, 1, . . . , n − 1 ve vyjádření (2.2.1) jsou konstantní funkce, tj. ve skutečnosti se
na jejich místě vyskytují reálná čísla ai ∈ R, i = 0, 1, . . . , n − 1.
Definice 2.2.3 Lineární diferenciální rovnici tvaru
y (n) + an−1 y (n−1) + . . . + a1 y 0 + a0 y = f (x),
(2.2.5)
kde ai ∈ R, i = 0, 1, . . . , n − 1, nazýváme lineární diferenciální rovnici s konstatními
koeficienty.
Příkladem lineární diferenciální rovnice s konstantními koeficienty je např. rovnice z
příkladu 2.2.1.
Matematika 2
2.2.1
23
Nalezení obecného řešení homogenní lineární diferenciální
rovnice s konstantními koeficienty
Nalezení obecného řešení homogenní lineární diferenciální rovnice s konstantními koeficienty je na první pohled relativně jednoduché.
Definice 2.2.4 Nechť je dána homogenní lineární diferenciální rovnice s konstantními
koeficienty, tj. rovnice tvaru
y (n) + an−1 y (n−1) + . . . + a1 y 0 + a0 y = 0
(2.2.6)
kde ai ∈ R, i = 0, 1, . . . , n − 1. Algebraickou rovnici
λn + an−1 λn−1 + . . . + a1 λ + a0 = 0
(2.2.7)
nazýváme charakteristickou rovnicí diferenciální rovnice (2.2.6).
Příklad 2.2.2 Příklady charakteristických rovnic diferenciálních rovnic:
Diferenciální rovnice
Charakteristická rovnice
y (5) + 3y 000 − 6y 0 + 7y = 0
y 00 + 5y 0 = 0
y 000 − 10y 00 + 12y = 0
λ5 + 3λ3 − 6λ + 7 = 0
λ2 + 5 = 0
λ3 − 10λ2 + 12 = 0
Věta 2.2.4 Mějme homogenní lineární diferenciální rovnici s konstantními koeficienty
tvaru (2.2.6) a její charakteristickou rovnici (2.2.7). Pak platí:
1. Je-li λ ∈ R k−násobný kořen charakteristické rovnice, k ≥ 1, pak funkce
y1 (x) = eλx , y2 (x) = xeλx , . . . yk (x) = xk−1 eλx
jsou řešením zadané diferenciální rovnice.
2. Je-li α ± βj ∈ C dvojice komplexně sdružených k−násobných komplexních kořenů
charakteristické rovnice, k ≥ 1, α, β ∈ R, β 6= 0, pak funkce
y1 (x) = eαx cos βx, y3 = xeαx cos βx, . . . y2k−1 = xk−1 eαx cos βx
y2 (x) = eαx sin βx, y4 = xeαx sin βx, . . . y2k = xk−1 eαx sin βx
jsou řešením zadané diferenciální rovnice.
Příklad 2.2.3 Řešení homogenní lineární diferenciální rovnice s konstantními koeficienty:
Pomocí věty 2.2.4 najděte řešení rovnice y (7) − 4y (6) + 14y (5) − 20y (4) + 25y 000 = 0.
24
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
Řešení: Charakteristická rovnice zadané diferenciální rovnice je λ7 − 4λ6 + 14λ5 − 20λ4 +
25λ3 = 0. Je zřejmé, že jejím trojnásobným kořenem je λ1,2,3 = 0. Zbývající kořeny
určíme jako řešení rovnice λ4 −4λ3 +14λ2 −20λ+25 = 0. Jedná se o rovnici 4. stupně,
jejímž řešeními (lze je nalézt algebraicky, viz střední škola) je λ4,5,6,7 = 1 ± 2j. Proto
podle věty 2.2.4 získáváme následující řešení zadané diferenciální rovnice:
y1 (x) = 1, y2 (x) = x, y3 (x) = x2 , y4 (x) = ex cos 2x, y5 (x) = xex cos 2x,
y6 (x) = ex sin 2x, y7 (x) = xex sin 2x.
Z takto získaných řešení lze velice jednoduchým postupem získat obecné řešení zadané
homogenní lineární diferenciální rovnici s konstantními koeficienty.
Věta 2.2.5 Lineární kombinace všech řešení homogenní lineární diferenciální rovnice
s konstantními koeficienty tvaru (2.2.6), získaných postupem uvedeným ve větě (2.2.4),
představuje obecné řešení této rovnice.
Lze ukázat, že množina všech řešení homogenní lineární diferenciální rovnice n-tého
řádu s konstantními koeficienty tvoří vektorový prostor, jehož dimenze je n. Jako každý
vektorový prostor má tedy i množina všech řešení homogenní lineární diferenciální rovnice
n-tého řádu s konstantními koeficienty bázi. Lze ukázat, že touto bází jsou právě všechna
řešení získaná podle návodu věty (2.2.4).
Definice 2.2.5 Bázi vektorového prostoru všech řešení homogenní lineární diferenciální
rovnice n-tého řádu s konstantními koeficienty nazýváme fundamentální systém homogenní lineární diferenciální rovnice n-tého řádu s konstantními koeficienty.
Poznámka 2.2.1 Množina všech řešení homogenní lineární diferenciální rovnice n-tého
řádu (tedy nikoliv pouze s konstantními koeficienty) také tvoří vektorový prostor. Má tedy
také bázi. V definici 2.2.5 není nutné se omezovat pouze na rovnice s konstantními koeficienty; pojem fundamentální systém je v literatuře běžně definován pro jakoukoliv homogenní lineární diferenciální rovnici. Problémem je jeho nalezení – jednoduché je pouze
pro rovnice s konstantními koeficienty.
Příklad 2.2.4 Obecné řešení homogenní diferenciální rovnice s konstantními koeficienty:
Obecné řešení diferenciální rovnice z příkladu 2.2.3 je
y(x) = c1 + c2 x + c3 x2 + c4 ex cos 2x + c5 xex cos 2x + c6 ex sin 2x + c7 xex sin 2x,
kde ci ∈ R, i = 1, 2, . . . , 7.
Při hledání řešení charakteristické rovnice v příkladu 2.2.3 je možné použít postup,
který je vyučován i na mnoha středních školách. V žádném případě se však nejedná o
postup jednoduchý. Právě v tom tkví problém při hledání obecného řešení homogenní lineární diferenciální rovnice s konstantními koeficienty: zatímco řešení diferenciální rovnice
druhého řádu je jednoduché – řešíme kvadratickou rovnici, je řešení rovnic vyšších řádů
komplikovanější. Mezi diferenciálními rovnicemi pátého a vyšších řádů již nutně existují
rovnice, které řešitelné nejsou, protože algebraciké rovnice jsou obecně řešitelné pouze do
čtvrtého stupně.
Matematika 2
2.2.2
25
Nalezení obecného řešení nehomogenní lineární diferenciální rovnice
K nalezení obecného řešení nehomogenní lineární diferenciální rovnice je možno použít
větu 2.2.2. Je však otázka, jak najít partikulární řešení zadané nehomogenní lineární diferenciální rovnice. Tomuto problému se můžeme vyhnout, pokud použijeme tzv. metodou
variace konstant.
Příklad 2.2.5 Metoda variace konstant
Najděte obecné řešení rovnice y 00 + y 0 − 2y = ex .
Řešení: Podle vět 2.2.4 a 2.2.5 je obecné řešení příslušné homogenní rovnice, tj. rovnice
y 00 + y 0 − 2y = 0, rovno yh = c1 e−2x + c2 ex .
Lze ukázat, že tímto obecným řešením je dán i tvar obecného řešení nehomogenní
lineární diferenciální rovnice. Místo konstant c1 , c2 budeme uvažovat neznámé funkce
c1 (x), c2 (x) – hledané obecné řešení tedy bude tvaru
yo = c1 (x)e−2x + c2 (x)ex .
Po zderivování dostaneme
yo0 = c01 (x)e−2x − 2c1 (x)e−2x + c02 (x)ex + c2 (x)ex .
Lze ukázat, že součet členů s prvními derivacemi neznámých funkcí c1 (x), c2 (x) (jsou
podtrženy) bude roven nule. Proto jej roven nule položíme a zderivujeme yo0 . Dostaneme
yo00 = −2c01 (x)e−2x + 4c1 (x)e−2x + c02 (x)ex + c2 (x)ex .
Protože vycházíme z toho, že yo je řešení zadané rovnice, musí této rovnici vyhovovat. Proto dosadíme yo , yo0 a yo00 do zadané rovnice 2y 00 + y 0 − y = 2ex . Po úpravě
dostáváme
−2c01 (x)e−x + c02 (x)ex = ex ,
což je rovnice, v níž se vyskytují derivace hledaných (dvou) neznámých funkcí. Protože jsme však předpokládali, že c01 (x)e−2x + c02 (x)ex = 0, získáváme soustavu dvou
rovnic, v níž se vyskytují první derivace dvou neznámých funkcí
c01 (x)e−2x + c02 (x)ex = 0
−2c01 (x)e−2x + c02 (x)ex = ex
Jednoduchými úpravami zjistíme, že c01 (x) = − 31 e3x a po integraci c1 (x) = − 19 e3x +
k1 . Podobně c02 (x) = 13 a po integraci c2 (x) = 31 x + k2 . Po dosazení a úpravě je vidět,
že hledané obecné řešení rovnice y 00 +y 0 −2y = ex je yo = k1 e−2x +(k2 + 91 )ex + 13 xex , což
po označení k3 = k2 + 19 (které není na újmu obecnosti) dá yo = k1 e−2x +k3 ex + 31 xex .
Snadno se lze přesvědčit, že toto řešení koresponduje s větou 2.2.2.
V průběhu řešení příkladu jsme využili několik myšlenek, které je třeba podrobně
dokázat. Výsledek lze shrnout do následující věty (všimněte si předpokladu týkajícího se
koeficientu u členu y (n) ).
26
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
Věta 2.2.6 Nechť je dána taková nehomogenní lineární diferenciální rovnice s konstantními koeficienty tvaru
y (n) + an−1 y (n−1) + . . . + a1 y 0 + a0 y = f (x),
pro niž platí, že obecné řešení příslušné homogenní rovnice je tvaru yh = c1 y1 + . . . cn yn ,
kde c1 , . . . , cn jsou konstanty a y1 , . . . , yn jsou řešení získaná pomocí věty 2.2.4. Pak
obecné řešení zadané nehomogenní lineární rovnice je tvaru yo = c1 (x)y1 + . . . cn (x)yn ,
kde c1 (x), . . . , cn (x) jsou funkce, které jsou řešením soustavy rovnic
c1 (x)y1 + . . . c1 (x)yn = 0
(i)
(i)
c01 (x)y1 + . . . c01 (x)yn = 0
(n−1)
(n−1)
c01 (x)y1
+ . . . c01 (x)yn
= f (x).
(2.2.8)
i = 1, . . . , n − 2
(2.2.9)
(2.2.10)
Metoda variace konstant není jediný způsob, jak nalézt obecné řešení nehomogenní
lineární rovnice. Lze použít např. metodou neurčitých koeficientů. Tato metoda je sice
„uživatelsky přívětivějšíÿ, avšak je použitelná pouze pro rovnice, jejichž pravá strana, tj.
f (x) ve vyjádření (2.2.1), je určitého speciálního tvaru.8 Při řešení využíváme větu 2.2.2,
protože jsme schopni (ve speciálních případech f (x)) odhadnout tvar hledaného partikulárního řešení.
Příklad 2.2.6 Řešení počáteční úlohy
Známe obecné řešení y = c1 e−2x +c2 ex + 31 xex lineární diferenciální rovnice y 00 +y 0 −2y = ex .
Určete konstanty c1 a c2 , aby byly splněny počáteční podmínky y(0) = 1, y 0 (0) = 2.
Řešení: Má-li platit y(0) = 1, musí být
1
c1 e−2.0 + c2 e0 + .0.e0 = 1.
3
Má-li platit y 0 (0) = 2, je třeba obecné řešení y nejprve zderivovat a poté dosadit
příslušné hodnoty. Dostáváme
1
1
−2c1 e−2.0 − c2 e0 + e0 + 0.e0 = 2.
3
3
Hledané konstanty c1 , c2 jsou řešením soustavy rovnic
c1 + c2 = 1
−2c1 − c2 = 2
Řešení zadané počáteční úlohy je tedy y = −3e−2x + 4ex + 31 xex .
Pokud hledáme řešení Cauchyho úlohy (tj. spolu s rovnicemi jsou zadány také počáteční podmínky), nemusíme obecně postupovat ve dvou krocích naznačených v příkladech 2.2.5 a 2.2.6, ale můžeme postupovat i přímo. K výpočtu bychom např. mohli použít
tzv. váhovou funkci, s níž se setkáte později.
8
Pro rovnici v příkladu 2.2.5 by metodu neurčitých koeficientů bylo možné použít.
Matematika 2
2.3
27
Systémy diferenciálních rovnic
Ze střední školy znáte celou řadu úloh, které vedou na řešení soustavy lineárních (algebraických) rovnic. Podobně mnohé příklady z elektrotechnické praxe vedou na řešení
nikoliv jedné ale více diferenciálních rovnic. Přitom mohou nebo nemusejí být známy počáteční podmínky. V této části se podobně jako v kapitole o jedné diferenciální rovnici
omezíme pouze na některé jednoduché případy. Poznamenejme, že úvahy v této části se
týkají soustav n diferenciálních rovnic o n neznámých, kde n ≥ 1 – lze je tedy vztáhnout
i na případ jedné rovnice.
Definice 2.3.1 Nechť je dáno n funkcí f1 (x, y1 , . . . yn ), f2 (x, y1 , . . . yn ), . . . fn (x, y1 , . . . yn ),
které jsou definované na otevřené množině Ω ⊂ Rn+1 . Systémem n diferenciálních rovnic
prvního řádu o n neznámých funkcích y1 (x), y2 (x), . . . yn (x) nazýváme soustavu tvaru
y10 = f1 (x, y1 , . . . yn )
y20 = f2 (x, y1 , . . . yn )
..
.
yn0 = fn (x, y1 , . . . yn ).
(2.3.1)
Řešením systému (2.3.1) nazýváme takovou n-tici funkcí (h1 (x), h2 (x), . . . , hn (x)) definovaných na otevřeném intervalu J, že každá funkce hi (x), i = 1, . . . , n má na J derivaci,
pro každé x ∈ J je splněno (x, h1 (x), . . . , hn (x)) ∈ Ω a platí
h01 (x) = f1 [x, h1 (x), . . . hn (x)]
h02 (x) = f1 [x, h1 (x), . . . hn (x)]
..
.
0
hn (x) = fn [x, h1 (x), . . . hn (x)].
Nechť je dána (n + 1)-tice (x0 , c1 , . . . , cn ) ∈ Ω. Cauchyho počáteční úlohou pro systém (2.3.1) nazýváme úlohu najít řešení (y1 (x), . . . , yn (x)) systému (2.3.1), které je definované na nějakém intervalu J obsahujícím x0 , takové, že
y1 (x0 ) = c1 , y2 (x0 ) = c2 , . . . yn (x0 ) = cn .
(2.3.2)
Výše uvedená označení jsou sice názorná avšak poněkud komplikovaná. Zavedeme
proto jejich zkrácené verze. Označíme-li y0 = (y1 , . . . , yn )T , y = (x, y1 . . . , yn ) a f =
(f1 , . . . , fn )T , můžeme místo zápisu (2.3.1) používat zkrácené označení
y0 = f (x, y).
(2.3.3)
Podobně, jestliže c = (c1 , c2 , . . . , cn ), lze místo vyjádření podmínek (2.3.2) psát
y(x0 ) = c,
(2.3.4)
28
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
Definice 2.3.2 Systém tvaru
y10 = a11 (x)y1 + a12 (x)y2 + . . . + a1n (x)yn + b1 (x)
y20 = a21 (x)y1 + a22 (x)y2 + . . . + a2n (x)yn + b2 (x)
..
.
yn0 = an1 (x)y1 + an2 (x)y2 + . . . + ann (x)yn + bn (x)
(2.3.5)
se nazývá lineární systém obyčejných diferenciálních rovnic prvního řádu. Jsou-li všechny
funkce bi (x) ≡ 0, nazýváme systém homogenním; v opačném případě hovoříme o nehomogenním systému. Jsou-li všechny koeficienty aij , i, j = 1, . . . , n konstantní funkce,
hovoříme o lineárním systému s konstantními koeficienty.
Lineární systém obyčejných diferenciálních rovnic prvního řádu můžeme maticově zapsat jako
y0 = A(x)y + B(x),
(2.3.6)
kde prvky matice A jsou tvořeny koeficienty aij , i, j = 1, . . . , n a matice B(x) je sloupcová
matice obsahující koeficienty bi , i = 1, . . . , n. V případě lineárního systému s konstantními
koeficienty můžeme psát
y0 = Ay + B(x).
(2.3.7)
Podobně jako v případě jedné diferenciální rovnice musíme nejprve ukázat, kdy má systém diferenciálních rovnic (právě jedno)9 řešení. V dalším textu a zadávaných příkladech
budeme předpokládat, že předpoklady následující věty jsou splněny.
Věta 2.3.1 Nechť je dán lineární systém (2.3.6). Jestliže jsou maticové funkce A(x) a
B(x) spojité na otevřeném intervalu I, pak pro každé x0 ∈ I a c ∈ Rn má počáteční úloha
y0 = A(x)y + B(x), y(x0 ) = c,
právě jedno řešení, které je definováno na celém intervalu I.
Při hledání obecného řešení jedné nehomogenní lineární diferenciální rovnice jsme postupovali ve dvou krocích: nejprve jsme našli obecné řešení příslušné homogenní rovnice a
poté jsme ho sečetli s jedním partikulárním řešením zadané rovnice. Protože však nalezení
obecného řešení homogenní lineární diferenciální rovnice obecného řádu je problematické,
omezili jsme se pouze na hledání řešení lineární diferenciální rovnice s konstantními koeficienty.
Situace pro systémy diferenciálních rovnic je analogická. Pro lineární systémy lze
analogicky definovat pojem fundamentální systém homogenního systému (analogie definice 2.2.5) a lze dokázat obdobné věty jako 2.2.2 a 2.2.3. Problémem je ovšem nalezení
obecného řešení lineárního systému. V dalším textu se proto omezíme pouze na lineární
systémy obyčejných diferenciálních rovnic prvního řádu s konstantními koeficienty, které
mají velký význam v technické praxi.
9
Pojem právě jedno řešení bychom ve skutečnosti měli definovat. Podobně bychom měli rozlišovat pojmy řešení a úplné řešení a zavést pojem prodloužení řešení. Nečiníme tak z důvodu omezeného prostoru
v tomto textu.
Matematika 2
29
Příklad 2.3.1 Lineární systém obyčejných diferenciálních rovnic prvního řádu s konstantními koeficienty
y10 = 7y1 + 9y2 + 2y3
y20 = 2y1 − 3y2 + 4y3
y30 = 5y1 + 6y2 − 8y3
Řešení zmiňovaných typů systémů diferenciálních rovnic lze hledat několika způsoby,
z nichž každý má svá úskalí a omezení. Pro ilustraci ukážeme, jak lze při řešení systémů
diferenciálních rovnic využít pojmů vlastní čísla a vlastní vektory matice, s nimiž se běžně
pracuje v různých oblastech matematiky.10 Budeme se přitom odvolávat na zkrácené označování y0 = Ay, jehož význam je vysvětlen za definicí 2.3.2.
Definice 2.3.3 Nechť A je čtvercová matice řádu n a nechť En značí jednotkovou matici řádu n. Determinant matice |A − λEn | nazýváme charakteristický polynom matice
A. Kořeny charakteristického polynomu matice A nazýváme vlastní čísla matice A. Vektory tvořící fundamentální systém řešení soustavy homogenních lineárních (algebraických)
rovnic11 y = (A − λi En )x nazýváme vlastní vektory příslušné vlastnímu číslu λi .12
Věta 2.3.2 Vlastní vektory příslušné navzájem různým vlastním číslům matice A jsou
lineárně nezávislé.
Věta 2.3.3 Nechť je dán systém diferenciálních rovnic tvaru y0 = Ay, kde A je čtvercová
matice řádu n. Dále nechť λ1 , λ2 , . . . , λn jsou vlastní čísla matice A a z1 , z2 . . . , zn jsou
k nim příslušné vlastní vektory. Za předpokladu, že tyto vektory jsou lineárně nezávislé,
tvoří sloupce
y1 = z1 eλ1 x , y2 = z2 eλ2 x , . . . , yn = zn eλn x
fundamentální systém řešení systému y0 = Ay, tj. jejich lineární kombinace je obecným
řešením tohoto systému.
Příklad 2.3.2 Hledání obecného řešení systému diferenciálních rovnic y0 = Ay pomocí
vlastních čísel a vlastních vektorů matice A
Nalezněte obecné řešení systému
y10 =
y2 + y3
0
y2 = y1
+ y3
y30 = y1 + y2
10
Tyto pojmy využijete např. u některých numerických metod.
Tento pojem byl definován v předmětu Matematika 1 ; jedná se o bázi podprostoru řešení homogenní
soustavy lineárních rovnic.
12
Místo označení vlastní čísla, resp. vektory, se můžete setkat také s termínem charakteristická čísla,
resp. vektory.
11
30
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
Řešení: Maticově lze systém zapsat jako y0 = Ay, resp.


0 1 1
y0 =  1 0 1  y.
1 1 0
Charakteristický polynom matice A je determinant
−λ 1
1
|A − λE3 | = 1 −λ 1 = −λ3 + 3λ2 + 2 = 0.
1
1 −λ Kořeny charakteristického polynomu, a tedy vlastními čísly matice A, jsou čísla
λ1,2 = −1 a λ3 = 2. Ve větě 2.3.3 nevyžadujeme, aby vlastní čísla byla navzájem různá; můžeme proto určit příslušné vlastní vektory. Vlastní vektory příslušné
vlastnímu číslu λ1,2 = −1 najdeme jako fundamentální systém řešení lineárních algebraických rovnic, který lze maticově zapsat jako (A+E)z = o, kde z = (z1 , z2 , z3 )T
a o = (0, 0, 0)T , tj.
z1 + z2 + z3 = 0
z1 + z2 + z3 = 0
z1 + z2 + z3 = 0
Obecným řešením této soustavy rovnic je z1 = −t − s, z2 = s, z3 = t. Bází podprostoru řešení této soustavy homogenních rovnic, a tedy vlastními vektory příslušnými
číslu λ1,2 = −1 jsou vektory z1 = (1, −1, 0)T a z2 = (1, 0, −1)T .13 Vlastní vektory příslušné vlastnímu číslu λ3 = 2 získáme analogicky, nyní jako řešení soustavy
rovnic
−2z1 + z2 + z3 = 0
z1 − 2z2 + z3 = 0
z1 + z2 − 2z3 = 0
Výpočtem zjistíme, že obecné řešení této soustavy je tvaru z1 = t, z2 = t, z3 = t.
Hledaný vlastní vektor je tedy z3 = (1, 1, 1)T . Vektory z1 , z2 , z3 jsou podle věty 2.3.2
lineárně nezávislé (ověřte si sami!) a podle věty 2.3.3 je tedy obecné řešení zadaného
systému diferenciálních rovnic
y = c1 z1 e−x + c2 z1 e−x + c3 z1 e2x ,
tj.
y1 = c1 e−x + c2 e−x + c3 e2x
y2 = −c1 e−x
+ c3 e2x
y3 =
+ −c2 e−x + c3 e2x .
13
Označení (a, b, c)T značí transponovanou matici – zde sloupcový vektor.
Matematika 2
31
Při podrobnějším studiu postupu řešení tohoto příkladu a věty 2.3.3 jsou patrné problémy, které mohou nastat při tomto postupu řešení. Vlastní čísla předně mohou být
komplexní, což bude komplikovat nalezení příslušných vlastních vektorů. Dalším omezením je fakt, že věta 2.3.3 předpokládá, že počet lineárně nezávislých vlastních vektorů
je stejný jako hodnost matice A. To ovšem obecně nemusí nastat. Pokud např. uvážíme
systém
y10 = 17y1 + 9y2
y20 = −25y1 − 13y2 ,
bude mít matice A jedno vlastní číslo λ1,2 = 2, kterému bude příslušný jediný vlastní
vektor z = (− 53 , 1)T . Větu 2.3.3 tedy nemůžeme použít.
Pokud budou všechna vlastní čísla matice A reálná různá, pak z věty 2.3.2 naopak
vyplývá, že žádné problémy při hledání obecného řešení systému y0 = Ay nenastanou.
Podrobná diskuse těchto případů stejně jako uvádění dalších možností řešení systémů
diferenciálních rovnic však přesahuje rámec tohoto textu. Více se o řešení systémů diferenciálních rovnic dozvíte v předmětu Vybrané partie z matematiky a v odborných
předmětech.
2.4
Poznámka o stabilitě
32
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
Kapitola 3
Diferenční rovnice
3.1
Základní pojmy
Při hledání numerického řešení diferenciálních rovnic, při práci s funkcemi komplexní proměnné nebo v mnoha různých aplikacích, které nepracují s funkcemi ale s posloupnostmi,
tj. při popisu diskrétních jevů, hraje důležitou roli tzv. diferenční počet. V této kapitole
uvedeme základní pojmy z teorie diferenčních rovnic, které lze chápat jako jistou analogii rovnic diferenciálních, o nichž jsme mluvili v kapitole 2. Postup řešení těchto rovnic
uvedeme v kapitole ?? poté, co se seznámíme s integrálními transformacemi.
Definice 3.1.1 Nechť je funkce y = f (x) definována v bodech x0 , x1 , . . . , xn .
Diferencí prvního řádu nebo také první diferencí funkce f (x) v bodě xk nazýváme přírustek
∆f (xk ) = f (xk+1 ) − f (xk ).
Diferencí druhého řádu nebo také druhou diferencí funkce f (x) v bodě xk nazýváme výraz
∆2 f (xk ) = ∆f (xk+1 ) − ∆f (xk ).
Diferencí řádu n nebo také n–tou diferencí funkce f (x) v bodě xk nazýváme výraz
∆n f (xk ) = ∆n−1 f (xk+1 ) − ∆n−1 f (xk ).
Body x0 , x1 , . . . , xn přitom mohou být libovolné. Ve speciálním případě, kdy jsou
všechny rozdíly ∆xk = xk+1 − xk stejně velké a rovnají se číslu h, platí, že xi+1 = xi + h =
x0 + (i + 1)h, i = 0, 1, . . . , k. Je-li speciálně h = 1, dostáváme, že xi+1 = x0 + i + 1, tedy
∆f (xk ) = f (x0 + k + 1) − f (x0 + k).1
V dalším textu budeme místo označování f (x + k) = y(x + k) používat stručnější zápis
yx+k .
1
Volba h = 1 přitom není na újmu obecnosti, protože je-li h 6= 1, položíme x = ht a dostáváme
xk = x0 + hk = t0 h + hk = h(t0 + k), tedy je f (xk ) = f (h(t0 + k)) = ϕ(t0 + k).
33
34
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
Definice 3.1.2 Diferenční rovnicí nazýváme rovnici, v níž se kromě neznámé funkce vyskytuje také její diference. Nejčastěji ji zapisujeme ve tvaru
yx+n = F (x, yx , yx+1 , . . . , yx+n−1 ) = 0.
(3.1.1)
Řádem diferenční rovnice (3.1.1), která obsahuje členy yx a yx+n , nazýváme číslo
r = n. Obsahuje-li však rovnice (3.1.1) členy yx+n a yx+k , ale neobsahuje členy
yx , yx+1 , . . . , yx+k−1 , nazýváme jejím řádem číslo r = n − k.
Ve vyjádření 3.1.1 se vyskytují členy yx+k , kde k = 0, 1, . . . , n, avšak diference funkce
y = f (x) byla definována pomocí výrazů ∆i f (xk ), kde i = 0, 1, . . . n.
Věta 3.1.1 Nechť funkce yx = f (x) je definována v bodech x, x + 1, . . . , x + k, . . . , x + n.
Pro její diferenci řádu n platí
n
X
n
n
n
n
k n
∆ yx =
yx+n −
yx+n−1 + . . . + (−1 )
yx =
(−1)
yx+n−k .
0
1
n
k
k=0
n
Při porovnání pojmů řád obyčejné diferenciální rovnice a řád diferenční rovnice je
vidět podstatný rozdíl. Řádem obyčejné diferenciální rovnice se rozumí nejvyšší řád derivace neznámé funkce, která se v rovnici vyskytuje, avšak řád diferenční rovnice není
definován jako nejvyšší řád diference neznámé funkce.2
Příklad 3.1.1 Určení řádu diferenční rovnice
Určete řád diferenční rovnice ∆3 yx + ∆2 yx = 0.
Řešení: Použitím věty 3.1.1 převedeme rovnici do tvaru
yx+3 − 3y x + 2 + 3yx+1 − yx + yx+2 − 2yx+1 + yx = 0
yx+3 − 2yx+2 + yx+1 = 0,
z něhož je ihned vidět, že řád zadané rovnice je r = 3 − 1 = 2.
Podobně jako u diferenciálních rovnic, má i u diferenčních rovnic pojem řešení několik
významů.
Definice 3.1.3 Řešením diferenční rovnice nazýváme každou funkci, která vyhovuje dané
rovnici. Obecným řešením diferenční rovnice řádu n nazýváme takové její řešení, které obsahuje n takových libovolných konstant, že každé řešení zadané rovnice se z něho dostane
vhodnou volbou těchto konstant. Partikulárním řešením diferenční rovnice nazýváme takové její řešení, které dostaneme z obecného řešení dosazením určitých čísel za jednotlivé
konstanty.
2
Důvodem je fakt, že takto definovaný řád by se vhodnými substitucemi argumentu mohl měnit.
Matematika 2
35
Poznámka 3.1.1 Všimněme si jednoho podstatného faktu: řešením diferenciální rovnice
je funkce, která musí být definována pouze v určitých bodech – viz definice (3.1.1) a
(3.1.2). Nemusí se tedy vůbec jednat o funkci, jejímž definičním oborem je množina (všech)
reálných čísel, ale např. o funkci jejímž definičním oborem je množina (všech) přirozených
čísel. V diferenčních rovnicích tedy můžeme mj. pracovat s posloupnostmi.
Při studiu diferenciálních rovnic jsme ukázali, že jsou-li vhodným způsobem zadány
k rovnici nějaké další dodatečné podmínky, získáme místo obecného řešení diferenciální
rovnice jedno konkrétní partikulární řešení dané rovnice. Podobná situace nastává i při
řešení diferenčních rovnic.
Definice 3.1.4 Mějme dánu diferenční rovnici řádu k. Podmínky tvaru
y(x0 ) = f0 , y(x0 + 1) = f1 , . . . , y(x0 + n − 1) = fn−1 ,
(3.1.2)
kde fi ∈ C, i = 0, 1, . . . , n−1, nazýváme počátečními podmínkami diferenční rovnice řádu
n.
Příklad 3.1.2 Příklad zadání počátečních podmínek diferenční rovnice
Najděte řešení diferenční rovnice 3yx+2 + 2yx+1 − yx = x2 + 5 za počátečních podmínek
y(0) = 0, y(1) = 2.
3.2
Lineární diferenční rovnice s konstantními koeficienty
Typů diferenčních rovnic existuje celá řada – podobně jako u diferenciálních rovnic se
bude zabývat pouze jedním z jednodušších typů.
Definice 3.2.1 Lineární diferenční rovnicí řádu n nazýváme rovnici tvaru
yx+n + A1 yx+n−1 + . . . + An yx = B(x),
(3.2.1)
kde Ai , i = 0, 1, . . . , n jsou funkcemi argumentu x, přičemž An 6≡ 0. Jestliže B(x) ≡ 0,
nazýváme tuto rovnici zkrácenou, je-li B(x) 6≡ 0 nazýváme tuto rovnici nezkrácenou.
U diferenciálních rovnic jsme definovali lineární rovnici také. Ukázalo se, že v případě,
že funkce Ai , i = 0, 1, . . . , n−1, vyskytující se ve vyjádření (2.2.1) jsou konstantní, je řešení
takových rovnic mnohem jednodušší. Analogická situace nastává i u diferenčních rovnic;
v dalším textu se proto budeme zabývat jen speciálním typem lineárních diferenčních
rovnic.
Definice 3.2.2 Jsou-li všechny funkce Ai (x), i = 0, 1, . . . , n ve vyjádření (3.2.1) konstantní, přičemž An 6= 0, nazýváme lineární diferenční rovnici (3.2.1) lineární diferenční
rovnicí s konstantními koeficienty a píšeme ji ve tvaru
yx+n + a1 yx+n−1 + . . . + an yx = B(x),
(3.2.2)
36
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
Vidíme, že zkrácená lineární diferenční rovnice s konstantními koeficienty je jistou
analogií homogenní lineární diferenciální rovnice s konstantními koefieinty. To bude platit
i pro její řešení, které budeme hledat podobným způsobem.
Definice 3.2.3 Nechť je dána zkrácená lineární diferenční rovnice řádu n ve tvaru
a0 yx+n + a1 yx+n−1 + . . . + an yx = 0,
(3.2.3)
kde ai , i = 0, 1, . . . , n jsou konstanty takové, že a0 6= 0 a an 6= 0.3 Algebraickou rovnici
a0 rn + a1 rn−1 + . . . + an = 0
(3.2.4)
nazýváme její charakteristickou rovnicí.
Věta 3.2.1 Mějme dánu zkrácenou lineární diferenční rovnici s konstantními koeficienty
tvaru (3.2.3) a její charakteristickou rovnici (3.2.4). Pak platí:
1. Je-li r ∈ R k−násobný kořen charakteristické rovnice, k ≥ 1, pak funkce
y1 (x) = rx , y2 (x) = xrx , . . . yk (x) = xk−1 rx
jsou řešením zadané diferenční rovnice.
2. Je-li r1,2 dvojice komplexních k−násobných, k ≥ 1, kořenů charakteristické rovnice
vyjádřených v goniometrickém tvaru jako r1,2 = ρ(cos ϕ ± sin ϕ), pak
y1 (x) = ρx cos (ϕx), y3 (x) = xρx cos (ϕx), . . . y2k−1 (x) = xk−1 ρx cos (ϕx)
y2 (x) = ρx sin (ϕx), y4 (x) = xρx sin (ϕx), . . . y2k (x) = xk−1 ρx sin (ϕx)
jsou řešením zadané diferenční rovnice.
Poznámka 3.2.1 Pokud považujeme x za spojitý argument – viz poznámka 3.1.1, převádíme na goniometrický tvar také záporné reálné kořeny charakteristické rovnice.
Věta 3.2.2 Lineární kombinace všech řešení zkrácené lineární diferenční rovnice s konstantními koeficienty tvaru (3.2.3), získaných postupem uvedeným ve větě (3.2.1), představuje obecné řešení této rovnice.
Příklad 3.2.1 Řešení zkrácené lineární diferenční rovnice s konstantními koeficienty
Nalezněte obecné řešení diferenční rovnice yx+2 + 6yx+1 + 9yx = 0.
Řešení: Nejprve sestavíme charakteristickou rovnici. Podle vyjádření (3.2.4) dostáváme
r2 + 6r + 9 = 0. Tato rovnice má jeden dvojnásobný kořen r1,2 = −3. Proto podle
věty 3.2.1 jsou řešením zadané rovnice funkce y1 (x) = (−3)x a y2 (x) = x(−3)x .
Obecným řešením zadané diferenční rovnice je podle věty 3.2.2 funkce y(x) =
c1 (−3)x + c2 x(−3)x . Pokud uvažujeme spojitý argument x, převedeme podle poznámky 3.2.1 číslo −3 na goniometrický tvar. Řešením tedy bude funkce y(x) =
(c1 + c2 x)3x [cos (πx) + sin (πx)].
Jinými diferenčními rovnicemi se nebudeme zabývat. V kapitole ?? si ukážeme jeden způsob řešení diferenčních rovnic, jejichž argument není spojitý ale diskrétní. Tímto
způsobem budeme řešit lineární diferenční rovnice s konstantními koeficienty, a to jak
zkrácené tak nezkrácené.
3
Všimněte si rozdílných požadavků na koeficienty ai v tomto vyjádření a ve vyjádření 3.2.2. Rozdíl je
ve skutečnosti pouze formální, protože ve vyjádření 3.2.2 je koeficient u členu yx+n roven jedné.
Kapitola 4
Funkce komplexní proměnné
4.1
Základní pojmy
V této kapitole rozšíříte své znalosti o funkcích. Na střední škole se automaticky předpokládaly reálné funkce reálných proměnných, které měly z didaktického hlediska tu výhodu,
že bylo možné jednoduše sestrojit jejich grafy. V prvním ročníku jste si rozšířili znalosti o
vlastnostech funkcí do té míry, že nyní umíte ze znalosti funkčního předpisu sami sestrojit graf dané funkce. V aplikacích a technické praxi však reálné funkce reálné proměnné
nepostačují. Musíme proto rozšířit pojem funkce do komplexního oboru.
Definice 4.1.1 Proměnná z, která může nabývat libovolných komplexních hodnot, se nazývá komplexní proměnná. Komplexní číslo z přitom obvykle vyjadřujeme v algebraickém
tvaru1
z = x + jy
pro libovolná x, y ∈ R. Je-li dále ke každému komplexnímu číslu z ∈ G ⊆ C přiřazeno
nějakým předpisem f alespoň jedno komplexní číslo w = u + jv, kde u, v ∈ R, řekneme,
že na množině G je definována komplexní funkce komplexní proměnné z, a píšeme
w = f (z) = u(x, y) + jv(x, y).
Kvůli stručnosti tuto funkci také nazýváme komplexní funkce f (z) nebo jen funkce f (z).
Množinu G nazýváme definiční obor funkce f (z). Funkci u(x, y) nazýváme reálná část
funkce f (z) a značíme ji Re w nebo Re f (z), funkci v(x, y) nazýváme imaginární část
funkce f (z) a značíme ji Im w nebo Im f (z).2
V dalším textu si ukážeme, že na komplexní funkci f (z) se můžeme při mnoha příležitostech dívat jako na dvojici reálných funkcí dvou proměnných u(x, y) a v(x, y). Z toho
vyplývá nutnost umět najít reálnou a imaginární složku dané funkce. Z důvodu stručnosti
budeme v dalším místo označování u(x, y) a v(x, y) často používat zkrácené označování
u a v.
1
V matematice bývá zvykem označovat komplexní jednotku písmenem i; v technické praxi se často
používá označování písmenem j.
2
Jestliže je G ⊆ R, řekneme, že na množině G je definována komplexní funkce reálné proměnné z.
Podobně můžeme definovat reálnou funkci komplexní proměnné.
37
38
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
Příklad 4.1.1 Určení reálné a imaginární části funkce f (z)
Je dána komplexní funkce w = z 2 + jz. Najděte její reálnou a imaginární část.
Řešení: Komplexní číslo z v předpisu w = z 2 + jz uvažujeme podle definice 4.1.1 v
algebraickém tvaru. Je proto
w = z 2 + jz = (x + jy)2 + j(x + jy) = x2 + 2jxy + j 2 y 2 + jx + j 2 y =
= x2 + 2jxy − y 2 + jx − y = x2 − y 2 − y + j(2xy + x)
Reálná část hledané funkce je proto u = Re w = x2 − y 2 − y a imaginární část
je v = Im w = 2xy + x. Zbývá otázka definičního oboru zadané funkce – v zadání
totiž není uveden. Protože však funkce u i v jsou zřejmě definovány pro libovolná
x, y ∈ R, může být definičním oborem zadané funkce celá množina C, resp. libovolná
její podmnožina.
Funkce f (z) v definici 4.1.1 přiřazuje každému číslu z definičního oboru alespoň jedno
komplexní číslo. To je rozdíl oproti definici reálné funkce reálné proměnné definované v
předmětu Matematika 1, která každému číslu z definičního oboru přiřazovala právě jednu
hodnotu. Má proto smysl následující rozlišení.
Definice 4.1.2 Jestliže funkce f : G → C, kde G ⊆ C přiřazuje každému číslu z ∈ G
právě jedno číslo w ∈ C, říkáme, že funkce f (z) je jednoznačná. Jestliže funkce f (z) není
jednoznačná, říkáme, že je mnohoznačná.
V dalším textu uvidíme, že komplexní funkce mají některé neočekávané vlastnosti –
např. bude vidět, že připustíme-li za definiční obor funkce w = ln z nějakou podmnožinu
množiny komplexních čísel, získáme mnohoznačnou funkci.
4.2
Limita, spojitost a derivace
V tomto odstavci si ukážeme, jak lze na komplexní funkce přenést některé pojmy, s nimiž
jste se seznámili v předmětu Matematika 1 : limita, spojitost a derivace. Všimněte si,
že ve všech případech budou příslušné pojmy zobecněním pojmů známých z předmětu
Matematika 1.
Definice 4.2.1 Nechť z0 je hromadným bodem množiny G ⊆ C a nechť f (z) je jednoznačná funkce definovaná na definičním oboru G. Dále nechť U (z0 ) je okolí bodu z0 .
Řekneme, že bod z = x + jy, patřící do okolí U (z0 ), se se blíží k bodu z0 a píšeme z → z0 ,
jestliže [x, y] → [x0 , y0 ]. Jestliže se pro z → z0 hodnoty funkce f (z) blíží k hodnotě w0 ,
řekneme, že funkce f (z) má v bodě z0 limitu w0 , a píšeme lim f (z) = w0 .
z→z0
Definice 4.2.2 Nechť w = f (z) je komplexní funkce, jejímž definičním oborem je množina G, a dále buď z0 ∈ G. Jestliže existuje limita lim f (z) a platí, že
z→z0
lim f (z) = f (z0 ),
z→z0
řekneme, že funkce w = f (z) je spojitá v bodě z0 .
Matematika 2
39
O spojitosti funkce f (z) v bodě lze rozhodnout podle chování její reálné a imaginární
části.
Věta 4.2.1 Funkce w = f (z) = u(x, y) + jv(x, y) je spojitá v bodě z0 = x0 + jy0 právě
tehdy, když její složky u(x, y) a v(x, y) jsou spojité v bodě [x0 , y0 ].
Pojem derivace funkce komplexní proměnné se opět zavádí podobně jako v reálném
oboru. Musíme ovšem mít na paměti, že celá řada komplexních funkcí – např. funkce
w = Re z + Im z – nemá v reálném oboru analogii, nebo má jiné vlastnosti – viz např. již
zmiňovaná mnohoznačnost funkce w = ln z. Jak potom vypadá derivace takových funkcí?
Definice 4.2.3 Nechť z0 je vnitřní bod množiny G ⊂ C, na němž je definována jednoznačná funkce f (z). Derivací funkce f (z) v bodě z0 nazveme limitu
lim
z→z0
f (z) − f (z0 )
.
z − z0
(4.2.1)
Derivaci funkce f (z) v bodě z0 značíme f 0 (z0 ). Existuje-li derivace f 0 (z) v každém okolí
U (z0 ), pak se funkce nazývá holomorfní3 v bodě f (z0 ). Existuje-li derivace f 0 (z) v každém
bodě definičního oboru G, pak řekneme, že funkce f (z) je holomorfní na G.
Pro praktické ověřování, zda funkce má nebo nemá derivaci, slouží následující věta:
Věta 4.2.2 Nechť je dán bod z0 = x0 + jy0 . Označme P = [x0 , y0 ]. Dále nechť je dána
funkce w = f (z) = u(x, y) + jv(x, y), taková, že parciální derivace u0x (P0 ), u0y (P0 ), vx0 (P0 )
a vy0 (P0 ) existují a jsou spojité. Pak derivace funkce f (z) v bodě z0 existuje právě tehdy,
když současně platí
u0x (P0 ) = vy0 (P0 )
u0y (P0 ) = −vx0 (P0 ).
(4.2.2)
Jestliže má funkce f (z) derivaci v bodě z0 , pak pro tuto derivaci platí
f 0 (z0 ) = u0x (P0 ) + jvx0 (P0 ) = vy0 (P0 ) − ju0y (P0 ).
(4.2.3)
Příklad 4.2.1 Nalezení derivace komplexní funkce f (z)
1. Najděte derivaci funkce w = z̄, kde z̄ značí číslo komplexně sdružené k číslu z =
x + jy.
Řešení: Nejprve je třeba nalézt reálnou a imaginární část zadané funkce. Zřejmě
je w = z̄ = x − jy, tj. u = Re w = x a v = Im w = −y. Jak reálná tak
imaginární část jsou definovány pro libovolné reálné hodnoty, proto definičním
oborem funkce w = z̄ je množina všech komplexních čísel.
Určíme příslušné parciální derivace požadované ve větě 4.2.2. Dostáváme: u0x =
1, u0y = 0, vx0 = 0, vy0 = −1. Vidíme, že podmínky (4.2.2) nejsou splněny pro
žádný bod z0 = x0 + jy0 , resp. P0 = [x0 , y0 ]. Derivace funkce w = z̄ tedy
neexistuje v žádném bodě definičního oboru.
3
Často se také používá označení analytická nebo regulární.
40
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
2. Najděte derivaci funkce w = z 2 + 2z.
Řešení: Protože w = z 2 + 2z = (x + jy 2 ) + 2(x + jy) = x2 + 2jxy − y 2 + 2x + 2jy,
máme u = Re w = x2 + 2x − y 2 a v = Im w = 2xy + 2y. Jak reálná tak
imaginární část jsou definovány pro libovolné reálné hodnoty, proto definičním
oborem funkce w = z 2 + 2z je množina všech komplexních čísel.
Určíme příslušné parciální derivace požadované ve větě 4.2.2. Dostáváme: u0x =
2x + 2, u0y = −2y, vx0 = 2y, vy0 = 2x + 2. Vidíme, že podmínky (4.2.2) jsou
splněny pro libovolný bod z0 = x0 + jy0 , resp. P0 = [x0 , y0 ]. Pro derivaci funkce
w = z 2 + 2z tedy v celém definičním oboru platí w0 = 2x + 2 + j2y. Toto
vyjádření lze upravit do tvaru w0 = 2(x + jy) + 2 = 2z + 2.
Vidíme tedy, že derivace některých nikterak komplikovaných funkcí neexistují. Naopak
pro jiné funkce platí, že jejich derivace v komplexním oboru je stejná, jako bychom se
pohybovali v reálném oboru. Rovnost výsledků není náhodná, platí totiž, že pro derivování
komplexních funkcí platí obdobná pravidla jako u příslušných funkcí reálné proměnné .4
4.3
Elementární funkce komplexní proměnné
Nyní si ukážeme několik elementárních funkcí komplexní proměnné a vzorce pro jejich
vyjadřování.
Definice 4.3.1 Komplexním polynomem P komplexní funkce z nazýváme funkci tvaru
P (z) = α0 + α1 z + α2 z 2 + . . . + αn z n ,
(4.3.1)
kde αi ∈ C, i = 0, 1, . . . , n. Číslo n nazveme stupeň komplexního polynomu P (z); píšeme st P (z). Komplexní racionální funkcí R nazýváme podíl dvou komplexních polynomů
P (z), Q(z), takže
R(z) =
P (z)
.
Q(z)
(4.3.2)
Rozepsáním je vidět, že komplexní polynom P (z) je spojitou funkcí pro všechna komplexní čísla z. Podobně je vidět, že komplexní racionální funkce R(z) je spojitá ve všech
bodech svého definičního oboru, tj. ve všech bodech, kde je Q(z) 6= 0.
Definice 4.3.2 Následující vyjádření uvažujeme pro libovolné z ∈ C.
Komplexní exponenciální funkcí ez nazýváme funkci
∞
ez = 1 +
4
X zn
z
z2
+
+ ... =
1! 2!
n!
n=0
(4.3.3)
Hovoříme o tzv. zákonu permanence pravidel pro derivování funkcí komplexní proměnné. Protože
derivování funkcí kompelxní proměnné je pouze na okraji našeho zájmu, nebudeme jej uvádět ve formě
matematické věty.
Matematika 2
41
Komplexní funkcí kosinus nazýváme funkci
∞
X
z 2n
z2 z4 z6
+
−
+ ... =
(−1)n
cos z = 1 −
2!
4!
6!
(2n)!
n=0
(4.3.4)
Komplexní funkcí sinus nazýváme funkci
∞
X
z
z 2n+1
z3 z5
sin z = −
+
+ ... =
(−1)n
1! 3!
5!
(2n + 1)!
n=0
(4.3.5)
Pro výše uvedené funkce platí následující důležité vztahy:
cos z = 21 (ejz + e−jz )
sin z = 2j1 (ejz − e−jz )
(4.3.6)
(4.3.7)
Z těchto vztahů získáme mj. další možnost vyjádření komplexních čísel. Pokud je totiž
porovnáme s goniometrickým tvarem komplexního čísla z = |z|(cos ϕ+j sin ϕ), dostáváme
vyjádření z = |z|ejϕ . Toto vyjádření nazýváme exponenciální tvar komplexního čísla z.
Pro hodnoty funkcí sin z a cos z samozřejmě neplatí, že nabývají hodnot pouze z
intervalu h−1, 1i (jako v reálném oboru) – zejména proto, že v oboru komplexních čísel
nemá vůbec smysl mluvit o intervalech.5
Pomocí funkcí definovaných v definici 4.3.2 můžeme definovat další funkce, které jsou
známé již z reálného oboru.
Definice 4.3.3 Komplexní funkcí tangens nazýváme funkci
tgz =
sin z
, kde cos z 6= 0.
cos z
(4.3.8)
Komplexní funkcí kotangens nazýváme funkci
cotgz =
cos z
, kde sin z 6= 0.
sin z
(4.3.9)
Komplexní funkcí hyperbolický sinus nazýváme funkci
1
sinh z = (ez − e−z )
2
(4.3.10)
Komplexní funkcí hyperbolický kosinus nazýváme funkci
1
cosh z = (ez + e−z )
2
5
(4.3.11)
Zkuste si např. do vztahu pro cos z ve vzorci 4.3.6 dosadit libovolné ryze imaginární číslo, tj. číslo
tvaru z = kj, kde k ∈ R. Poté dosaďte libovolné komplexní číslo.
42
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
I když mají výše uvedené funkce stejné názvy jako tytéž funkce v reálném oboru, resp.
i když jsou rozšířením známých reálných funkcí, neznamená to, že se do komplexního
oboru beze zbytku přenášejí jejich vlastnosti známé z reálného oboru. Čemu se např.
rovná hodnota ez+2kπj , kde k ∈ Z libovolné?
ez+2kπj = ez .e2kπj = ez [cos 2kπ + j sin 2kπ] = ez
Vidíme tedy, že komplexní exponenciální funkce ez je periodická!
Věta 4.3.1 Komplexní exponenciální funkce ez , komplexní funkce hyperbolický sinus a
kompexní funkce hyperbolický kosinus jsou periodické a mají nejmenší periodou 2πj.
Komplexní funkce sinus a komplexní funkce kosinus jsou periodické a mají nejmenší periodu 2π.
Z periodičnosti funkce ez vyplývá další důležitý poznatek. V reálném oboru je inverzní
funkcí k funkci y = ex funkce y = ln x. Inverzní funkce k periodické funkci však nemůže
být jednoznačná funkce (ve smyslu definice 4.1.2). Definování logaritmu v komplexním
oboru je proto poněkud složitější.6
Definice 4.3.4 Inverzní funkci k exponenciální funkci ez nazýváme (přirozená) logaritmická funkce Ln z.
Věta 4.3.2 Jestliže z = |z|(cos ϕ+j sin ϕ), pak platí Lnz = ln |z|+j(ϕ+2kπ), kde k ∈ Z.
Definice 4.3.5 Pokud ve větě 4.3.2 položíme k = 0, píšeme ln z místo Lnz a tuto funkci
nazýváme hlavní větev logaritmické funkce, resp. hlavní větev logaritmu.
Pokud nebude hrozit nedorozumění, budeme místo o hlavní větvi logaritmu mluvit
přímo o logaritmu. Je však třeba mít na paměti výše uvedené rozlišování. Přirozená logaritmická funkce definovaná v definici 4.3.4 totiž nemusí být na svém definičním oboru
holomorfní (protože na C není jednoznačná). Hlavní větev logaritmu naopak holomorfní
je.
Podobná situace nastává při definování tzv. obecné mocniny αz s komplexním základem α. Podobně jako u logaritmu bychom mohli obecnou mocninu definovat nejprve jako
funkci, o níž by se ukázalo, že je mnohoznačná, a pak se omezit pouze na její hlavní větev.
Pro naše účely však postačuje následující definice.
Definice 4.3.6 Obecnou mocninou αz s komplexním základem α, kde α 6= 0, α 6= 1
nazýváme funkci definovanou vztahem
αz = ez ln α ,
(4.3.12)
kde ln α je hlavní větev logaritmu Lnα.
6
Následující definice není zcela korektní; pro účely tohoto textu však postačuje. Přesnou definici lze
nalézt např. v [?].
Matematika 2
43
Příklad 4.3.1 Určete hodnoty následujících výrazů (uvažujte pouze hlavní větve logaritmu).
1. ln (−1)
Řešení: Protože −1 = (cos π + j sin π) = ejπ , máme ln (−1) = ln 1 + jπ = jπ.
2. j j
Řešení: Podle (4.3.12) je j j = ej ln j . Protože j = cos π2 +j sin π2 , je ln j = ln 1+j π2 ,
π
2π
tedy po dosazení j j = ej 2 = e− 2 .
4.4
Integrál funkce komplexní proměnné
Situace při integrování funkcí v komplexním oboru bude poněkud složitější než v reálném
oboru. Prozatím jste rozlišovali integrály dvojího druhu – neurčitý s jeho vztahem k pojmu
primitivní funkce a určitý s jeho geometrickým významem jako obsah jisté plochy. Nyní
začneme pracovat s integrálem, kde bude důležitou roli hrát křivka, po níž bude integrace
probíhat.
Definice 4.4.1 Nechť jsou dány dvě reálné funkce f : hα, βi → R a g : hα, βi → R dané
předpisy f = x(t) a g = y(t) pro každé t ∈ hα, βi. Nechť jsou f, g spojité a jejich derivace
nechť jsou po částech spojité. Nechť je dále dána funkce Γ definovaná na intervalu hα, βi,
tj. Γ : hα, βi → C, taková, že
Γ : z(t) = x(t) + jy(t)
(4.4.1)
pro každé t ∈ hα, βi. Říkáme, že funkce Γ je po částech hladká orientovaná křivka v
komplexní rovině. Bod z(α) nazýváme jejím počátečním bodem; bod z(β) nazýváme jejím
koncovým bodem. Vyjádření (4.4.1) nazýváme parametrickým vyjádřením nebo parametrickou rovnicí křivky Γ.
Všimněte si, že v definici 4.4.1 pracujeme s komplexní funkcí reálné proměnné, tj. t
nabývá reálných hodnot. Jinak bychom nemohli mluvit o intervalu hα, βi. V definici je
použit výraz orientovaná křivka. JAK MOC SE TOMU VĚNOVAT?
Příklad 4.4.1 Parametrická vyjádření některých často užívaných křivek
1. Úsečka s krajními body z1 , z2 :
z(t) = z1 + (z2 − z1 )t,
t ∈ h0, 1i.
(4.4.2)
2. Kladně orientovaná kružnice se středem v bodě z0 a poloměrem r:
z(t) = z0 + r.ejt ,
t ∈ h0, 2πi.
(4.4.3)
44
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
Definice 4.4.2 Nechť f (z) = u(x, y) + jv(x, y) je spojitá a jednoznačná funkce na po
částech hladké orientované křivce Γ : z(t) = x(t) + jy(t), t ∈ hα, βi. Pak integrálem
funkce f po křivce Γ nazýváme výraz
Zβ
Z
f (z)dz =
f (z(t))z 0 (t) dt.
(4.4.4)
α
Γ
Křivku Γ nazýváme integrační cesta.
Pro takto definované integrály platí analogie vět známých z reálného oboru.
Věta 4.4.1 Buďte f (z), f1 (z), f2 (z) funkce komplexní proměnné, Γ, Γ1 , Γ2 po částech
hladké orientované křivky a k ∈ C. Pak platí:
R
R
R
(f1 (z) + f2 (z))dz = f1 (z)dz + f2 (z)dz
(4.4.5)
Γ
Γ
Γ
R
R
kf (z)dz = k f (z)dz
(4.4.6)
Γ
Γ
Jestliže Γ = Γ1 ∪ Γ2 a Γ1 a Γ2 mají jediný společný bod, pak
R
R
R
f (z)dz = f (z)dz + f (z)dz,
Γ
Γ1
(4.4.7)
Γ2
Jestliže Γ2 je opačně orientovaná křivka Γ1 , pak
R
R
f (z)dz = − f (z)dz
Γ1
(4.4.8)
Γ2
Z definice 4.4.2 vyplývá, že výpočet integrálu funkce komplexní proměnné po křivce Γ
převedeme na výpočet určitého integrálu reálné funkce reálné proměnné. Ze vzorce 4.4.4
vyplývá provázanost integrálu s integrační cestou. Je zřejmé, že integrál ze stejné funkce
po různých křivkách je různý.
Příklad 4.4.2 Výpočet integrálu
R komplexní funkce po křivce
Vypočtěte následující integrály f (z)dz, je-li dáno:
Γ
1. f (z) = Re z, Γ je úsečka s počátečním bodem z1 = 0 a koncovým bodem z2 = 1 + j.
Řešení: Podle vztahu 4.4.2 je parametrické vyjádření Γ : z(t) = (1 + j)t, kde
t ∈ h0, 1i. Pro výpočet integrálu potřebujeme následující údaje:
Γ:
α, β :
z 0 (t)dt :
f (z(t)) :
Celkem tedy získáváme, že
R
Γ
z(t) = (1 + j)t
α = 0, β = 1
dz = (1 + j)dt
Re z = t
Re zdz =
R1
0
2
t(1 + j)dt = (1 + j)[ t2 ]10 =
1
2
+ 21 j.
Matematika 2
45
2. f (z) = Re z, Γ je lomená čára spojující body z1 = 0, z2 = 1, z3 = 1 + j.
Řešení: Zadaná funkce je sice stejná jako v předcházejícím případě, ale integrační
cesta je jiná (i když počáteční a koncový bod jsou stejné). Lomená čára zcela
jistě splňuje předpoklady pro použití vztahu (4.4.7). Za Γ1 budeme považovat
úsečku spojující body z1 = 0 a z2 = 1 a za Γ2 úsečku spojující body z2 = 1 a
z3 = 1 + j. Pro výpočet integrálu potřebujeme následující údaje:
Γ1 :
α1 , β1 :
z 0 (t)dt :
f (z(t)) :
z(t) = t
α1 = 0, β1 = 1
dz = dt
Re z = t
Γ2 :
α2 , β2 :
z 0 (t)dt :
f (z(t)) :
z(t) = 1 + jt
α2 = 0, β2 = 1
dz = jdt
Re z = 1
Celkem tedy
Z1
Z
Re zdz =
tdt +
0
Γ
Z1
1
t2
jdt = [ ]10 + j[t]10 = + j,
2
2
0
přičemž pro druhý integrál jsme použili vzorec (4.4.6).
Provázanost integrálu s integrační cestou je nepříjemná, protože vpodstatě znemožňuje
mluvit o integrálu ve smyslu určitého integrálu známého z předmětu Matematika 1. Ve
speciálních případech to však možné je, jak je patrné z níže uvedených příkladů 4.4.3 a
4.4.4.
Definice 4.4.3 Uzavřenou křivkou nazýváme takovou křivku Γ, jejíž počáteční bod
splývá s jejím koncovým bodem. Rovinnou oblast7 Ω nazýváme jednoduše souvislou
oblastí, jestliže splňuje následující podmínku: zvolíme-li v Ω libovolnou uzavřenou křivku
Γ, pak do Ω patří všechny části roviny ohraničené křivkou Γ.
Definice 4.4.4 Buď Ω rovinná oblast a f (z) funkce komplexní proměnné. Jestliže existuje
funkce F (z) s vlastností, že F 0 (z) = f (z) pro každé z ∈ Ω, pak píšeme, že
Z
f (z)dz = F (z) + C
a říkáme, že F (z) je primitivní funkcí k funkci f (z).
Věta 4.4.2 Nechť funkce f (z) je spojitá a má primitivní funkci F (z) v jednoduše souvislé
oblasti Ω. Nechť dále Γ je libovolná po částech hladká orientovaná
křivka s počátečním
R
bodem z1 a koncovým bodem z2 ležící Ω. Pak hodnota integrálu f (z)dz nezávisí na tvaru
Γ
křivky Γ ale pouze na jejích krajních bodech a platí
Z
f (z)dz = F (z2 ) − F (z1 ).
Γ
7
Pojem oblast byl definován v předmětu Matematika 1.
(4.4.9)
46
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
Věta 4.4.3 Nechť je dána funkce f (z), která je holomorfní v jednoduše souvislé oblasti
Ω. Pak pro její integrál po každé uzavřené křivce Γ, která leží v Ω platí
Z
f (z)dz = 0.
(4.4.10)
Γ
Příklad 4.4.3 Výpočet integrálu
R komplexní funkce
Vypočtěte následující integrály f (z)dz, je-li dáno:
Γ
1. f (z) = sin z, Γ je úsečka spojující body z0 = 0 a z1 = πj
Řešení: Úsečka je zcela jistě po částech hladká orientovaná křivka. Vzhledem k
tomu, že funkce f (z) = sin jz je na celém oboru C spojitá a holomorfní a vzhledem k zákonu permanence pravidel pro derivování funkcí komplexní proměnné
(viz str. 40) je primitivní funkcí k funkci f (z) = sin jz funkce F (z) = cos jz.
Můžeme proto použít větu 4.4.2. Dostáváme, že
Z
1
sin jzdz = − [cos jz]πj
0 = −2j.
j
Γ
2. f (z) = ez , Γ je obvod kladně orientovaného obdélníka s vrcholy z1 = −1, z2 = 1,
z3 = 1 + j, z4 = −1 + j
Řešení: Protože funkce f (z) = ez je holomorfní na celé množině C a Γ je uzavřená
křivka, můžeme použít větu 4.4.3. Hledaný integrál je tedy roven nule.
Věta 4.4.4 Nechť funkce f (z) je holomorfní uvnitř a na křivce Γ, která je uzavřená, po
částech hladká a kladně orientovaná.8 Pak platí:
R f (z)
dz = 2πjf (z0 ), jestliže z0 leží uvnitř Γ,
z−z0
Γ
R
Γ
f (z)
dz
z−z0
= 0, jestliže z0 leží vně Γ.
Vzorec uvedený v této větě se často nazývá Cauchyho vzorec. Všimněte si, že věta
nepopisuje případ, kdy z0 ∈ Γ.
Vzhledem k tomu, že v komplexením oboru lze každý polynom rozložit na součin liP (z)
neárních polynomů, lze i každou komplexní racionální funkci R(z) = Q(z)
takovou, že
st P (z) < st Q(z) rozložit (rozkladem na parciální zlomky, tj. postupem známým z předmětu Matematika 1 ) na součet funkcí stejného typu jako je uvedeno ve větě 4.4.4.
Příklad 4.4.4
Výpočet integrálu komplexní funkce pomocí Cauchyho vzorce
R
dz
Vypočtěte z(z2 +1)2 , je-li Γ kružnice se středem z0 = 0 a poloměrem r = 21 .
Γ
8
V tomto textu budeme kladnou orientaci vždy předpokládat.
Matematika 2
47
Řešení: Kružnice je uzavřená křivka. Pokud výraz z(z21+1)2 rozložíme na parciální zlomky,
bude čitatel každého zlomku komplexní číslo, resp. konstantní funkce, tj. funkce, která
je na celém oboru C holomorfní. Budou tedy splněny předpoklady věty 4.4.4. Platí:
z(z 2
B
D
A
C
E
1
+
= +
+
+
2
2
2
+ 1)
z
(z + j)
z + j (z − j)
z−j
Dříve než začneme hledat konstanty A, B, C, D, E je vhodné si všimnout jmenovatelů
parciálních zlomků a porovnat je se zlomky ve větě 4.4.4. Body z0 = j a z0 = −j
leží vně Γ, proto ať budou čísla B, C, D, E jakákoliv, budou příslušné zlomky rovny
nule. Stačí tedy určit pouze konstantu A. Lehce se ukáže, že A = 1. Proto:
Z
Z
dz
dz
= 2πj.
=
z(z 2 + 1)2
z
Γ
4.5
Γ
Řady v komplexním oboru a jejich využití při
integrování
Z předmětu Matematika 1 si vzpomínáte, že funkce je možné v okolí jistých bodů nahradit
nekonečnou řadou. Podobně lze postupovat i v komplexního oboru. Jisté členy takových
řad pak budou hrát důležitou roli při integraci komplexních funkcí. Nejprve však musíme zavést několik dalších pojmů, které jsou ovšem pouze analogiemi pojmů známých z
reálného oboru.
Definice 4.5.1 Nechť {cn }∞
n=1 je posloupnost komplexních čísel cn = an + jbn , kde an , bn
jsou reálná čísla, n = 1, 2, . . . , ∞. Řadu
c1 + c2 + c3 + . . . =
∞
X
cn
(4.5.1)
n=1
nazýváme komplexní řadou. Řadu
c0 + c1 (z − z0 ) + c2 (z − z0 )2 + . . . =
∞
X
(z − z0 )n
(4.5.2)
n=0
nazýváme komplexní mocninnou řadou se středem v bodě z0 . Výraz sn =
n
P
ci nazýváme
i=1
n−tý částečný součet. Posloupnost {sn }∞
n=1 se nazývá posloupnost částečných součtů.
∞
P
Existuje-li vlastní limita lim sn = s, říkáme, že řada
konverguje a číslo s nazýváme
n→∞
c=1
jejím součtem. Jestliže řada nekonverguje, říkáme, že diverguje.
∞
∞
P
P
Věta 4.5.1 Komplexní řada
cn =
(an + jbn ), kde an , bn ∈ R konverguje a jejím
n=1
n=1
součtem je číslo s = a + jb právě tehdy, když konvergují obě reálné řady
přičemž platí, že
∞
P
n=1
an = a a
∞
P
n=1
∞
P
n=1
bn = b.
an a
∞
P
n=1
bn ,
48
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
Rozhodování o konvergenci a divergenci komplexních řad je podobné jako u reálných
řad. Podobně je tomu i u mocninných řad, kde stejně jako v reálném oboru pracujeme s
pojmem poloměr konvergence.
V předmětu Matematika 1 jste zaváděli pojem Taylorova řada. Jejím zobecněním je
následující konstrukce. Uvědomte si, že množina bodů z ∈ C taková, že |z − z0 | < r je
kružnice se středem z0 a poloměrem r.
Věta 4.5.2 Nechť je dána funkce f (z), která je holomorfní na mezikruží 0 < r1 < |z −
z0 | < r2 . Pak pro každé z ležící v tomto mezikruží, lze funkci f (z) rozvinout do řady
f (z) =
∞
X
an (z − z0 )n ,
(4.5.3)
f (z)dz
,
(z − z0 )n+1
(4.5.4)
n=−∞
pro jejíž koeficienty platí n ∈ Z a
1
an =
2πj
Z
Γ
kde Γ je libovolná kružnice se středem v bodě z0 a poloměrem r takovým, že r1 < r < r2 .
Věta 4.5.3 Nechť je dána funkce f (z). Je-li možné ji v mezikruží 0 < r1 < |z − z0 | < r2
rozvést do řady (4.5.3), pak pro její koeficienty platí (4.5.4).
Definice 4.5.2 Řada konstruovaná ve větě 4.5.2 se nazývá Laurentova řada. Její část
pro −∞ < n ≤ −1 se nazývá hlavní část Laurentovy řady; její část pro 0 ≤ 0 < n se
nazývá regulární část Laurentovy řady. Bod z0 nazýváme středem Laurentovy řady.
Častým případem komplexních funkcí jsou komplexní racionální funkce. Tyto funkce
jsou holomorfní v celém oboru C, ovšem s výjimkou kořenů jmenovatele. Tuto představu
můžeme zobecnit a takové body klasifikovat. Pojmy, které nyní zavedeme, mohou výrazným způsobem ulehčit výpočet integrálů komplexních funkcí.
Definice 4.5.3 Buď f (z) jednoznačná funkce. Bod z0 ∈ C nazýváme izolovaným singulárním bodem funkce f (z), jestliže f (z) není v bodě z0 holomorfní, avšak existuje r > 0
takové, že v oblasti 0 < |z − z0 | < r funkce f (z) holomorfní je.
Jinými slovy, bod z0 je izolovaným singulárním bodem, jestliže v je funkce holomorfní
na nějakém jeho okolí, ale není holomorfní přímo v něm. Následující věta a definice mj.
vysvětlují, proč bylo nutné definovat pojem Laurentovy řady.
Věta 4.5.4 Existuje r > 0 takové, že lze zkonstruovat Laurentovu řadu funkce f (z) se
středem z0 , která v oblasti 0 < |z − z0 | < r konverguje .
Definice 4.5.4 Izolovaný singulární bod z0 nazveme pólem9 funkce f (z), jestliže hlavní
část Laurentovy řady této funkce se středem z0 má konečný počet členů. Index posledního
členu hlavní části této řady se nazývá řád pólu.
9
Typů izolovaných singulárních bodů existuje více; pro naše účely však stačí definovat pouze póly.
Matematika 2
49
P (z)
racionální lomená funkce, pak nemá jiné izolované
Věta 4.5.5 Jestliže je f (z) = Q(z)
singulární body než kořeny jmenovatele Q(z). Každý izolovaný singulární bod funce f (z)
je navíc pólem. Pro každý pól komplexní racionální funkce navíc platí, že jeho řád je roven
násobnosti kořene rovnice Q(z) = 0.
Příklad 4.5.1 Určení izolovaných singulárních bodů komplexní racionální funkce
z
Je dána funkce f (z) = z4 +16
. Popište její izolované singulární body.
Řešení: Funkce f (z) je komplexní racionální funkce. Má tedy pouze póly, které lze určit
jako řešení rovnice z 4 − 16 = 0. Řád těchto pólů je násobnost příslušných kořenů.
Protože
z 4 − 16 = (z 2 − 4)(z 2 + 4) = (z − 2)(z + 2)(z − 2j)(z + 2j),
jsou póly funkce f (z) právě body z1 = 2, z2 = −2, z3 = 2j, z4 = −2j. Řád každého
pólu je 1.
Pokud budeme chtít integrovat komplexní funkce jistého speciálního tvaru (zejména
racionální komplexní funkce), sehrají izolované singulární body (zejména póly) významnou roli.
Definice 4.5.5 Nechť je dána funkce f (z) a její rozvoj do Laurentovy řady se středem
∞
P
z0 ve tvaru f (z) =
an (z − z0 )n . Koeficient an−1 v tomto rozvoji nazýváme reziduum
n=−∞
funkce f (z) v bodě z0 a píšeme rez f (z).
z=z0
Věta 4.5.6 Nechť komplexní funkce f (z) je holomorfní uvnitř a na jednoduché uzavřené,
kladně orientované křivce Γ s výjimkou pólů z1 , z2 , . . . , zn uvnitř Γ. Pak platí:
Z
n
X
rez f (z).
(4.5.5)
f (z)dz = 2πj
k=1
Γ
z=zk
Podmínky předcházející věty splňuje např. každá racionální komplexní funkce. Vidíme
tedy, že pokud chceme určit integrál z takové funkce přes libovolnou jednoduchou uzavřenou a kladně orientovanou křivku, stačí pouze sečíst rezidua v pólech této racionální
lomené funkce. Uvedený postup je tedy v tomto případě alternativou k rozkladu na parciální zlomky a užití věty 4.4.4 – viz příklad 4.4.4.
Z definice pojmu reziduum a ze srovnání definice 4.5.5 a vzorců 4.5.4 pro koeficienty
Laurentovy řady ovšem vyplývá, že takový postup nejspíš bude velmi pracný. Následující
věta tyto překážky odstraní – podává návod na řešení konkrétních příkladů.
Věta 4.5.7 Nechť je dána funkce f (z), která má v bodě z0 pól. Jedná-li se o pól prvního
řádu, pak platí:
rez f (z) = lim (z − z0 )f (z),
z=z0
z→z0
(4.5.6)
jedná-li se obecně o pól řádu m, platí:
rez f (z) =
z=z0
∂ m−1
1
lim
[(z − z0 )m f (z)].
(m − 1)! z→z0 ∂z m−1
(4.5.7)
50
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
Příklad 4.5.2
R z2Výpočet integrálu pomocí reziduí
Vypočtěte (z2 +1)2 , je-li křivka Γ dána rovnicí |z + j| = 1.
Γ
Řešení: Křivka Γ je kružnicí o středu z = −j a poloměru 1, zadaná funkce je komplexní racionální funkcí. Mohli bychom ji tedy rozložit na parciální zlomky a použít
větu 4.4.4. Stejně tak ovšem můžeme použít i větu 4.5.6 (zdůvodněte si sami). Nejprve najdeme póly zadané funkce. Je vidět, že funkce má dva póly, a sice body
z1 = −j, z2 = j. Oba jsou druhého řádu, ale pouze z1 leží uvnitř Γ. Bude proto
Z
z2
z2
= 2πj rez 2
.
z=−j (z + 1)2
(z 2 + 1)2
Γ
Protože z1 je pól druhého řádu, budeme muset použít vzorec 4.5.7. Připomeňme, že
∂m−1
značí derivaci řádu m − 1 podle proměnné z. Máme
∂z m−1
z2
z2
−2jz
j
z2
2
0
=
lim
[(z
+
j)
]
=
lim
[
]0 = lim
= .
2
2
2
2
3
z→−j
z→j (z − j)
z→−j (z − j)
z=−j (z + 1)
(z + 1)
4
R
2
Pro hledaný integrál tedy platí (z2z+1)2 = 2πj 4j = − π2 .
rez
Γ
Výpočet reziduí v pólech funkcí (a tedy podle věty 4.5.6 také integrálů) máme usnadněn také v případě, že integrovaná funkce je podílem dvou holomorfních funkcí.
ϕ(z)
Věta 4.5.8 Nechť f (z) = ψ(z)
, kde funkce ϕ(z) a ψ(z) jsou holomorfní v bodě z0 a
0
ϕ(z0 ) 6= 0, ψ(z0 ) 6= 0, ψ(z0 ) 6= 0. Pak má funkce f (z) v bodě z0 pól prvního řádu a platí
rez f (z) =
z=z0
ϕ(z0 )
.
ψ(z0 )0
(4.5.8)
Příklad 4.5.3 Výpočet rezidua v pólech funkce – podílu dvou holomorfních funkcí
Vypočtěte rezidua ve všech pólech funkce f (z) = sin1 z .
Řešení: Zadaná funkce splňuje předpoklady věty 4.5.8 – funkce ϕ(z) = 1 a ψ(z) = sin z
jsou holomorfní v celém oboru C. Řešením rovnice sin z = 0 jsou body zk = kπ, kde
k ∈ Z. Dále platí, že [sin z]0 = cos z a cos kπ 6= 0. Funkce f (z) má tedy v bodech
zk = kπ, k ∈ Z, póly prvního řádu. Platí
rez
z=zk
1
1
1
=
=
= (−1)k .
0
[sin kπ]
cos kπ
(−1)k
Kapitola 5
Integrální transformace
5.1
5.1.1
Matematický aparát pro signály
Diracova zobecněná funkce δ(t), zobecněná derivace
Při studiu mnoha přírodních jevů se setkáváme s veličinami, které jsou nulové vně malého intervalu, jejichž integrál je nenulový. Takový charakter má veliká síla působící po
velmi krátkou dobu (náraz) velké elektrické proudy působící jen velice krátkou dobu (elektrický impuls) aj. Z věty o střední hodnotě integrálu vyplývá, že funkční hodnoty takovéto
funkce musí velké a pro délku intervalu blížící se nule musí funkční hodnoty růst nade
všechny meze. Provedením obvyklého limitního přechodu, bychom získali funkci nulovou
s výjimkou jednoho bodu s neohraničenou funkční hodnotou. Integrál z takovéto funkce je
ovšem nulový a tedy výše naznačený postup je nevyhovující. Budeme postupovat podobně
jako jako u reálných čísel, kdy iracionální čísla chápeme jako posloupnost čísel racionálních blížících se k danému iracionálnímu číslu. Budeme se zabývat posloupností funkcí
majících výše popsanou vlastnost, rostoucích funkčních hodnotna zužujícím se inter
1
1
n
η(t − ) − η(t + ) .
valu. Prototypem je posloupnost obdélníkových kmitů fn (t) =
2
n
n
51
52
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
Jako zobecnění tohoto pojmu zavedeme pojem jehlové funkce
Definice 7 Spojitou příp. po částech spojitou funkci δ(t, λ) argumentu t závislou na parametru λ se nazveme jehlovou jestliže platí:
1. δ(t, λ) = 0 pro |t| > λ;
2. δ(t, λ) ≥ 0 pro |t| < λ;
Z λ
Z ∞
δ(t, λ)dt = 1
δ(t, λ)dt =
3.
−λ
−∞
Uvažme limitní chování jehlové funkce δ(t, λ) pro λ → 0. Současně platí
• δ(t, λ) = 0 pro t 6= 0 a λ → 0.
• δ(0, λ) = ∞ pro λ → 0, což plyne užitím věty o střední hodnotě určitého integrálu.
To znamená, že limita
Z bjehlové funkce v klasickém slova smyslu neexistuje. Uvažujme
f (t)δ(t, λ)dt pro λ → 0 a spojitou funkci f (t). I v tomto případě
proto limitní chování
nastanou dva případy.
a
• Pro ab < 0 (a < b) platí
Z
b
Z
λ
f (t)δ(t, λ)dt =
Z
−λ
a
Z
• Pro ab > 0 (a < b) platí
λ
f (t)δ(t, λ)dt = f (τ )
δ(t, λ)dt = f (τ ),
−λ
b
f (t)δ(t, λ)dt = 0
a
b
Z
f (t)δ(t, λ)dt nezávisí na volbě konkrétní jehlové funkce δ(t, λ)
Protože hodnota lim
λ→0
a
můžeme použít stručnější zápis
Definice 8 Zaveďme označení
Z b
Z b
lim
f (t)δ(t, λ)dt =
f (t)δ(t)dt.
λ→0
a
(5.1.1)
a
Zde užitý symbol δ(t) nazýváme Diracovou distribucí, Diracovým impulsem. Je tzv. zobecněnou funkcí, charakterizující limitní chování jehlové funkce δ(t, λ) pro λ → 0 a užívá
se při výpočtu integrálů.
Pro Diracovu distribuci δ(t) a spojitou funkci f (t) platí
Z ∞
Z ∞
f (t)δ(t − t0 )dt =
f (t)δ(t0 − t)dt = f (t0 )
−∞
−∞
(5.1.2)
Matematika 2
53
Pro monotónní funkci, která má prostý nulový bod v 0 ϕ(0) = 0 ∧ ϕ0 (0) 6= 0 platí
Z
∞
f (t)δ(ϕ(t))dt =
−∞
f (0)
|ϕ0 (0)|
(5.1.3)
Vztah mezi Diracovým impulsem a Heavisideovou funkcí η(t) je dán skutečností:
(
1 pro t > 0
δ(θ)dθ = η(t) =
.
0 pro t < 0
−∞
Z
t
Heavisideovou funkci jednotkového skoku tak můžeme chápat jako zobecněnou primitivní
funkci Diracova impulsu. Tento vztah je podobný vztahu mezi Heavisideovou funkcí η(t)
a identickou funkcí ψ(t)
(
t pro t > 0
η(θ)dθ = ψ(t) =
.
0 pro t < 0
−∞
Z
t
Využitím vztahu mezi integrálem a derivací můžeme tak chápat Diracovu distribuci jako
derivaci Heavisideovy funkce jednotkového skoku, kterou můžeme dále chápat jako derivaci identické funkce ψ(t). Tj.
ψ 00 (t) = η 0 (t) = δ(t).
Situaci ilustruje následující obrázek
Tato ukázka ilustruje obecnější situaci zavedení zobecněné derivace funkcí, které jsou
po částech spojité spolu s derivací.
Definice 9 Nechť je funkce f (t) nespojitá v t0 , potom ji vyjádříme ve tvaru součtu
f (t) = ψ(t) + ( lim f (t) − lim f (t))η(t − t0 ),
t→t0 +
t→t0 −
kde funkce ψ(t) má v t0 odstranitelnou nespojitost a je možno ji v bodě t0 dodefinovat tak,
že bude spojitá. Zobecněnou derivaci fo0 (t) lze lze potom vyjádřit ve tvaru distribuce
fo0 (t) = ψ 0 (t) + ( lim f (t) − lim f (t))δ(t − t0 ),
t→t0 +
kde ψ 0 (t) je derivací klasickou.
t→t0 −
(5.1.4)
54
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
Uvedený postup koresponduje také se zavedením derivace zobecněné δ(t) funkce, tj. stanovení limity pro h → 0 z integrálu
Z b
f (−h) − f (0)
δ(t + h) − δ(t)
dt =
f (t)
h
h
a
Má–li funkce f (t) derivaci f 0 (0) dostáváme
(
Z b
−f 0 (0)
δ(t + h) − δ(t)
lim
f (t)
dt =
h→0 a
h
0
pro 0 ∈ (a, b)
pro 0 ∈
6 (a, b)
Definice 10 Nechť funkce f (t) má f 0 (t0 ) potom zavedeme označení
Z b
Z b
δ(t0 + h) − δ(t0 )
f (t)δ 0 (t − t0 )dt.
dt =
lim
f (t)
h→0 a
h
a
(5.1.5)
Zde užitý symbol δ 0 (t) nazýváme derivací Diracovy distribuce. Analogicky zavádíme n–tou
derivaci Diracovy distribuce.
Z b
δ (n−1) (t0 + h) − δ (n−1) (t0 )
lim
f (t)
dt =
h→0 a
h
(
Z b
(−1)n f (n) (t0 ) pro 0 ∈ (a, b)
f (t)δ (n) (t − t0 )dt =
. (5.1.6)
0
pro 0 6∈ (a, b)
a
Poznámka 1 Je-li navíc jehlová funkce sudá v proměnné t je možné vyjádřit i integrál z
funkce nespojité v bodě 0:
Z b
1
f (t)δ(t)dt =
lim f (t) + lim f (t)
t→0−
2 t→0+
a
V následující ukázce budou výše uvedené vlastnosti demonstrovány na příkladech.
Příklad 6 1. Zjednodušte výraz (t3 + 1)δ(t − 2)
Protože je funkce t3 + 1 spojitá lze daný výraz podle (5.1.2) nahradit (23 + 1)δ(t − 2) =
9δ(t − 2).
Z ∞
Vypočtěte integrál
e−pt δ(t − 3)dt
0
Z 0
S využitím (5.1.2) a skutečnosti
e−pt δ(t − 3)dt = 0 dostáváme
−∞
Z
∞
−pt
e
Z
i
δ(t − 3)dt =
nf tye−pt δ(t − 3)dt = e−3p
−∞
0
Z
∞
2. Vypočtěte integrál
(t2 + 2)δ(5 − 5t)dt
−∞
Postupně využijeme vlastnosti (5.1.2), (5.1.3) a dostáváme:
Z
Z ∞
1 ∞ 2
2
(t + 2)δ(1 − t)dt = 12 + 2 = 3
(t + 2)δ(5 − 5t)dt =
5 −∞
−∞
3. Následující funkce zapište jediným analytickým zápisem a určete její první a druhou
zobecněnou derivaci.
Matematika 2
1.
55


2t
f (t) = 3

2
t
pro − ∞ < t < 0
pro 0 < t < 2
pro 2 < t < ∞
K požadovanému zápisu využijeme funkci jednotkového skoku. Uvažme funkci g(t) =
2t + (3 − 2t)η(t). Pro t < 0 platí g(t) = 2t, neboť součin (3 − 2t)η(t) je nulový a
pro t > 0 platí g(t) = 2t + 3 − 2t = 3, neboť η(t)(3 − 2t) = 3 − 2t. Tedy platí
g(t) = f (t) pro t < 2. V dalším zopakujeme daný postup, tj. k funkci g(t) přičteme
součin η(t−2) se vhodnou funkci ve tvaru rozdílu analytického vyjádření funkce f (t)
pro t > 3 minus analytického vyjádření funkce f (t) pro t < 3 tj.
f (t) = 2t + (3 − 2t)η(t) + (t2 − 3)η(t − 2).
Pro funkce vyjádřené „složitějiÿ postupujeme analogicky vždy „zleva dopravaÿ.
fo0 (t) =2 − 2η(t) + (3 − 2t)δ(t) + 2tη(t − 2) + (t2 − 3)δ(t − 2) =
2 − 2η(t) + 3δ(t) + 2tη(t − 2) + δ(t − 2)
fo00 (t) = − 2δ(t) + 3δ 0 (t) + 2η(t − 2) + 2tδ(t − 2) + δ 0 (t − 2) =
− 2δ(t) + 3δ 0 (t) + 2η(t − 2) + 4δ(t − 2) + δ 0 (t − 2)
Poznamenejme, že třetí zobecněná derivace bude pouze lineární kombinací funkce
jednotkového skoku a jejich derivací.
2. Další funkcí je tzv. obecný trojúhelníkový impuls zadaný grafem, který je mimo interval [t1 , t3 ] nulový a vrchol trojúhelníka má pro t = t2 (t1 < t2 < t3 ) hodnotu
v.
K požadovanému zápisu využijeme funkci jednotkového skoku. Uvažme funkci
vt
η(t − t1 ). Tato funkce odpovídá danému signálu pro t < t2 , neboť
g1 (t) =
t2 − t1
pro t < t1 je nulová a pro t1 < t < t2 je to přímka procházející body [t1 , 0], [t2 , v].
V dalším kroku přičteme násobek funkce η(t − t
2 ), který „odečteÿ starou
přímku
vt
−vt
a „přičteÿ novou přímku tj. g2 (t) = g1 (t) −
+
η(t − t2 ).
t2 − t − 1 t3 − t2
analogicky „přičtemeÿ vhodný násobek funkce η(t − t3 ).
f (t) =
vt
η(t − t1 )−
t2 − t1
vt
−vt
+
t2 − t1 t3 − t2
η(t − t2 ) −
−vt
η(t − t3 ),
t3 − t2
56
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
což po úpravě dává
f (t) =
vt ((t3 − t2 )η(t − t1 ) + (t1 − t3 )η(t − t2 ) + (t2 − t1 )η(t − t3 ))
(t2 − t1 )(t3 − t2 )
Zobecněnou derivaci určíme snadno ze skutečnosti ψ 00 (t) = η 0 (t) = δ(t).
fo0 (t) =
v ((t3 − t2 )η(t − t1 ) + (t1 − t3 )η(t − t2 ) + (t2 − t1 )η(t − t3 ))
(t2 − t1 )(t3 − t2 )
fo00 (t) =
v ((t3 − t2 )δ(t − t1 ) + (t1 − t3 )δ(t − t2 ) + (t2 − t1 )δ(t − t3 ))
(5.1.7)
(t2 − t1 )(t3 − t2 )
5.1.2
Periodické a harmonické funkce
Při vyšetřování periodických dějů, jako jsou např. elektrické, mechanické a akustické
kmity, kruhové pohyby apod. a při řešení diferenciálních či integrálních rovnic používáme
periodické funkce. Mějme dán interval I = < a, b > a označme T = b − a. Řekneme, že
funkce f (x) je periodická s periodou T , jestliže platí f (x+T ) = f (x) ∀ x ∈ R. Zabývejme
Obr. 5.1.1: Periodická funkce
se nejdříve speciálními periodickými funkcemi.
Definice 11 Reálnou harmonickou funkcí nazýváme každou reálnou funkci, kterou je
možné zapsat v tzv. fázovém tvaru
f (t) = F cos(ωt + ϕ), kde − ∞ < t < ∞.
(5.1.8)
Je zřejmé, že harmonická funkce f (t) je jednoznačně určena trojicí parametrů F , zvaným
amplituda, ϕ, zvaným počáteční fáze a ω, zvaným frekvencí.
Udává-li funkce f (t) závislost nějaké fyzikální veličiny na čase, pak se hovoří o harmonickém kmitání. Poznamenejme navíc, že každé nenulové řešení diferenciální rovnice
f 00 + ω 2 f = 0, kde ω > 0.
Matematika 2
57
Platí také, že harmonická funkce (5.1.8) je pro F 6= 0 periodická s periodou T = 2π/ω.
Za předpokladu, že hodnota frekvence ω je pevně zvolena lze funkci (5.1.8) jednoznačně určit dvojicí F , ϕ nebo jedním komplexním parametrem F̂ nazývaným komplexní
amplituda:
F̂ = F ejϕ (= F (cos ϕ + j sin ϕ)) ,
(5.1.9)
tj. |F̂ | = F , arg F̂ = ϕ. Pro harmonické funkce se stejnou frekvencí ω
f1 (t) = F1 cos(ωt + ϕ1 ) f2 (t) = F2 cos(ωt + ϕ2 ),
za předpokladu, že
F̂1 + F̂2 = F1 ejϕ1 + F2 ejϕ2 6= 0
je i součet harmonická funkce se stejnou frekvencí ω tj.
f (t) = F1 cos(ωt + ϕ1 ) + F2 cos(ωt + ϕ2 ) = F̂ cos(ωt + ϕ).
Navíc komplexní amplituda součtu je součtem komplexních amplitud tj.
F̂ = F̂1 + F̂2 .
Poznamenejme, že i funkce f (t) = F sin(ωt + ϕ) je také harmonická funkce, neboť platí
sin(ωt + ϕ) = cos(ωt + ϕ − π/2. Další možností zápisu harmonické funkce je
F cos(ωt + ϕ) = a cos ωt + b sin ωt,
přičemž a = F cos ϕ, b = F sin ϕ.
5.1.3
Fourierovy trigonometrické řady
Dále se budeme zabývat možností vyjádřit periodickou funkci f (t) s periodou T jako
„součetÿ harmonických funkcí, které jsou T periodické. To jest
∞
a0 X
an cos nωt + bn sin nωt, kde ωT = 2π.
+
f (t) =
2
n=1
(5.1.10)
Tuto řadu nazýváme Fourierovou trigonometrickou řadou. Upozorněme, že Fourierovy
řady se v technické praxi často používají velice formálně, bez ověření přípustnosti jejich
použití, což může vést k naprosto nesprávným výsledkům. Pokud tedy provádíme různé
operace formálně, je nutné se zpětně přesvědčit, že použití všech operací bylo oprávněné.
O Fourierově řadě hovoříme, jestliže sčítané funkce tvoří tzv. ortogonální systém. Systém funkcí v řadě (5.1.10)
1, cos ωt, cos 2ωt, . . . , sin ωt, sin 2ωt, . . .
je ortogonální, je-li zaveden skalární součin jako určitý integrál přes interval délky T ze
součinu dvou různých prvků tohoto systému, tj. pro m 6= n platí:
Z θ+T
Z θ+T
Z θ+T
cos nωtdt =
sin nωtdt =
cos nωt cos mωtdt =
θ
θ
θ
Z θ+T
Z θ+T
cos nωt sin mωtdt =
sin nωt sin mωtdt = 0 (5.1.11)
θ
θ
58
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
Tato vlastnost je podstatná pro určení tzv. Fourierových koeficientů an , bn tak, že
zvolený koeficient získáme z lineární rovnice, která formálně vznikne vynásobením
rovnosti (5.1.10) funkcí, která násobí zvolený koeficient, a následnou integrací přes
interval délky T . Na pravé straně rovnice zůstane pouze jediný nenulový integrál, což je
patrné vzhledem ke vztahům (5.1.11):
Z
Z
2 θ+T
2 θ+T
f (t) cos nωtdt
bn =
f (t) sin nωtdt
(5.1.12)
an =
T θ
T θ
V některých aplikacích se dává přednost exponenciálnímu tvaru této řady, tj. tvaru
f (t) =
∞
X
cn ejnωt , kde ω =
n=−∞
2π
.
T
V tomto případě pro koeficienty cn lze odvodit vztahy:
Z
1 θ+T
an − jbn
an + jbn
cn =
f (t)e−jnωt dt cn =
c−n =
T θ
2
2
(5.1.13)
(5.1.14)
Navíc pro reálnou funkci f (t) platí, že c0 je reálné číslo a cn = Fn eiϕn a c−n = Fn e−iϕn
jsou čísla komplexně sdružená.
Dalším v technické praxi užívaným tvarem Fourierova trigonometrického rozvoje je
fázový tvar:
∞
a0 X
Fn cos(jnωt + ϕn ),
(5.1.15)
f (t) =
+
2
n=1
kde 2cn = Fn ejϕn (Fn je modul a ϕn je argument komplexního čísla 2cn , nebo-li Fn cos ϕn =
an , Fn sin ϕn = −bn .
Poznamenejme, že podmínkou pro stanovení koeficientů an , bn , případně cn nebo Fn ,
ϕn je možnost určit integrál z této funkce na intervalu délky T . Tato podmínka není ovšem
dostatečná pro platnost vztahu (5.1.10) případně (5.1.13) nebo (5.1.15). V literatuře je
udáván často jako příklad takovéto funkce součet řady
s(t) =
∞
X
sin nt
n=2
ln n
,
která není Fourierovou řadou žádné integrovatelné funkce na intervalu [0, 2π].
Definice 12 Řekneme, že je funkce po částech spojitá na uzavřeném intervalu, jestliže
je možné tento interval rozdělit konečným počtem bodů t1 , t2 , . . . , tk tak, že na každém
z těchto intervalů je spojitá a existují konečné jednostranné limity v bodech ti pro i =
1, . . . , k.
Dále řekneme, že je funkce po částech monotónní na uzavřeném intervalu, jestliže je možné
tento interval rozdělit konečným počtem tak, že na každém z těchto intervalů je monotónní.
Řekneme, že funkce splňuje na uzavřeném intervalu Dirichletovy podmínky, jestliže je
tomto intervalu počástech spojitá a počástech monotónní.
Matematika 2
59
Věta 1 Nechť funkce f (t) je periodická a splňuje Dirichletovy podmínky, potom řada na
pravé straně vztahu (5.1.10) resp. (5.1.13) resp. (5.1.15) (kde Fourierovy koeficienty jsou
definovány vztahy (5.1.12) resp. (5.1.14)) konverguje pro každé t a její součet je roven
1. f (t0 ) v každém bodě spojitosti t0 funkce f (t)
1
1
lim f (t) + lim f (t) v každém bodě nespojitosti t0
2. (f (t0 −) + f (t0 +)) =
t→t0 +
2
2 t→t0 −
funkce f (t).
Příklad 7 Sestrojme Fourierovu řadu funkce f (t) = t pro t ∈ [−π, π], která má periodu
2π
= 1. Dále zvolíme θ = −π, neboť ze skutečnosti, že
T = 2π. V tomto případě je ω = 2π
funkce je lichá určíme koeficienty an = 0, protože je určující integrály jsou z liché funkce
a tedy jsou nulové. Pomocí integrace per partes spočítáme
π
Z π
2
2
t cos nt sin nt
(−1)n+1
bn =
t sin nt dt =
+
−
=
2π −π
π
n
n2 0
n
Při výpočtu integrálu jsme také využili možnosti vyjádřit integrál ze sudé funkce na intervalu symetrickém okolo počátku jako dvojnásobek integrálu z této funkce na kladné polovině
tohoto intervalu. Protože funkce f (t) splňuje Dirichletovy podmínky podle (1)řada
∞
X
2(−1)n+1 sin nt
n=1
n
konverguje pro všechna t ∈ R a pro t ∈ (−π, π) je rovna t, pro t = nπ je rovna 0.
Následující obrázek ukazuje částečné součty postupně až po 8 členů.
Obr. 5.1.2: Aproximace funkce f (t) = t
V další ukázce rozvineme sudou funkci, která popisuje periodicky se opakující obdélníkové
impulsy, do komplexního tvaru Fourierova rozvoje.
Příklad 8 Uvažujme obdélníkový signál, který má šířku 2ε, výšku h a délka periody je
T (T > 2ε). Funkci f (t),která vyhovuje zadaným požadavkům, tak aby byla sudá, tj. v
60
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
intervalu [−T /2, T /2] bude signál umístěn v intervalu [−ε, ε]. Potom platí ω = 2π/T :
1
cn =
T
Z
T /2
−jnωt
f (t)e
−T /2
1
dt =
T
Z
ε
he−jnω t dt =
−ε
−jnωt ε
h
h sin nωε
e
=
−ε
−jnωT
T nω
Skutečnost, že funkce f (t) je sudá nám neumožnila určit část koeficientů cn , ale projevila
se díky vzorcům (5.1.14) v tom, že cn jsou reálné (neboť bn = 0).
Příklad 9 Rozviňme tzv. dvoucestné a jednocestné usměrnění ve Fourierovu řadu.
Dvoucestné usměrnění je definované relací fd (t) = | sin t| nebo též podrobněji f (t) =
sin t pro t ∈ [0, π] a funkce fd (t) je periodická s periodou π, tj. f (t + π) = f (t) . Funkce
je zřejmě sudá a proto pro všechna n bn = 0. Stačí tedy určit jen koeficienty an . Nejdříve
vypočteme koeficient a0 :
Z π
Z
2 π
2
4
2
| sin t| dt =
| sin t| dt = [− cos t]π0 = .
a0 =
2π −π
π 0
π
π
Využitím známé trigonometrické relace
sin α cos β =
1
(sin(α + β) + sin(α − β))
2
postupně vypočteme
Z
Z
2 π
1 π
an =
sin t cos nt dt =
(sin(n + 1)t − sin(n − 1)t) dt =
π 0
π 0
π
1
cos(n + 1)t cos(n − 1)t
1
cos(n + 1)π − 1 cos(n − 1)π − 1
+
+
−
=
−
=
π
n+1
n−1
π
n+1
n−1
0
(
−4
pro n sudé,
1
(−1)n+1 − 1 (−1)n−1 − 1
2 (−1)n+1 − 1
2
−
+
=
= π(n −)
π
n+1
n−1
π (n + 1)(n − 1)
0
pro n liché.
Protože funkce fd (t) je spojitá dostáváme její Fourierův rozvoj ve tvaru
fd (t) =
∞
2
4 X cos 2mt
−
π π m=1 4m2 − 1
Jednocestné usměrnění je definováno vztahem fj (t) = 12 (| sin t| + sin t). S využitím
linearity integrálu je zřejmé, že součet funkcí má rozvoj ve tvaru součtu rozvojů. Využijeme
znalosti rozvoje dvoucestného usměrnění a bezprostředně dostáváme:
∞
1
1
2 X cos 2mt
fj (t) = sin t + −
2
π π m=1 4m2 − 1
Matematika 2
61
Obr. 5.1.3: Dvoucestné a jednocestné usměrnění
Předcházející ukázky nás mohou motivovat k úvaze, za jakých předpokladů je možné
funkci rozvinou v řadu sinů nebo cosinů. Z předcházejících ukázek je patrné, že lichou
funkci (f(-t)=-f(t)) rozložíme ve Forierovu řadu pouze lichých funkcí tj. v řadu sinů a
sudou funkci (f(-t)=f(t)) rozložíme ve Forierovu řadu pouze sudých funkcí tj. v řadu
cosinů.
Poznámka 2 Jestliže funkce f (t) splňuje Dirichletovy podmínky (viz. Definice 12)potom
lze také získat integrál z funkce f (t) jako řadu, která vznikne z původní integrací jejich
členů. Analogické tvrzení pro derivaci platí, jestliže řada vzniklá derivováním jednotlivých
členů konverguje, což nemusí být vždy splněno.
Chceme-li rozvinout ve Fourierovu řadu funkci f (t) = cos t pro t ∈ (0, π) s periodou π,
tj. f (t + π) = f (t) Tuto funkci můžeme s výjimkou bodů nπ chápat jako derivaci funkce
| sin t|. Navíc splňuje Dirichletovy podmínky a její Fourierův rozvoj exstuje a můžeme jej
bezprostředně získat derivací člen po členu rozvoje funkce | sin t|, neboť ten konverguje tj.
∞
8 X m sin 2mt
f (t) =
π m=1 4m2 − 1
Naopak derivací člen po členu rozvoje v ukázce 7 vznikne řada, která nesplňuje nutnou
podmínku konvergence a tedy uvedený postup nelze použít.
Grafické znázornění Fourierova rozvoje - Spektrum
Graficky Fourierův rozvoj reprezentujeme pomocí spektra,kdy jednu číselnou osu užíváme
k vynášení frekvencí nω = nT
a v rovině kolmé na osu frekvencí koeficienty an = Fn cos ϕn ,
2π
bn = Fn sin ϕn jsou souřadnicemi bodu přiřazeného n-té harmonické složce Fourierova
rozvoje. Tato grafická interpretace je ovšem trojrozměrné, proto se používá zobrazení
pomocí dvou rovinných zobrazení, kdy se na jednu osu vynáší frekvence nω = nT
a
2π
na druhou koeficient an resp. bn , které znázorníme úsečkou začínající na ose frekvencí a
končící v bodě jehož druhá souřadnice je an resp. bn . Druhou možností je vynášet místo
dvojice an , bn dvojici Fn , ϕn , hovoříme tak o spektru modulů a spektru argumentů.
Další možností je vyjádření spektra pro Fourierův rozvoj v komplexním tvaru. Analogicky s reálným oborem můžeme vytvořit dvojici zobrazující zvlášť reálnou a imaginární
část koeficientu cn nebo obvykle postupujeme tak, že zobrazujeme komplexní koeficient
cn dvojicí jeho amplitudy a argumentu.
Analogicky s harmonickými funkcemi platí pro spektra funkcí:
62
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
1. spektrum součtu je rovno součtu spekter
2. spektrum α násobku funkce je rovno α násobku tohoto spektra
3. posunutá funkce fτ (t) = f (t − τ ) má spektrum modulů stejné jako funkce f (t) a
spektrum argumentů je o nωτ menší tj.
ϕϕn = ϕn − nωτ
4. spektrum funkce se změněným měřítkem f (mt) má periodu T /m a frekvence harmonických složek jsou násobkem mω, ale koeficienty an , bn a tedy moduly Fn a
argumenty ϕn jsou stejné.
Závěrem uveďme vztah pro střední hodnotu součinu dvou funkcí se stejnou periodou,
pro které existuje Fourierův rozvoj, tj. :
∞
∞
1 X
a0 X
an cos nωt + bn sin nωt =
+
cn e−jnωt
f (t) =
2
2 n=−∞
n=1
g(t) =
∞
∞
1 X
α0 X
αn cos nωt + βn sin nωt =
+
γn e−jnωt
2
2
n=−∞
n=1
S využitím ortogonality trigonometrického systému funkcí na intervalu délky periody T =
2π
je možné získat
ω
Z
∞
∞
a0 α 0 1 X
1 X
1 T
f (t)g(t) dt =
+
(an αn + bn βn ) =
cn γ−n
T 0
2 2
2 n=1
4 n=−∞
Pomocí tohoto vztahu můžeme určit střední výkon
Z
1 T
u(t)i(t) dt
T 0
ustálené elektromagnetické soustavy, které je napájená ze zdroje, jehož napětí u(t) je
periodická funkce u(t), a v ustáleném stavu je proud i(t) rovněž periodická funkce.
Pro f (t) = g(t) dostáváme tzv. Parsevalovu rovnost tj.
Z
∞
∞
a 2 1 X
1 T
1 X
0
f (t)62 dt =
+
(an an + bn bn ) =
cn c−n
T 0
2
2 n=1
4 n=−∞
5.1.4
Fourierův integrál
V této sekci se budeme zabývat přenesením aparátu Fourierova rozvoje periodických
funkcí na funkce, které nejsou periodické. Uvažujme na intervalu [− T2 , T2 ] funkci f (t),
splňující zda Dirichletovy podmínky viz. definice 12. S využitím věty 1 dostáváme:
T
f (t) =
∞
X
1
T
n=−∞
Z
T
2
− T2
f (x)e−jnωx dx e−jnωt =
∞
X
1
T
n=−∞
Z2
− T2
f (x)e−jnω(x−t) dx.
Matematika 2
63
pro ∆zm = zm+1 − zm = 2π
navíc platí ∆zm → 0 pro
Dále označme zn = nω = n2π
T
T
T → ∞. Navíc je při tomto označení vyjádření funkční hodnoty f (t) možné interpretovat
tuto
T
Z2
∞
X
1
f (t) =
∆zm−1
f (x)e−jnzn (x−t) dx,
2π n=−∞
− T2
jako integrální součet funkce
T
1
2π
Z2
f (x)e−jnz(x−t) dx
− T2
proměnné z na intervalu −∞, ∞. Formálním provedením limitního přechodu pro periodu
T → ∞ obdržíme Fourierův integrální vzorec:
Z ∞Z ∞
1
f (x)e−jnz(x−t) dx dz
(5.1.16)
f (t) =
2π −∞ −∞
Před stanovením podmínek za jejichž splnění uvedený vztah platí uveďme definici
Definice 13 Řekneme, že funkce f (t) je absolutně integrovatelná, jestliže platí
Z ∞
|f (t)| dt < ∞
−∞
Věta 2 Nechť je funkce f (t) absolutně integrovatelná a f (t), f 0 (t) jsou po částech spojité
viz. definice 12, potom pravé straně vztahu (5.1.16) je roven
1. f (t0 ) v každém bodě spojitosti t0 funkce f (t)
1
1
2. (f (t0 −) + f (t0 +)) =
lim f (t) + lim f (t) v každém bodě nespojitosti t0
t→t0 +
2
2 t→t0 −
funkce f (t).
Různými aspekty Fourierova integrálního vzorce se budeme zabývat v následujícím textu,
neboť složením Fourierovy transformace přímé a zpětné je právě Fourierův integrální
vzorec.
5.2
Fourierova transfomace
Definice 14 Nechť f (t) je funkce reálné proměnné t (reálná nebo komplexní), která je
absolutně konvergentní. Potom vztah
Z ∞
F (jω) =
f (t)e−jωt dt
(5.2.1)
−∞
64
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
nazýváme přímou Fourierorvou transformací, funkce f (t) se nazývá předmětem a funkce
F (ω) obrazem Fourierovy transformace. Druhý vztah, který můžeme vysvětlovat tak, že ze
známé funkce F (ω) určíme funkci f (t):
Z ∞
1
F (jω)ejωt dω
(5.2.2)
f (t) =
2π −∞
nazýváme zpětnou Fourierovou transfomací. transformací. Vztah mezi funkcemi f (t) a
F (jω) stručně zapisujeme F (f (t)) = F (jω) a F −1 (F (jω)) = f (t)
Poznámka 3 Zápis F (jω) je třeba interpretovat jako složenou funkci, kdy vnější složkou
je integrál obsahující komplexní proměnnou za kterou dosadíme vnitřní složku jω. Tato
forma zápisu se vyskytuje v literatuře a je zvykem.
Obecně platí, že v případě sudé funkce f (−t) = f (t) se výše uvedené integrály zjednoduší na tzv. Fourierovu cosinovou transformaci:
Z ∞
Z ∞
1
F (ω) cos nωt dω
f (t) cos nωt dt
f (t) =
F (ω) =
2π −∞
−∞
a v případě liché funkce f (−t) = −f (t) na tzv. Fourierovu sinovou transformaci:
Z ∞
Z ∞
1
f (t) sin nωt dt
f (t) =
F (ω) =
F (ω) sin nωt dω
2π −∞
−∞
Fourierovu transformaci není možné „použít na libovolné funkceÿ, neboť užívané integrály
nemusí obecně konvergovat. Situaci popisuje následující věta
Věta 3 Nechť je funkce f (t) absolutně integrovatelná, potom obraz Fourierovy transformace F (jω) existuje a je spojitá funkce, pro kterou platí lim = 0.
ω→±∞
Dále platí tzv. Parsevalova rovnost.
Z ∞
Věta 4 Nechť
|f (t)|2 dt < 0. Potom platí
−∞
Z
∞
1
|f (t)| dt =
2π
−∞
2
Z
∞
|F (jω)|2 dω
−∞
Další vlastnosti uspořádáme pro větší přehlednost do tabulky. Před uvedením věty, která
shrne základní vlastnosti Fourierovy transformace připomeňme pojem konvoluce dvou
absolutně integrovatelných funkcí. Konvolucí funkcí f (t), g(t) nazýváme funkci f ∗ g(t)
definovanou vztahem:
Z ∞
f ∗ g(t) =
f (t − s)g(s) ds.
(5.2.3)
−∞
Věta 5 O předmětech Fourierovy transformace (funkce v tabulce vlevo) předpokládáme, že
jsou absolutně integrovatelné. Navíc označme F f (t) = F (jω), případně F g(t) = G(jω).
Matematika 2
65
Věta o
předmět
obraz
linearitě
af (t) + bg(t)
aF (t) + bG(t)
t
1
F
r
r
podobnosti
f (rt)
f (t − r) exp(−jrω)F (jω)
posunutí předmětu
exp(jrt)f (t)
F (ω − r)
derivaci předmětu
f (n) (t)
(jω)n F (jω)
derivaci obrazu
tn f (t)
jn
posunutí obrazu
Z
integraci předmětu
t
f (τ ) dτ
0
konvoluci předmětu
konvoluci obrazu
dn F (jω)
d ωn
F (jω)
jω
f (t) ∗ g(t)
F (jω)G(jω)
f (t)g(t)
F (jω) ∗ G(jω)
Při zavádění Fourierovy transformace pro funkce nesplňující výše uvedené podmínky nebo
pro zobecněné funkce postupujeme tak, že uvedenou funkci případně zobecněnou funkci
chápeme jako „limituÿ posloupnosti funkcí, které uvedené předpoklady splňují a Fourierův
obraz potom chápeme jako limitu obrazů funkcí dané posloupnosti. Takto můžeme nalézt
obraz Fourierovy transformace Diracovy distribuce nebo funkce jednotkového skoku, ale v
těchto konkrétních případech můžeme formálně postupovat i tak,že u Diracovy distribuce
využijeme tzv. filtrační vlastnost (5.1.2):
Z ∞
F δ(t − t0 ) =
δ(t − t0 )e−jωt dt = e−jωt0 .
(5.2.4)
−∞
Pro derivaci Diracovy delta funkce lze odvodit:
Z ∞
(n)
F δ (t − t0 ) =
δ(t − t0 )e−jωt dt = (jω)n e−jωt0 .
(5.2.5)
−∞
Analogicky můžeme přímým výpočtem získat:
−jωt ∞
Z ∞
Z ∞
−j
e
−jωt
−jωt
=
F η(t) =
η(t)e
dt =
e
dt =
jω 0
ω
−∞
0
5.2.1
(5.2.6)
Užití Fourierovy transformace
Užití některých z uvedených vlastností budeme demonstrovat při výpočtu Fourierova
obrazu některých speciálních signálů a při řešení diferenciálních rovnic.
66
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
Fourierova transformace některých signálů
Příklad 10 Uvažujme obdélníkový signál, který má šířku 2ε, výšku h. Daný signál bude
navíc umístěn tak, aby funkce f (t),která jej popisuje byla sudá, tj. signál bude umístěn v
intervalu [−ε, ε].
F f (t) = F (jω) =
Z
∞
−jωt
f (t)e
−∞
Z
ε
dt =
he−jω t dt =
−ε
h −jnωt ε
sin nωε
= 2h
e
−ε
−jnω
nω
Poznámka 4 Na dané ukázce a ukázce 8 je možné demonstrovat limitní přechod spektra Fourierova rozvoje periodického obdélníkového signálu (s periodou T ) viz. ukázka 8
v obraz Fourierovy transformace jednoho obdélníkového signálu. Uvažme, že koeficienty
cn Fourierova rozvoje jsou integrály (5.1.14) násobené převrácenou hodnotou periody T ,
která se v limitním přechodu „použijeÿ k vytvoření dělení vnějšího integrálu ve Fourierově integrálním vzorci. Proto si také zobrazíme modifikované spektrum kdy koeficienty cn
vynásobíme periodou T . V následující tabulce jsou zobrazena pouze spektra modulů, protože argumenty koeficientů cn jsou nulové. Úhlový kmitočet základní harmonické složky je
ω = 2π/T .
T
modifikované spektrum
spektrum
4
16
64
Z uvedených spekter je patrné, že pro zvětšující se T roste hustota spekter a pro hodnotu
T = 64 při zvoleném grafickém znázornění (tloušťka čar) modifikovaného spektra obraz
spektra je stejný jako integrál vyjadřující Fourierovu transformaci.
Poznámka 5 Další možností užití obrazu sudého obdélníkového impulsu je odvodit Fourierův obraz Diracova impulsu δ(t), který chápeme jako limitní chování
Matematika 2
67
jehlové funkce viz. definice 7. Za tuto jehlovou funkci můžeme volit obdélníky
1
(η(t − ε) − η(t + ε)). Využijeme-li výsledek předchozí ukázky dostaneme
δ(t, ε) =
2ε
obraz δ(t) jako limitu obrazů jednotlivých obdélníkových impulsů:
2 sin nωε
=1
ε→0 2ε
nω
F δ(t) = lim F δ(t, ε) = lim
ε→0
Příklad 11 Nalezněte Fourierův obraz tzv. obecného trojúhelníkového impulsu f (t) zadaného grafem, který je mimo interval [t1 , t3 ] nulový a vrchol trojúhelníka má pro t = t2
(t1 < t2 < t3 ) hodnotu v.
K jeho určení využijeme znalosti druhé zobecněné derivace (??) a užijeme také větu o
derivaci předmětu a pro obraz F (jω) dostáváme rovnici
− ω 2 F (jω) =
v ((t3 − t2 )e−jωt1 + (t1 − t3 )δ(t − t2 ) + (t2 − t1 )δ(t − t3 ))
.
(t2 − t1 )(t3 − t2 )
Co po úpravě dává:
F (jω)
=
−
v ((t3 − t2 )e−jωt1 + (t1 − t3 )e−jωt2 + (t2 − t1 )e−jωt3 )
.
ω 2 (t2 − t1 )(t3 − t2 )
Poznamenejme, že pro sudý trojúhelníkový impuls tj, t1 = −T , t2 = 0, t3 = T lze obraz
zapsat jednoduše:
!2
ωT
jωT
−jωT
sin
2(cos ωT − 1
Te
− 2T + T e
2
=v
= vT
F (jω) = v
ωT
2
2
2
T ω
Tω
2
2 2
Příklad 12 Nalezněte Fourierův obraz funkce f (t) = e−a t . Nejdříve poznamenejme, že
funkce má obraz Fourierovy transformace, neboť existuje integrál
√
Z ∞
Z ∞
π
−a2 t2
−a2 t2
e
dt = 2
e
dt =
a
−∞
0
Výpočet tohoto integrálu lze nalézt v literatuře viz [?]. Pro funkci f (t) platí diferenciální
rovnice
2 2
f 0 (t) = −a2 2te−a t = 2a2 tf (t)
Pro Fourierův obraz této rovnice dostáváme
jωF (jω) = F f 0 (t) = −2a2 F tf 0 (t) = −2a2 j
d F (jω)
.
dω
68
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
Což je diferenciální rovnice se separovanými proměnnými, jak vidíme v následující úpravě,
jež řeší danou rovnici:
ω
d F (jω)
dω =
2
2a
F (jω)
Z
Z
dF
ω
− 2dω =
2a
F
2
ω
− 2 + ln |C| = ln |F | ⇒
4a
−
ω2
F (jω) = Ce− 4a2 , kde C ∈ R
Integrační konstantu C určíme dosazením ω = 0:
√
Z ∞
π
−a2 t2
C = F (0) =
e
dt =
a
−∞
√
π − ω22
2 2
Celkově tak dostáváme F e−a t =
e 4a
a
Diferenciální rovnice
V literatuře známým užitím Fourierovy transformace je řešení diferenciální rovnice vedení
tepla v nekonečně dlouhé a tenké tyči, kterou ztotožníme s osou x a popisujeme ji pomocí
funkce u(x, t), jejíž hodnota udává teplotu v bodě o souřadnici x a v čase t. Tato funkce
vyhovuje tzv. počáteční diferenciální úloze:
au00xx = u0t ,
u(x, 0) = g(x),
l ≥ 0,
−∞ < x < ∞
Použitím Fourierovy transformace (vzhledem k proměnné x) dostaneme pro obraz
F u(x, t) = U (jω, t) rovnici (diferenciální vzhledem k proměnné t), kterou řešíme:
dU
dU
⇒
= −aω 2 d t ⇒ U (jω, t) = G(jω) exp(−aω 2 t),
dt
U
kde G(jω) = F g(x) je obraz počátečního rozložení g(x). Při hledání předmětu využijeme,
že obraz konvoluce je součinem obrazů. Nejdříve stanovíme předmět k obrazu exp(−aω 2 t)
s využitím ukázky 12(proměnná obrazu je x, t je parametr):
x 1
−1
2
F exp(−aω t) = √
exp −
.
2at
2 πat
a(jω)2 U =
Rovnice vedení tepla má řešení (tzv. elementární) ve tvaru konvolučního integrálu:
Z∞ exp − (x−ξ)2
4t
√
u(x, t) =
g(ξ) dξ.
2 πt
−∞
Poznámka 6 Při použití Fourierovy transformace k řešení rovnic se může stát, že uvedeným postupem není možné nalézt všechna řešení (aniž bychom se dopustili chyby), neboť
použití Fourierovy transformace omezuje prostor funkcí viz. definice 13, které je možno
takto získat. Konkrétní příklad je možné nalézt v [?] (ukázka 7.2).
Matematika 2
5.2.2
69
Slovník Fourierovy transformace
Předmět
Obraz
tn e−at , a > 0, n > 0
Γ(n + 1)
(a + jω)n+1
1
t2 + a2
π
exp(−a|ω|)a > 0
a
e−a|t| , a > 0
a2
2a
+ ω2
2(a2 − ω 2
(a2 + ω 2 )2
s √
e−a|t|
ω 2 + a2 + a
p , a>0
2π
a2 + ω 2
|t|
p
p
p
√
exp(−a/ |t|)
2(cos 2π|ω| − sin 2π|ω|)
p
, a>0
|ω|
|t|
r
π − ω2
−at2
e
, a>0
e 4a
a
√
πω ω2
−at2
te
−j √ e− 4a
, a>0
2a a
r sin at
π
1
1
p
p
j
−p
2
|t|
|ω − a|
|ω + a|
r cos at
π
1
1
p
p
+p
2
|t|
|ω − a|
|ω + a|
s
1
2π
p
|ω|
|t|
r
π
ω2 π 2
sin at
cos
+
a
2a 4
r
π
ω2 π cos at2
cos
−
a
2a 4
|t|e−a|t| , a > 0
70
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
5.3
Laplaceova transformace
V mnoha technických aplikacích jsou studovány děje, které „začínajíÿ od nějakého okamžiku, např. připojíme elektrický obvod k napětí, spustíme stroj atd. O takových procesech můžeme předpokládat, že jejich studium začne v čase „0ÿ. Pro studium dějů tohoto
typu, které jsou popsány rovnicemi, jež kromě neznámé funkce obsahují i její derivace případně integrál (integrodiferenciální rovnice) je s výhodou používáno tzv. operátorového
počtu. Kdy k dané rovnici vytvoříme její obraz, který je obvykle snadněji řešitelný, proto
najdeme řešení této rovnice a zpětným procesem nalezneme řešení původního problému.
Celý postup můžeme přirovnat k použití logaritmů k násobení čísel v dobách, kdy
neexistovaly kalkulačky. Protože při ručním počítání je sečtení čísel výrazně jednodušší
než násobení čísel, lidé určovali součin tak, že pomocí logaritmických tabulek našli logaritmy jednotlivý činitelů, jejich součet a po zpětném použití logaritmických tabulek (tzv.
delogaritmování) hledaný součin.
Hojně v elektrotechnice užívanou integrální transformaci je transformace Laplaceova,
která reálné funkci přiřazuje funkci komplexní. Vymezme si nejdříve třídu funkcí pro,
kterou je tato transformace definována
Definice 15 Funkci f (t) nazveme předmětem neboli originálem Laplaceovy transformace,
jestliže splňuje následující podmínky
1. f (t), f 0 (t) jsou po částech spojité na R,
2. f (t) = 0 pro t < 0,
3. existují kladné konstanty M , s tak, že platí |f (t)| ≤ M exp(st) na R. Říkáme, že
f (t) je funkcí ohraničeného růstu s indexem s.
Definice 16 Jestliže pro t ∈ R a některá p ∈ C konverguje nevlastní integrál
Z ∞
f (t) exp(−pt) dt
F (p) =
(5.3.1)
0
nazýváme jím definovanou funkci F (p) Laplaceovou transformací nebo Laplacevým obrazem funkce f (t). Toto budeme zapisovat f (t) ↔ F (p) nebo F (p) = L f (t).
Často budeme zobrazovat elementární funkce, které nesplňují předpoklad ii) definice 15.
Tento „problémÿ lze snadno eliminovat tak, že danou funkci násobíme Hevisideovou funkcí
jednotkového skoku η(t). Tuto skutečnost často mlčky předpokládáme a nezapisujeme.
Příklad 13 Nalezneme Laplaceův obraz funkce jednotkového skoku η(t). Před každým
nalezením obrazu je vhodné ověřit, že integrál definující obraz konverguje. Stačí ověřit,
že je originálem Laplaceovy transformace viz.definice 15. U Heavisideovy funkce snadno
ověříme i platnost předpokladu 3) dané definice např. volbou konstant s = 0, M = 2.
Přímým výpočtem získáme:
L η(t) =
Z∞
0
exp(−pt)
exp(−pt) dt = lim −
u→∞
p
u
=
0
1
exp(−ptu)
1
− lim
=
p u→∞
p
p
Matematika 2
71
V následující ukázce odvodíme obecnější vztah pro L tn η(t)
Příklad 14 Nalezneme Laplaceův obraz funkce tn η(t), kde n je celé nezáporné číslo. U
této funkce snadno ověříme i platnost předpokladu 3) dané definice např. volbou konstant
s = 1, M = 1. Nejdříve odvodíme rekurentní vztah:
L t η(t) =
n
Z∞
tn exp(−pt)
t exp(−pt) dt = lim −
u→∞
p
n
0
n
p
Z∞
tn−1 exp(−pt) = − lim
u→∞
u
+
0
exp(−pu) n
n
+ L tn−1 η(t) = L tn−1 η(t)
p
p
p
0
Využijeme předchozí ukázku jako L t0 η(t) = 1/p a užitím rekurentního vztahu celkově
dostaneme:
n!
L tn η(t) = n+1
p
Příklad 15 Nalezneme Laplaceův obraz funkce exp(−ωt)η(t). Pro ověření předpokladu
3) definice 15 stačí volit konstanty s = 1, M = 1.
L exp(ωt)η(t) =
Z∞
exp(ωt) exp(−pt) dt =
0
exp(−(p − ω)t)
lim −
u→∞
p−ω
u
=
0
exp(−(p − ω)u)
1
1
− lim
=
p + a u→∞
p−ω
p−ω
Poznamenejme, že v poslední ukázce je možné za číslo ω použít libovolnou konstantu i
komplexní.
Před uvedením věty, která bude shrnovat základní vlastnosti Laplaceovy transformace,
je vhodné se vrátit k pojmu konvoluce. Pro originály Laplaceovy transformace rozumíme
konvolucí funkcí f (t), g(t) funkci f ∗ g(t) definovanou vztahem:
Z
f ∗ g(t) =
t
f (t − s)g(s) ds,
(5.3.2)
0
který je užitím výše definované konvoluce na originály Laplaceovy transformace.
Věta 6 Předpokládejme, že všechny vzory jsou originály Laplaceovy transformace, dále
r > 0, ω ∈ C jsou konstanty.
72
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
Věta o
předmět
obraz
Poznámka
linearitě
af (t) + bg(t)
aF (p) + bG(p)
funkce f , g mají index růstu ≤ <p
podobnosti
f (rt)
posunutí předmětu
vpravo
f (t − r)η(t − r)
posunutí předmětu
vlevo
f (t + r)η(t)
1
F
r
t
r
exp(−rp)F (p)
Zr
erp F (p) − e−pt f (t) dt
0
posunutí obrazu
exp(ωt)f (t)
F (p − ω)
derivaci předmětu
f 0 (t)
pF (p) − f (0+ )
f (0+ ) = lim f (t)
t→0+
n−1
X
n-té derivaci
předmětu
f (n) (t)
derivaci obrazu
tf (t)
−F 0 (p)
derivaci podle
parametru α
fα0 (t, α)
Fα0 (p, α)
pn F (p) −
i=0
Z
integraci předmětu
t
F (p)
p
f (τ ) dτ
0
integraci obrazu
f (i) pn−1−i
f (t)
t
Z
∞
F (z) dz
p
konvoluci předmětu
f (t) ∗ g(t)
F (p)G(p)
Duhamelův vzorec
f (0+ )g(t) + f 0 ∗ g(t)
pF (p)G(p)
Některá tvrzení plynou bezprostředně z vlastností integrálu. V dalším se proto zaměříme
na užití některých vět.
Příklad 16 Ukážeme jiný způsob získání výsledku z ukázek 14 15.
Funkci f (t) = tn je možné určit vlastnostmi f (n) (t) = n!, f (i) (0) = 0 pro i = 0, . . . , n −
1. Užitím věty o n-té derivaci předmětu dostáváme
n!
n!
= L (tn )(n) = pn L tn − 0 ⇒ L tn = n+1
p
p
Matematika 2
73
Analogicky lze užitím užitím věty o posunutí v obraze z Laplaceovy transformace funkce
jednotkového skoku η(t) odvodit obraz funkce eωt :
1
L eωt η(t) = L η(t − ω) =
p−ω
Příklad 17 Laplaceův obraz funkce sin at můžeme získat užitím Eulerova vzorce a linearity Laplaceovy transformace z předchozího výsledku:
L ejat − L e−jat
ejat − e−jat
=
=
2j
2j
1
1
1
1 p + jat − (p − jat)
a
−
=
=
2j p − jat p + jat
2j
p 2 + a2
p 2 + a2
Laplaceův obraz funkce cos at bychom mohli získat obdobně,jestliže využijeme předchozího výsledku a věty o derivaci předmětu dostáváme:
a
p
aL cos at = L (sin at)0 = p 2
− sin 0 ⇒ L cos at = 2
2
p +a
p + a2
Derivací podle parametrů a odvodíme Laplaceův obraz funkce t cos at:
a
∂ p2 +a
2
p 2 − a2
∂ sin at
=
= 2
L t cos at = L
∂a
∂a
(p + a2 )2
L sin at = L
Uvedený výsledek lze také získat jako −
p
d p2 +a
2
, užitím věty o derivaci obrazu.
dp
Poznámka 7 Z některých ukázek je patrné, že gramatika Laplaceovy transformace umožňuje nalézt i předmět k danému obrazu (inverzní Laplaceova transformace). Situaci detailněji popisuje Lerchova věta 9.
Nyní se zabývejme podrobněji obrazy dvou typů předmětů. Prvním typem jsou periodické předměty.
Řekneme, že funkce f (t), je T periodická, jestliže platí f (t + T ) = f (t) pro t > 0.
Označme fT (t) = f (t) − f (t)η(t − T ) funkci tvořenou jednou periodou v intervalu [0, T ]
a mimo tento interval nulovou. Dále označme L f (t) = F (p), L fT (t) = FT (p)
f (t)η(t) = fT (t) + f (t − T )η(t − T ).
Situaci ilustruje následující obrázek.
74
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
Po aplikaci Laplaceovy transformace na tuto rovnost s využitím věty o posunutí v
předmětu odvodíme:
Z ∞
Z T
f (t) exp(−tp) dt = FT (p) + exp(−T p)F (p).
f (t) exp(−tp) dt +
F (p) =
T
0
Po úpravě tohoto vztahu dostáváme tzv. větu o obrazu periodické funkce.
Věta 7 Nechť je funkce f (t) originálem a je navíc T periodická, potom platí
F (p) =
FT (p)
.
1 − exp(−T p)
(5.3.3)
Příklad 18 Nalezněte Laúlaceovy obrazy tzv. jednocestného a dvoucestného usměrnění
f1 (t) = max(sin t, 0) = η(t) sin t − η(t − π), f2 (t) = | sin t|.
1. Funkce f1 má periodu 2π a obraz základní periody je:
−pt
π
Z π
1 + e−pπ
e (cos t + p sin t)
−pt
=
sin te dt = −
.
L f1 2π =
p2 + 1
(p2 + 1)
0
0
Užitím předchozí věty dostáváme
L f1 =
1+exp(−pπ)
(p2 +1)
1 − exp(−2πp)
=
(p2
1
+ 1)(1 − exp(−πp))
2.Funkce f2 má periodu π a stejný obraz základní periody. Užitím předchozí věty dostáváme
− 1+exp(−pπ)
1
p
(p2 +1)
= 2
coth
L f2 =
1 − exp(−πp)
(p + 1)
2
Druhým typem je zobrazení funkcí, které nejsou originálem Laplceovy transformace
jako je např.Diracova distribuce. Při hledání obrazu , postupujeme podobně jako u transformace Fourierovy. To jest obraz takového předmětu, který je limitou předmětů jež jsou
originálem, hledáme jako limitu obrazů těchto předmětů, které mají za limitu. Podobně
jako u Fourierovy transformace můžeme u hledání obrazu Diracova impulsu a jeho derivací
využít tzv. filtrační vlastnost.
L δ(t − t0 ) = e−pt0
L δ (n) (t − t0 ) = pn e−pt0
(5.3.4)
Jako motivaci si v následující ukázce užitím Laplaceovy transformace vyřešíme typickou úlohu z elektrotechniky.
Příklad 19 Vypočtěme proud i1 (t) v primárním obvodu dvou induktivně vázaných obvodů, přičemž první je tvořen pouze cívkou o indukci L a druhý je tvořen cívkou o stejné
indukci L a kondenzátorem o kapacitě C. Induktivní vazba mezi cívkami je M < L. Dále
předpokládáme, že jsou počáteční podmínky nulové, to znamená, že v čase t = 0 je energie
magnetického pole cívek nulová stejně jako energie elektrického pole kondenzátoru. V čase
t = 0 připojíme k primárnímu obvodu napětí mající průběh jednotkového skoku η(t) .
Matematika 2
75
Se znalostí Ohmova a Kirchhoffových zákonů sestavíme pro proudy i1 (t), i2 (t) v primárním a sekundárním obvodu soustavu integrodiferenciálních rovnic:
Li01 (t) + M i02 (t) = η(t)
Z
1 t
0
0
i2 (s) ds = 0,
M i1 (t) + Li2 (t) +
C 0
spolu s počátečními podmínkami i1 (0) = i2 (0) = 0. Z Laplaceova obrazu této soustavy
1
LpI1 (p) + M pI2 (p) =
p
1
M pI1 (p) + Lp +
I2 (p) = 0
Cp
můžeme snadno určit funkci I1 (p) (například užitím Cramerova pravidla):
1
1
Lp
+
p
Cp
CLp2 + 1
=
I1 (p) =
1
Lp Lp + Cp
− M 2 p2
C(L2 − M 2 )p2 p2 + C(L2L−M 2 )
K nalezení proudu i1 (t) využijeme poznámky 9 a gramatiky Laplaceovy transformace.
Rozložíme-li totiž I1 (p) na součet parciálních zlomků potom ke každému najdeme vzor:
s
s
M2
C
a
L
1 1
+
,
kde
a
=
I1 (p) =
L p2
L
L(L2 − M 2 p2 + a2
C(L2 − M 2 )
S funkcemi, které mají obraz roven jednotlivým parciálním zlomkům, jsme se seznámili v
ukázkách, které ilustrovaly pravidla gramatiky. Odtud dostáváme
s
M2
t
C
sin at.
i1 (t) = +
2
L
L
L(L − M 2 )
Protože v obvodu nebyly vzaty ohmické odpory není systém stabilní a proud s časem
vzrůstá.
Tato ukázka dokládá důležitost zabývat se procesem najít předmět k danému obrazu,
inverzní Laplaceovou transformací. Poznamenejme, že často provedení inverzní transformace je nejobtížnější částí řešení příkladů tohoto typu. Uvedeme proto několik vět, které
vymezí nutné podmínky, které splňují funkce komplexní proměnné, jež jsou obrazem originálu Laplaceovy transformace.
Věta 8 Nechť je funkce F (p) obrazem originálu Laplaceovy transformace, potom platí:
1. Existuje číslo ξ1 tak, že F (p) je regulární funkcí komplexní proměnné v polorovině
ξ > ξ1 .
2. V polorovině ξ ≥ ξ2 , kde ξ2 > ξ1 , platí: lim F (p) = 0.
p→∞
3. V oblasti ξ > kp, kde k ∈ (0, 1), existuje konečná limita lim pF (p).
p→∞
Podmínky uvedené ve větě jsou pouze nutné ne však postačující, což si může čtenář ověřit
e−p
na funkci F (p) = √ .
p
76
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
5.3.1
Zpětná Laplaceova transformace
Východiskem úvah o zpětné Laplaceově transformaci je Lerchova věta:
Věta 9 Nechť dva originály (definice 15) f1 (t), f2 (t) mají stejný Laplaceův obraz
L f1 (t) = L f2 (t). Potom se tyto předměty mohou lišit pouze hodnotami v izolovaných
bodech, ve kterých aspoň jeden z nich není spojitý.
Odstraněním této nejednoznačnosti, tím že se dále omezíme na originály, která mají v
bodě nespojitosti funkční hodnotu rovnu aritmetickému průměru limit zleva a zprava,
můžeme definovat inverzní Laplaceovu transformaci.
Definice 17 Na množině funkcí komplexní proměnné, ke kterým existuje originál Laplaceovy transformace, který se na tuto funkci zobrazí. Přiřadíme takový originál, který má v
bodě nespojitosti funkční hodnotu rovnu aritmetickému průměru limit zleva a zprava. Toto
přiřazení nazýváme inverzní Laplaceovu transformaci. Což zapisujeme L −1 F (p) = f (t).
Obdobně postupujeme i u inverzní Laplaceovy transformace Diracovy distribuce a její
derivace.
Zpětná transformace racionální lomené funkce
Základní myšlenka je velmi jednoduchá. Vychází z možnosti rozkladu racionálně lomené
funkce (musí být ryzí a vykrácená) na součet tzv. parciálních zlomků. To je postup, který
by měl každý čtenář znát z integrálního počtu. Tato myšlenka je někdy zastřena složitě vypadajícími vzorci, které postup zjednodušují ve speciálních případech. Obvykle využíváme
rozklad v komplexním oboru. To jest nepracujeme se zlomky, které mají ve jmenovateli
mocninu kvadratického trojčlenu v reálném oboru nerozložitelném, tj. se zlomky typu:
(x2
Ap + b
Ap + b
=
a
2
k
+ 2ax + a + b )
((x + a)2 + b2 )k
V případě k = 1 je vhodné tento zlomek upravit na součet obrazů funkcí sin a cos:
A(p + a)
B − Aa
Ap + b
=
+
=
2
2
2
2
(x + a) + b
(x + a) + b
(x + a)2 + b2
AL e−at cos bt − (B − Aa)L e−at sin bt
Místo uvádění vzorců, které mohou za určitých předpokladů urychlit výpočet (např. polynom ve jmenovateli má jednoduché kořeny), uvedeme odkaz na literaturu, v níž jsou
uvedeny slovníky. Postup budeme ilustrovat v následující ukázce.
2
. Vzhledem k tomu, že kvadratický trojčlen je
(p2 + 1)(p + 1)2
ve jmenovateli je ve jmenovateli v první mocnině bude vhodné provést rozklad na součet parciálních zlomků v reálném oboru. Z ilustrativních důvodů rozklad provedeme po
jednotlivých krocích:
Příklad 20 Vypočtěte L −1
Matematika 2
77
1) Předpovíme tvar rozkladu
(p2
2
B
A
Cp + D
+
.
=
+ 2
2
2
+ 1)(p + 1)
(p + 1) (p + 1)
(p + 1)
Po formálním součtu na pravé straně porovnáváme čitatele obou zlomků:
2
A(p + 1)(p2 + 1) + B(p2 + 1) + (Cp + D)(p + 1)2
=
(p2 + 1)(p + 1)2
(p2 + 1)(p + 1)2
Rovnice, ze kterých určíme hledané konstanty A, B, C, D, můžeme získat buď porovnáním
funkčních hodnot nebo porovnáním koeficientů u stejných mocnin proměnné p. První dvě
rovnice získáme porovnáním funkčních hodnot pro p = −1, p = 0, další dvě rovnice
porovnáním koeficientů u mocnin p3 , p.
2
2
0
0
=
=
=
=
B
A+B+D
A+C
A + C + 2D
Tento systém má řešení A = 1 = B,C = −1 ,D = 0. Jestliže máme k dispozici rozklad
je další výpočet jednoduchý; obvykle využijeme vzorců pro nalezení předmětů. V tomto
případě můžeme využít výsledků ukázek ilustrujících pravidla gramatiky Laplaceovy transformace:
L
(p2
1
1
2
=L
+L
−
2
+ 1)(p + 1)
(p + 1)
(p + 1)2
L
(p2
p
= η(t)(e−t + te−t − cos t)
+ 1)
Integrální tvar inverzní transformace
Při odvození integrálního tvaru Laplaceovy transformace využijeme vlastností Fourierova
integrálu. Nechť funkce f (t) je originálem Laplaceovy transformace s indexem růstu s0 .
Potom pro s > s0 integrál
Z
∞
f (t)|e−st | dt
0
konverguje a tedy pro funkci f (t)e−st platí věta 2, jejíž tvrzení lze v bodě spojitosti
funkce f (t) podobně jako u Fourierovy transformace napsat ve tvaru dvou rovnic
Z
∞
e−sτ f (τ )e−jωτ dτ
0
Z ∞
1
−st
e f (t) =
F (jω)ejωt dω.
2π −∞
F (jω) =
78
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
Tyto výrazy můžeme přepsat ve tvaru:
Z
F (jω) =
∞
f (τ )e−(s+jω)τ dτ
Z ∞
1
f (t) =
F (jω)e(s+jω)t dω.
2π −∞
0
Položíme-li substituci s + jω = p, dω = dp/j a uvážíme, že proměnná p se pohybuje po
přímce p = s + jω, kde −∞ < ω < ∞ přepíšeme tyto výrazy na tvar:
Z ∞
F (p) =
f (τ )e−(s+jω)τ dτ
0
1
f (t) =
2πj
s+j∞
Z
1
F (p)e dp = přesněji =
lim
2πj ω→∞
pt
s−j∞
Z
s+jω
F (p)ept dp
(5.3.5)
s−jω
Uvedený nevlastní integrál po přímce p = s + jω, kde −∞ < ω < ∞ s vzhledem k
technické náročností nepočítá přímo, ale pomocí reziduí. V následující větě jsou
Věta 10 Nechť je funkce F (p) holomorfní všude vyjma izolovaných singularit p1 , . . . , pn
ležících v polorovině <p < s. Nechť funkce F (p) konverguje stejnoměrně k nule na
libovolné posloupnosti kružnic |p| = Rn , lim Rn = ∞. Potom pro konvergentní
n→∞
Z s+j∞
F (p)ept dp platí
s−j∞
f (t) =
1
2πj
Z
s+j∞
s−j∞
 n
X


rez (F (p) exp pt)
F (p)ept dp = k=1 p=pk


0
pro t > 0
(5.3.6)
pro t > 0
Užití této věty je v následující ukázce.Pro srovnání určíme pomocí residuí předmět k
funkci z ukázky 20.
Příklad 21 Určete předmět Laplaceovy transformace k funkci
L −1 F (p) = L −1
(p2
2
.
+ 1)(p + 1)2
Tato funkce splňuje předpoklady věty. Má tři residua, jeden pól p1 = −1 druhého
řádu a dvojici komplexně sdružených pólů p2,3 = ±j. Vypočteme jednotlivá residua funkce
F (p)ept
2
rez 2
ept = lim
p=−1 (p + 1)(p + 1)2
p→−1
2ept
(p2 + 1)
0
=
2tept
4pept
−
= e−t (1 + t)
p→−1 (p2 + 1)
(p2 + 1)2
lim
Matematika 2
rez
p=±j
79
2
2ept
e±jt
2e±jt
pt
=
−
e
=
lim
=
p=±j (p ± j)(p + 1)2
(p2 + 1)(p + 1)2
(±2j)(±2j)
2
a dostáváme funkci f (t):
L −1
2
ejt + e−jt
−t
= e−t (1 + t) − cos t
=
e
(1
+
t)
−
(p2 + 1)(p + 1)2
2
Poznámka 8 Uvedenou větu lze lze formulovat i v podstatně silnějším znění [12]. Například může být residuí nekonečně mnoho a jejich suma je nahrazena nekonečnou řadou kde
residua jsou sčítána podle velikosti jejich modulu. Tamtéž je použití této věty při hledání
předmětu, který je T periodický; to jest funkce F (p) je součinem a jeden činitel je zlomek
1
. Tento zlomek má nekonečně mnoho jednoduchých pólů.
1 + epT
Dále je třeba poznamenat, že předpoklady této věty nejsou splněny ani u jednoduchých
funkcí. Je-li obraz zlomkem, jehož jmenovatelem je polynom a čitatel je celistvá transcendentní funkce, která není polynomem. Například u funkce R(p)eat , kde R(p) je racionální
lomená funkce, postupujeme tak, že nalezneme předmět racionální lomené funkce R(p) a
použijeme větu o translaci. Další možností je využít vyjádření předmětu ve tvaru konvoluce. Dalším „speciálnímÿ případem je obraz, který je nulový a holomorfní v nekonečnu.
Věta 11 1. Heavivideova věta o rozkladu Nechť je možné funkci F (p) pro |p| > R vyjádřit
ve tvaru konvergentní řady:
∞
X
an
.
F (p) =
pn
n=1
Potom platí:
L
∞
∞
X
X
an tn−1
an
=
.
n
(n
−
1)!
p
n=1
n=1
Souvislost Fourierova a Laplacevy transformace
Při odvozování integrálního vyjádření inverzní Laplaceovy transformace jsme ukázali, Laplaceův obraz funkce f (t) je ekvivalentní souboru Fourierových obrazů funkcí f (t)e−st ,
kde s > s0 . Z toho plynou důsledky.
Fourierovy obrazy lze někdy počítat pomocí Laplaceových obrazů, které se snáze počítají, neboť to jsou holomorfní funkce. Rozlišme dva případy:
1. Funkce f (t) je nulová pro t < 0 a obraz Fourierovy transformace existuje (je originálem Laplaceovy transformace), potom Fourierův obraz dostaneme tak, že v Laplaceovu obrazu za p dosadíme p = jω:
F f (t) = F (jω) = L f (t)|p=jω
80
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
2. Funkce f (t) má obraz Fourierovy transformace a pro t < 0 je nenulová. Označme
f+ (t) zúžení funkce f (t) na [0, ∞) a f− (t) = f (−t) pro t ∈ [0, ∞). Předpokládejme,
že jejich Laplaceovy obrazy F1 (p) = L f+ (t), F2 (p) = L f− (t) existují. Potom platí
Z
F (jω) =
∞
f (t)e−jωt dt =
−∞
Z
Z ∞
−jωt
f (t)e
dt +
0
5.3.2
∞
f (−t)ejωt dt = F1 (jω) + F2 (−jω),
0
Užití Laplaceovy transformace k řešení rovnic
Jak jsme již uvedli v úvodu je Laplaceova transformace s výhodou používána k řešení
diferenciální, integro-diferenciálních rovnic a jejich soustav. Předností tohoto postupu je,
že při užití tohoto postupu u rovnic s konstantními koeficienty jsou transformované rovnice
algebraickými, další výhodou je, že při řešení Cauchyho počáteční úlohy není třeba hledat
obecné řešení a posléze určovat partikulární řešení na základě počátečních podmínek. Je-li
cílem řešení nalezení obecného řešení integro diferenciální rovnice, dosadíme za počáteční
podmínky obecné konstanty a výše popsaným postupem získáme obecné řešení.
V následujících ukázkách budeme postupovat od jednodušších příkladů ke složitějším,
navíc budeme při hledání předmětu budeme užívat různé možnosti jeho nalezení.
Příklad 22 Nalezněte řešení diferenciální rovnice x00 − 2x0 = et (t2 + t − 3), určené počátečními podmínkami x(0) = 2, x0 (0) = 2.
Nejdříve nalezneme obraz rovnice:
L x00 − 2L x0 = L et t2 + L et t − 3L et
1
3
2
+
−
p2 X(p) − 2p − 2 − 2pX(p) + 4 =
3
2
(p − 1)
(p − 1)
p−1
2
−3p + 7p − 2
+ 2p − 2
X(p)(p2 − 2p) =
(p − 1)3
Rovnici vyřešíme vzhledem k X(p) a k získané racionální lomené funkci nalezneme její
předmět pomocí residuí funkce X(p) exp(pt): Funkce
X(p) =
p(2p3 − 8p2 + 9p − 1)
2p3 − 8p2 + 9p − 1
=
(p − 1)3 (p2 − 2p)
(p − 1)3 (p − 2)
Dále použijeme vzorec pro obraz funkce tn spolu s větou o posunutí obrazu.
1
1
1
2
−1
x(t) = L
+
−
−
= e2t + et (1 − t − t2 )
2
3
p − 2 p − 1 (p − 1)
(p − 1)
Příklad 23 Nalezněte řešení systému diferenciálních rovnic
3y10 − y200 + y20 − y1 = 2t2 + f (t)
y20 − y10 = 0,
Matematika 2
81
určené počátečními podmínkami y1 (0) = 0, y20 (0) = y2 (0) = 0, kde f (t) je libovolná spojitá
funkce.
Budeme postupovat analogicky s předcházející ukázkou. Nejdříve určíme obraz systému
rovnic (f (t) ↔ F (p)):
4
+ F (p)
p3
= 0
3pY1 − p2 Y2 + pY2 − Y1 =
−3Y1 + pY2
Vzhledem k proměnným Y1 , Y2 jsme získali systém dvou lineárních rovnic
4
(3p − 1)Y1 + Y2 (p − p2 ) = 3 + F (p)
p
−3Y1 + pY2 = 0,
jehož řešení můžeme získat pomocí Cramerova pravidla:
4
+
F
(p)
p(1
−
p)
3
p
0
p 4
+ pF (p)
2
p2
=
=
+ F (p)
Y1 = 2
2
3
3p
−
p
+
3p
−
3p
p
3p − 1 p(1 − p)
−3
p
4
3p − 1 3 + F (p)
p
−3
0
6
3 F (p)
= 4+
Y2 =
2p
p
2 p
n
Dále použijeme vzorec pro obraz funkce t spolu s větou o integrálu předmětu dostáváme:
2
y1 (t) = L
+ F (p) = t2 +f (t)
p3
Z t
6
3 F (p)
3
y2 (t) = L
+
=t +
f (τ ) dτ
p4 2 p
o
Předmět k obrazu F (p)/p v němž je blíže neurčená funkce jsme získali podle věty o
integraci předmětu. Stejný výsledek bychom získali podle věty o konvoluci předmětů.
Funkce 1/p má předmět Heavisideovu funkci jednotkového skoku a F (p) funkci f (t).
Vyjádření předmětu ve tvaru konvolučního integrálu je postup mnohem využitelnější. V
další ukázce tohoto obratu využijeme při řešení diferenciální rovnice s periodickou pravou
stranou.
82
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
Příklad 24 Řešte diferenciální rovnici y 0 + y = f (t) = max(sin t, 0) spolu s nulovými
počátečními podmínkami y(0) = 0.
S využitím ukázky 18 získáme snadno Laplaceův obraz rovnice
pY (p) + Y (p) =
1
,
(p2 + 1)(1 − exp(−πp))
ze které snadno nalezneme obraz řešení,
Y (p) =
(p +
1)(p2
1
+ 1)(1 − exp(−πp))
Funkci Y (p) je možné chápat jako součin dvou funkcí
1
1
· 2
p + 1 (p + 1)(1 − exp(−πp))
se známými předměty a užitím věty o konvoluci předmětů můžeme řešení formálně vyjádřit
ve tvaru konvolučního integrálu:
Z
y(t) =
t
e−(t−τ ) max(sin τ, 0) dτ.
0
Velice často, např. při studiu asymptotického chování řešení, je vhodnější jiný zápis řešení
jako součtu periodické g(t) ↔ G(p) a neperiodické složky. Předpokládejme, že takovýto
tvar je možný:
Y (p)
1
2
(p + 1)(p + 1)(1 − exp(−πp))
=
=
A
p+1
+
1+exp(−pπ)
(p2 +1)
1 − exp(−2πp)
Tvar obrazu periodické složky je dán skutečností, že perioda je 2π a podle věty o obrazu
periodické funkce je jím zlomek ve jmenovateli obsahující rozdíl 1 − exp(−2πp) a čitatel je
tvořen obrazem jediného impulsu G2π (p). Po vynásobení rovnice výrazem 1 − exp(−2πp)
1
1 + exp(−pπ)
A(1 − exp(−2πp))
·
=
+ G2π (p)
p+1
(p2 + 1)
(p + 1)
nalezneme předmět této rovnice s tím, že druhý činitel součinu vlevo je předmětem jednoho
impulsu f2π (t) = η(t) sin t − η(t − π) sin t a využijeme větu o konvoluci předmětů
Z
t
e−(t−τ ) f2π (τ ) dτ = A e−t η(t) − e−(t−2π) η(t − 2π) + g2π (t)
0
Protože předměty f2π , g2π jsou pro 2π < t nulové dostaneme vztah z něhož určíme A:
Z π
π
−t e + 1
−t
e
=e
eτ sin τ dτ = Ae−t (1 − e2π )
2
0
Matematika 2
83
Dostáváme A =
Z
1
. Dále určíme g2π (t) v pro 0 < t < π:
2(exp(−π) − 1)
t
1
e−t
=
2 (exp(−π) − 1)
1 −t
1
e−t
e (sin t − cos t + 1) +
=
2
2 (exp(−π) − 1)
e−t
1
sin t − cos t +
2
1 + eπ
e−(t−τ ) sin τ dτ +
g2π (t) =
0
Analogicky dostáváme pro π < t2π:
Z
g2π (t) =
π
e
0
−(t−τ )
e−t
1
=
sin τ dτ +
2 (exp(−π) − 1)
e−t eπ
e−t 1 + eπ − e2π
e−t π
(e + 1) +
=
2
2 1 − eπ
2
1 − eπ
Řešení y(t) nalezneme ve tvaru součtu
y(t) =
1
e−t + gper (t),
2(exp(−π) − 1)
kde gper (t) je periodická složka řešení dostatečně popsaná průběhem v základním intervalu
1
[0, 2π]. Vzhledem k tomu, že neperiodická složka A =
e−t nabývá velmi
2(exp(−π) − 1)
malých hodnot, lze pro dostatečně velká t řešení ztotožnit s periodickou složkou. Toto má
i praktický význam. Daná rovnice popisuje tok elektrického proudu v obvodu tvořeném
cívkou o indukci L = 1 a ohmickým odporem R = 1, který byl v čase 0 připojen k
jednocestnému usměrněnému napětí. Nalezená periodická složka řešení popisuje potom
ustálený stav.
Poznámka 9 V předcházející ukázce byl realizován postup nalezení periodické složky řešení. Podrobněji je tento postup popsán v [?]
84
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
5.3.3
Slovník Laplaceovy transformace
Předmět
Obraz
Předmět
Obraz
A
A
p
e−at
1
p+a
tn , n > −1
Γ(n + 1)
pn+1
e−at tn
Γ(n + 1) n+1
p+a
p
+ b2
e−at cos bt
p+a
(p + a)2 + b2
b
p 2 + b2
e−at sin bt
b
(p + a)2 + b2
p
− b2
e−at cosh bt
b
(p + a)2 − b2
sinh bt, b 6= 0
b
p 2 − b2
e−at sinh bt
b
(p + a)2 − b2
t cos bt, b 6= 0
p 2 − b2
(p2 + b2 )2
e−at t cos bt
(p + a)2 − b2
((p + a)2 + b2 )2
eat t sin bt
2(p + a)b
(p + a)2 + b2
eat − cos bt − ab sin bt
a2 + b 2
1
(p − a)(p2 − b2 )
aeat − a cos bt − b sin bt
a2 + b 2
1
(p − a)(p2 − b2 )
p
(p − a)(p2 − b2 )
cos bt, b 6= 0
sin bt, b 6= 0
cosh bt, b 6= 0
t sin bt, b 6= 0
eat − ebt
, b 6= a
a−b
p2
p2
(p2
2pb
+ b2 ) 2
1
(p − a)(p − b)
aeat − bebt
p
, b 6= a
a−b
(p − a)(p − b)
(1 + at)eat
p
(p − a)2
a2 eat + b2 cos bt + ab sin bt
a2 + b 2
at2 at
)e
2
p
(p − a)3
sin bt − bt cos bt
2b3
(1 +
5.4
(p2
1
+ b2 )2
Cvičení
Cvičení 5 Načrtněte graf periodického signálu f (t) definovaného v intervalu [0, T ] a určete jeho Fourierův rozklad do sinů a cosinů a načrtněte jeho součet v intervalu [−T, T ].
Matematika 2
85
Dále určete Fourierův rozklad tak, aby měl periodu T :
a) T = 4


2
f (t) = 1


2
b) T = 4
pro 0 < t < 1
pro 1 ≤ t < 2
pro 2 ≤ t < 4
(
t
f (t) =
4−t
pro 0 < t < 2
pro 2 < t < 4
Cvičení 6 Určete Laplaceův obraz funkce f (t)η(t)
a) f (t) = 1 − 2 cos 3t
c) f (t) =
√ −t
te
b) f (t) = te−2t
d) f (t) = tet cos 2t
Cvičení 7Načrtněte graf signálu f (t) a určete jeho Laplaceův obraz:
(

pro t < 0
0
2t − t2 pro 0 < t < 2
b)f (t) =
a)f (t) = t2 pro 0 ≤ t < 1

0
pro t < 0, 2 < t

1
pro 1 < t


0
pro t < 0




2t − 4 pro 2 < t < 4
π
c)f (t) = sin t pro 0 ≤ t < 2
d)f (t) = 8 − t
pro 2 ≤ t < 8


π


1
0
pro t < 2, 8 < t
pro < t
2
Cvičení 8 Načrtněte graf periodického signálu f (t) s periodou T a určete jeho Laplaceův
obraz:
a) T = 6


0
f (t) = 4t − 4


6−t
b) T = 4
pro 0 < t < 1
pro 1 ≤ t < 2
pro 2 ≤ t < 6
(
2t
f (t) =
0
pro 0 < t < 2
pro 2 < t < 4
Cvičení 9 Určete předmět k Laplaceovu obrazu F (p)
a) F (p) =
p+1
p(p + 2)
b) F (p) =
c) F (p) =
(p − 3)2
p(p2 + 9)
d) F (p) =
p2 (p
1
+ 1)2
p2 + 1
p3 + 4p2 + 13p
Cvičení 10 Nalezněte řešení diferenciálních rovnic určených počátečními podmínkami:
a) y 00 + 5y 0 + 6y = 12et , y(0+) = y 0 (0+) = 1
86
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
b) y 00 + 4y = cos t, y(0+) = 0, y 0 (0+) = 0
c) y 000 + y 0 = e2t , y(0+) = 1, y 0 (0+) = −1, y 00 (0+) = 2
d) y 00 + 3y 0 + 2y = t + e−t , y(0+) = y 0 (0+) = 0
Cvičení 11 Nalezněte řešení integrálních a integrodiferenciálních rovnic případně určených počátečními
Z podmínkami:
t
y(τ )dτ = 0, y(0+) = 0
a) y 0 + 6y + 9
0
Z t
0
y(τ )dτ = sin t, y(0+) = 0
b) y − y − 2
0
Z t
e−(t−τ ) x(τ )dτ
c) y(t) = cos 3t +
Z t0
d) y 00 + y 0 + y +
y(τ )dτ = 2, y(0+) = 2, y 0 (0+) = −2
0
Cvičení 12 Nalezněte řešení systému diferenciálních a integrodiferenciálních rovnic určených počátečními podmínkami:
a)
y10 =
y20
b)
, y1 (0+) = 1, y2 (0+) = 1
= 5y1 +3y2
y10 = 7y1 −18y2 +12e−t
y20
b)
y1 −2y2
= 3y1
+5y2
+5e
y100 +7y20 +8y1 = 0
y200
, y1 (0+) = 1, y10 (0+) = 0, y2 (0+) = 0 y2 (0+) = 0,
−y10 +2y2 = 0
y10 = −2y1 +
b) y20 =
, y1 (0+) = 2, y2 (0+) = 1
−t
y20
2y1 − 3y20
y30 =
+y3 , y1 (0+) = 1, y1 (0+) = 0, y2 (0+) = 1 y3 (0+) = 0,
2y20 −3y3
Výsledky
p2 − 6p + 9
p3 + p
√
π
6c) F (p) =
2(p+ 1)2/3
e−p
1 −p
−2p
7a) F (p) =
1 − e (3 − e )
p
2
6a) F (p) =
6b) F (p) =
1
(p + 2)3
6d) F (p) =
p2 − 2p − 3
(p2 − 2p + 5)2
Matematika 2
7b) F (p) =
87
2
2
(1 − e−2p ) − 3 (1 + e−2p )
2
p
p
π
p + e−p 2
7c) F (p) =
p(p2 + 1)
8a) F (p) =
2e−p − 3e−2p + e−4p
p2 (1 + e−6p )
7d) F (p) =
1
(2e2p − 3e−3p + e−8p )
2
p
8b) F (p) =
2 − 4pe−2p
p(1 + e−4p )3
1
9b) f (t) = t − 2 = e−t (t + 2)
1 + e−2t
2
9c) f (t) = 1 −2 sin 3t
1
28
−2t
9d) f (t) =
1 + e (12 cos 3t −
sin 3t)
13
3
9a) f (t) =
1
10b) f (t) = (cos t − cos 2t)
3
10a) f (t) = et
36 cos t − 12 sin t − et − 15
10
t
3 −2t
10d) f (t) = (e − 1) = te−t +
4
2
10c) f (t) =
1
11b) f (t) = (sin t − te−t )
2
11a) f (t) = e−3t (1 − 3t)
11c) f (t) = cos 3t −
1
sin 3t
3
11d) f (t) = 2e−t
12a) y1 (t) = e2t (cos 3t − sin 3t)
y2 (t) = e2t (cos 3t + 2 sin 3t)
12b) y1 (t) = −4e−2t + 3e−t + 3et
y2 (t) = −2e−2t + 2et + et
12c) y1 (t) =
7
8
cos 4t −
cos t
15
15
1
12d)y1 = (1 − e−5t )
5
y2 (t) =
1
y2 = (2 + 3e−5t )
5
2
8
sin 4t −
sin t
15
15
2
y3 = (1 − e−5t )
5
88
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
Kapitola 6
Z transformace
Obsahem předchozí kapitoly bylo seznámit čtenáře se základním matematickým aparátem pro popis systémů s spojitým časem. Velice často se zabýváme systémy kdy se studovaná veličina vytváří případně je měřena jen v diskrétních časových okamžicích, zpravidla
stejně od sebe vzdálených. Takovým příkladem jsou impulsní soustavy. Situaci popisujeme pomocí posloupností, jejíž členy představují hodnoty jisté fyzikální veličiny v daných
časových okamžicích. Rovnice popisující vlastnosti těchto diferenčních systémů můžeme
analogicky se spojitým případem řešit pomocí transformace. Touto transformací je Z
transformace.
Definice 18 Nechť je dána posloupnost čísel {fn }. Jestliže existuje alespoň jedno komplexní číslo 0 6= z0 6= ∞ takové,že funkční řada
∞
X
fn
(6.0.1)
z
n=0 n
konverguje, Řekneme, že posloupnost {fn } je Z transformovatelná nebo přípustná. Její
součet F (z) je regulární funkce v okolí bodu ∞ a nazýváme ji obrazem posloupnosti
{fn }. Tuto skutečnost zapisujeme F (z) ↔ {fn }. Toto přiřazení je jediné nazýváme je
Z-transformací.
Abychom vymezili množinu přípustných posloupností zavedeme pojem index růstu posloupnosti.
Definice 19 Řekneme, že posloupnost {fn } je ohraničeného růstu s indexem s, jestliže
existují konstanty M , s takové, že
|fn | ≤ M esn pro všechna n.
Věta 12 Platí, že posloupnost je Z transformovatelná právě když je ohraničeného růstu
s indexem s, kde s je vhodné číslo.
Příklad 25 Konstantní posloupnost {1} (posloupnost {1} nazýváme diskrétní jednotkový
impuls) je ohraničeného růstu s indexem 0. Její obraz nalezneme pomocí součtu geometrické řady.
∞
X
1
z
1
=
=
F (z) =
n
−1
z
1−z
z−1
n=0
89
90
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
Příklad 26 Snadno vidíme, že posloupnost {eαn } je ohraničeného růstu s indexem |α|,
pro libovolné komplexní α. Její obraz nalezneme opět pomocí součtu geometrické řady.
n
∞ ∞
X
1
z
eαn X eα
=
=
=
F (z) =
n
α
−1
z
z
1−e z
z − eα
n=0
n=0
Pokud bychom tuto posloupnost zapsali ve tvaru {αn } obdrželi bychom výsledek ve tvaru
z
Z {αn } =
.
z−α
Než uvedeme větu, která přehledně shrne základní vlastnosti Z transformace zavedeme
některé důležité pojmy analogické s pojmy vyskytujícími se ve formulaci podobných vět
pro transformace integrální. Důležitým pojmem je konvoluce.
Definice 20 Konvolucí posloupností {fn }, {gn } nazýváme posloupnost, kterou značíme
{fn ∗ gn } pro jejíž členy platí vztah
fn ∗ gn =
n
X
fn−i gi
i=0
Příklad 27 Spočtěme konvoluci několika jednoduchých posloupností
{fn } {gn }
{fn ∗ gn }
{1}
{n + 1}
{1}
n
{ (n + 1)}
2
n
X
{1} {fn } {sn } = {
fi }
{1}
{n}
{n} {fn } {
n
X
i=0
(n − i)fi }
i=0
Poznamenejme, že konvoluce posloupností je komutativní, distributivní a asociativní.
Navíc jsou=li obě posloupnosti přípustné je i jejich konvoluce přípustná posloupnost.
Definice 21 Nechť k je přirozené číslo. O posloupnosti {gn } = {fn+k } řekneme, že
vznikla z posloupnosti {fn } posunutím o k míst vlevo, jestliže pro její členy gn platí
gn = fn+k
pro
n = 0, 1, 2, . . . .
O posloupnosti {hn } = {fn−k } řekneme, že vznikla z posloupnosti {fn } posunutím o k
míst vpravo, jestliže pro její členy hn platí






pro n=0,1,. . . ,k-1;
 0,
gn =





 fn−k , pro n=k-1,k,. . . .
Matematika 2
91
Věta 13 Předpokládejme, že posloupnosti {fn }, {gn } jsou ohraničeného růstu. Označme
F (z) = Z {fn } a G(z) = Z {gn }, dále n ∈ N, a, b ∈ C jsou konstanty.
Věta o
předmět
obraz
poznámka
linearitě
a{fn } + b{gn }
podobnosti
{an fn }
posunutí vpravo
{fn−k }
aF (z) + bG(z)
z F
a
z −k F (z)
"
{fn+k }
posunutí
z k F (z) −
k−1
X
fn
n=0
derivaci obrazu
integraci obrazu
{nfn }
fn
n
#
zn
−zF 0 (z)
∞
Z
z
F (ζ)
dζ
ζ
musí platit f0 = 0, tj. {fn /n} = {0, f1 , f2 /2, . . . }
konvoluci předmětu
{fn ∗ gn }
diferenci
{∆k fn }
F (z)G(z)
(z − 1)k F (z) − z
k−1
X
(z − 1)k−1−i · ∆i f0
i=0
částečném
součtu
posloupnost ∆k je také přípustná, ∆0 fn = fn
( n )
X
z
{sn } =
F (z)
fi
z−1
i=0
posloupnost {sn } je také přípustná
Na místo provádění důkazů procvičíme použití jednotlivých vět při hledání obrazů přípustných posloupností.
Příklad 28 Pomocí výsledku v ukázce 26 a věty o linearitě můžeme odvodit následující
výsledky.
Z {ejαn } − Z {ejαn }
1
z
z
Z {sin αn} =
=
−
=
2j
2j z − ejα z − e−jα
1
z(ejα − ejα )
z sin α
= 2
2
jα
−jα
2j z − z(e + e ) + 1
z − 2z cos α + 1
Označme {an } = {1}, {bn } = {(−1)n }, {cn } = {j n }, {an } = {(−j)n }, potom platí
92
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
posloupnost
kombinace
obraz
{en } = {1, 0, 1, 0, . . . }
1
({an } + {bn })
2
z2
z2 − 1
{fn } = {0, 1, 0, 1, . . . }
1
({an } − {bn })
2
z2
{gn } = {1, 0, −1, 0, 1, . . . }
1
({cn } + {dn })
2
z2
z2 + 1
{hn } = {0, 1, 0, −1, 0, 1, . . . }
1
({cn } − {dn })
2
z2
{1, 0, 0, 0, 1, 0 . . . }
1
z4
({an } + {bn } + {cn } + {dn }) 4
4
z +1
z
−1
z
+1
Příklad 29 Na výsledcích předchozí ukázky je možné demonstrovat použití vět o posunutí.
Platí vztahy mezi posloupnostmi {en−1 } = {fn } = {en+1 }, proto platí
2
1 z2
z
−1
= F (z) = z
− 1 = z(E(z) − 1)
z E(z) =
z z2 − 1
z2 − 1
V následující ukázce nalezneme obraz jedné posloupnosti s využitím tří různých vět.
n+2
Příklad 30 Nalezněte obraz posloupnosti
2
1. Využijeme větu o derivaci obrazu:
0
Z {n} = −z (Z {1}) = −z
z
z−1
0
= −z
−1
z
=
.
2
(z − 1)
(z − 1)2
analogicky dostaneme obraz posloupnosti {n2 }:
0
z
−z − 1
z2 + z
0
2
Z {n } = −z (Z {n}) = −z
= −z
=
.
(z − 1)2
(z − 1)3
(z − 1)3
Součtem obrazů obou posloupností a jeho dělením 2 dostáváme:
n+2
1
z
z2 + z
z2 + z
2z 2
Z
=
+
=
=
2
2 (z − 1)2 (z − 1)3
(z − 1)3
(z − 1)3
n+2
2. Využijeme skutečnosti
= {1} ∗ {n} a věty o obrazu konvoluce:
2
n+2
z
z
z2
Z
= Z {1} · Z {n} =
=
2
z − 1 (z − 1)2
(z − 1)3
Matematika 2
93
X
n
n+2
3. Třetí možností je využít skutečnosti
=
i a věty částečných součtech:
2
i=1
Z
n+2
2
=
z
z
z2
z
Z {n} =
=
z−1
z − 1 (z − 1)2
(z − 1)3
V následující ukázce použijeme větu o integraci obrazu.
1
(−1)n+1
Příklad 31 Nalezněte obraz posloupnosti 0, 1, − , . . . ,
. Tuto posloupnost
2
n
můžeme také zapsat jako posloupnost {fn /n}, kde je posloupnost {fn } = {0, 1, 1, . . . }. Ve
větě o integrálu obrazu položíme {fn } = {0, 1, −1, 1, . . . } její obraz můžeme získat jako
součet geometrické řady:
Z {0, 1, −1, 1, . . . } =
1
1
1
(−1)n+1
z
− 2 + ··· +
=
z z
zn
1+
1
z
=
1
z−1
Integraci racionálně lomené funkce F (ζ)/ζ provedeme pomocí rozkladu na parciální
zlomky:
Z
(−1)n+1
n
Z ∞
1
1
dζ
=
−
=
dζ = lim [ln ζ−
ζ0 →∞
ζ(ζ + 1)
ζ ζ +1
z
z
ζ0
ζ
z
1
ζ0
− ln
= − ln
= ln 1 +
,
ln(ζ + 1)]z = lim ln
ζ0
ζ0 + 1
ζ +1
z+1
z
Z
∞
protože
lim ln
ζ0
ζ0
ζ0
= ln lim
= ln 1 = 0.
ζ0 ζ0 + 1
ζ0 + 1
Věta 14 Nechť {fn } je přípustná tj. Z {fn } = F (z). Jestliže níže uvedené limity existují,
potom platí:
lim F (z) = f0
počáteční hodnota
z→∞
lim F (z) =
z→1
∞
X
fn
(6.0.2)
(6.0.3)
n=0
lim (z − 1)F (z) = lim fn
z→0
n→∞
koncová hodnota
(6.0.4)
Užitečnost těchto limitních vztahů je mimo jiné dána u vztahu 6.0.2 možností nahradit
předpoklad f0 = 0 předpokladem na funkci F (∞) = 0. Vztah 6.0.3 nám umožní využít
předchozí ukázky k určení součtu
∞
X
(−1)n+1
n=1
n
1
= lim ln 1 +
= ln 2.
z→1
z
94
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
6.1
Souvislost Z a Laplaceovy transformace
Pedpokládejme, že posloupnost {fn } je přípustná. Uvažujme zobecněnou funkci
f (t) =
∞
X
fn δ(t − n)
n=0
Vypočteme Laplaceův obraz této zobecněné funkce:
L
∞
X
fn δ(t − n) =
n=0
∞
X
L fn δ(t − n) =
n=0
∞
X
e−pn .
n=0
Tento vztah se nazývá diskrétní Laplaceova transformace a substitucí ep = z dostáváme
obraz Z transformace posloupnosti {fn }.
6.2
Zpětná Z transformace
Každá funkce komplexní proměnné F (z), která je v bodě ∞ je obrazem vhodné posloupnosti {fn } to jest Z {fn } = F (z), což také zapisujeme:
Z −1 {F (z)} = {fn }
(6.2.1)
Navíc lze členy této posloupnosti jsou koeficienty Laurentova rozvoje a platí pro ně integrální vzorce:
Z
1
F (z)z n−1 , n = 0, 1, 2, . . . .
(6.2.2)
fn =
2πj Cρ
Tento postup je poměrně náročný.
Poznámka 10 Vyjdeme-li ze vztahu 6.0.1, je možné získat člen fn také tak, že daný
vztah vynásobíme z n−1 a n-krát derivujeme. Získáme tak řadu, která začíná výrazem
(−1)n fn n!z −n−1 neboť z na nezáporné celé mocnitele derivováním zmizely. Vynásobíme-li
nyní řadu z n a provedeme limitní přechod z → ∞ dostaneme vzorec
dn n−1
fn = (−1) lim n [z F (z)].
z→∞ dz
n
6.2.1
Předmět k racionální funkci
Je-li obrazem Z transformace racionálně lomená funkce, lze předmět nalézt poměrně
jednoduše rozkladem na parciální zlomky:
1
, kde k ∈ N
(z − z0 )k
a z0 je konečné komplexní číslo. Přesněji řečeno pro racionální funkci, která není ryzí, je
vyjádření ve tvaru součtu konstanty a parciálních zlomků. Pro parciální zlomek kde k = 1
snadno získáme
1
1
1 z0 z02
z03
z0
=
=
+
+
+
+
+ ...
(6.2.3)
z − z0
z z2 z3
z4
1 − z10
Matematika 2
95
Rozvoj parciálních zlomků (z − z0 )−k , kde 2 ≤ k ∈ N můžeme odvodit z rozvoje 6.2.3,
jestliže jej k − 1 krát derivujeme. Situaci přesně popisuje následující věta
Věta 15 Je-li z0 6= 0 platí
1
1
k
z0
k − 1 + n z0n
↔ k+
+ ··· +
+ ...
(z − z0 )k
z
z k+n
k − 1 z k+1
k−1
(6.2.4)
Poznamenejme, že uvedená věta platí i pro k = 1 a pravá strana rovnice 6.2.4 je jenom
složitěji zapsaná pravá strana 6.2.3. Podobně předpoklad z0 6= 0 není nutný, ale pro z0 = 0
je parciální zlomek přímo Laurentovým rozvojem.
Celkově můžeme postup hledání předmětu Z transformace k racionální funkci shrnou do jediné věty. Racionálně lomenou funkci vyjádříme ve tvaru součtu konstanty a
parciálních zlomků a z linearity Z transformace získáme předmět jako součet předmětů
jednotlivých parciálních zlomků podle známých vzorců. Uvedený postup předvedeme na
ukázkách.
Příklad 32 Nalezněte předmět Z transformace k funkci
z 2 + 4z − 1
(z + 1)2 (z − 1)
Rozklad racionální funkce má tvar
z 2 + 4z − 1
1
2
=
+
(z + 1)2 (z − 1)
z − 1 (z + 1)2
Podle vztahu 6.2.3 dostáváme
1
1
1
1
↔ + 2 + ··· + n
z−1
z z
z
a podle vztahu 6.2.4
2
2 21 (−1)
2
2
↔
+
+
·
·
·
+
(z + 1)2
z2
z3
n
n−1
(−1)n−2
zn
a předmět původní racionální funkce je ve tvaru součtu jednotlivých předmětů
z 2 + 4z − 1
1 + 2(n − 1)(−1)n
1 2+1
↔
+
+
·
·
·
+
(z + 1)2 (z − 1)
z
z2
zn
Zápis předmětu Z transformace k dané funkci lze realizovat i takto
z 2 + 4z − 1
↔ {δ0 n + 1 + 2(n − 1)(−1)n } ,
2
(z + 1) (z − 1)
kde δ0 n je tzv. Kroneckerův symbol.
Další určování předmětů Z transformace bude dílčí úlohou při využití Z transformace
k řešení diferenční a rekurentních rovnic.
96
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
6.3
Řešení diferenčních a rekurentních rovnic
Analogicky s řešením lineární integro diferenciální rovnic užitím Laplaceovy transformace
můžeme řešit lineární diferenční rovnice. Za lineární diferenční rovnici s konstantními
koeficienty považujeme:
ar {∆r yn } + · · · + a2 ∆2 yn + a0 {yn } = {fn },
kde a 6= 0, r ∈ N, n ∈ N0 a navíc
• ai jsou konečné komplexní konstanty pro i = 0, . . . , r, které se nazývají koeficienty
rovnice.
• {fn } je zadaná posloupnost komplexních čísel, která se nazývá pravá strana rovnice.
• {yn } je hledaná posloupnost, kde prvních r členů y0 , y1 , . . . , yr−1 jsou obvykle zadány
jako počáteční hodnoty.
Při hledání řešení postupujeme obvykle následujícím způsobem:
1. Nalezneme obraz diferenční rovnice, který je v případě lineární diferenční rovnice s
konstantními koeficienty rovnice algebraická
2. Dosazením počátečních podmínek do této algebraické získáme rovnici, která jedno
řešení a nalezneme tak obraz řešení diferenční rovnice.
3. Hledané řešení {yn }, potom určíme zpětnou transformací
Příklad 33 Řešte diferenční rovnici ∆2 yn − {yn } = {1} s počátečními podmínkami
y0 = 0, ∆y0 = −1.
Určíme obraz diferenční rovnice Z ∆2 yn − Z {yn } = Z {1} označíme-li Z {yn } =
Y (z) :
z
.
(z − 1)2 Y (z) − z(z − 1)y0 − z∆y0 − Y (z) =
z−1
Dosazením počátečních podmínek a vyřešením rovnice získáme obraz řešení:
z
z−1
z
2z − z 2
Y (z)(z 2 − 2z) =
−z =
z−1
z−1
1
Y (z) =
1−z
(z − 1)2 Y (z) + z − Y (z) =
K tomuto obrazu řešení nalezneme snadno předmět užitím 6.2.3:
−1
−1
Z
= {−1}.
z−1
Matematika 2
97
Každou diferenční rovnici rovnici můžeme přepsat dosadíme-li za všechny diference
členy posloupnosti je určující vztahem:
r
X
r
r−i r
fn+i .
∆ yn =
(−1)
i
i=0
Získaná rovnice z lineární diferenční rovnice s konstantními koeficienty má potom tvar:
Ar {yn+r } + · · · + A2 {yn+2 } + A1 {yn+1 } + A0 {yn } = {fn },
(6.3.1)
kde Ar 6= 0 6= A0 a Ai jsou komplexní konstanty. Vzhledem k tomu, že ze známých
počátečních podmínek lze opakovaným použitím tohoto vztahu určit libovolné yn je tento
tvar rovnice nazýván rekurentní rovnicí. Při hledání řešení postupujeme stejně jako u
rovnic diferenčních.
Příklad 34 Nalezněte hodnoty tzv. Fibonacciovy posloupnosti určené rekurentním vztahem fn+2 = fn+1 + fn a počátečními hodnotami f0 = f1 = 1.
Nejdříve nalezneme obraz a následně vyřešíme:
z 2 (F (z) − 1 − 1/z) = z(F (z) − 1) + F (z)
z2
F (z) = 2
z −z−1
Rozkladem na součet parciálních zlomků dostaneme Fibonacciovu posloupnost:
√
z2 z
1
z1 z
1± 5
z2
−
=
kde z1,2 =
F (z) = 2
z −z−1
z1 − z2 z − z1 z − z2
2

!n+1
!n+1 
√
√
z1 z1n − z2 z2n
1
1+ 5
1− 5

fn =
=√ 
−
z1 − z2
2
2
5
Uvedený výsledek není v příliš praktickém tvaru. Rozvineme proto√n + 1 mocniny podle
binomické věty a v rozdílu obou závorek se odečtou sudé mocniny 5:
fn = √
1
52n+1
" n+1 X n + 1√
i=0
i
√ #
n+1
5i −
(−1)i
5i =
i
i=0
n+1
X
[ n2 ] 1 X n+1 k
5 .
2n k=0 2k + 1
n
0 1 2 3 4 5
6
7
8
9 10
11
12
13
14
fn 1 1 2 3 5 8 13 21 34 55 89 144 233 377 610
98
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
Poznámka 11 Při řešení diferenčních resp. rekurentních rovnic jsme mlčky předpokládali, že hledaná řešení mají obraz v Z transformaci tj. jsou přípustné. Obecně to neplatí,
ale pokud se jedná o rovnice s konstantními koeficienty s pravou stranou ve tvaru konečné
lineární kombinace funkcí tvaru P (n)q n cos αn resp. P (n)q n cos αn, kde P (n) je polynom,
je každé řešení této rovnice přípustné.
6.3.1
Cvičení
Pomoci transformace Z najděte obraz nasledujici posloupnosti
1
1
1
1
,...}
a) {0, , 0, , 0, , 0,
2
8
32
128
1
1
1
b) {0, 0, , 0, 0, , 0, 0, , 0, 0, . . . }.
3
9
27
Nalezněte předmět Z transformace k funkci
7z 2 + 2z + 1
a) F (z) =
z(z 2 − 1)
Kapitola 7
Signály
7.1
Pojem signálu
Problematika modelování má hluboký metodologický a gnoseologický význam a zvládnutí
jejích základů je nezbytností v oblasti rozvíjení přírodních i společenských věd včetně z
nich čerpajících disciplín. Jeden z fundamentálních pojmů této problematiky — pojem
systému v pojetí Ludwiga von Bertalanffyho a rozličné modifikace konceptu systému je
jeden z nejrozšířenějších pojmů používaných nejen v různých vědních disciplínách, ale
i v běžném životě v rámci popisu rozličných situací. Základní idea, že za systém lze
považovat soubor prvků propojených nejrůznějšími vztahy vedla ke vzniku integrující
vědní disciplíny nazývané obecná teorie systémů. Vazby mezi jednotlivými prvky systému,
stejně jako vstupy výstupy systému označujeme jako signály. Signály tedy můžeme z
hlediska popisu činnosti systému dělit na vnitřní signály daného systému, dále signály
vstupní a signály výstupní. Obecnější pojem než signál je pak pojem procesu. procesem
rozumíme děj probíhající v určitém prostředí v kontinuálním (spojitém) nebo v diskrétním
čase, který může být popsán signálními funkcemi nebo posloupnostmi. Teorie systémů
prochází prudkým rozvojem, její podstatné části jsou postupně zařazovány do studia na
vysokých školách technického zaměření a zejména do obsahu vědecké výchovy studentů
doktorských studijních programů.
7.1.1
Zavedení pojmu a klasifikace signálu
Právě uvedené vymezení pojmu signál je velmi obecné. Připusťme, že různí lidé mají
různou představu o významu slova signál. Dokonce ani inženýři elektrotechnici nejsou ve
výkladu obsahu pojmu signál moc jednotní. Pohled na slovo signál je závislý na jejich
zaměření. Názory se mohou lišit zejména v hodnocení vzájemné vázanosti či nezávislosti
signálu a systému. Pro obvodáře či odborníka na automatické řízení je signál nástrojem
pro popis systému, jeho stavu a chování vůči okolí. Naopak pro odborníka na zpracování
signálů je systém, ve kterém signál vzniká mnohdy vzdálený a neznámý nebo nezajímavý,
případně nepopsatelný. Tento odborník se zabývá především hledáním efektivních a realizovatelných algoritmů zpracování signálu, např. s cílem zjistit některé informaci nesoucí
parametry užitečné složky signálu. Teprve sekundárně, v případě potřeby, navrhuje sys-
99
100
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
témy algoritmus realizující.
Má se za to, že používání slova signál v dnešním obvyklém slova smyslu začalo v roce
1588, kdy byl použit řetězec výstražných ohňových znamení oznamujících anglickému
loďstvu, že se blíží španělské loďstvo.
My budeme pojmem signál chápat, že je to veličina, zpravidla fyzikální, nesoucí informaci. Pojem informace bude chápán velmi obecně jako každá zpráva, sdělení nebo
údaj.
S případem, kdy signálem bude elektrické napětí nebo elektrický proud, se budeme
setkávat nejčastěji. To souvisí se skutečností, že jsou k dispozici technické prostředky, které
umožňují elektrické signály zpracovávat rychle a levně. Jak již bylo zmíněno, nejčastěji
se také budeme zabývat signály, u kterých se bude informaci nesoucí veličina měnit v
závislosti na čase.
Matematické modely signálů jsou vynikajícím a efektivním nástrojem pro studium signálů a hledání nástrojů jejich analýzy a algoritmů jejich zpracování. Umožní nám snadno
zavést užitečné veličiny a pojmy. Student přitom najde bezprostřední uplatnění části svých
znalostí středoškolské a vysokoškolské matematiky.
Příklad 1. Typickým signálem je například elektrické napětí na svorkách reproduktoru
radiopřijímače. Napětí se mění v čase, o čemž je možné se přesvědčit pomocí osciloskopu.
Signál je fyzikální veličinou a je také zřejmé, že průběh napětí zobrazuje nějakou informaci.
Příklad 2. (Signál EKG). Signál EKG (Electrocardiography signal, ECG) poskytuje
lékaři důležité informace o činnosti a stavu lidského srdce. Signál zdravého člověka je
přibližně periodický s periodou asi 1s. Nápadným prvkem v časovém průběhu EKG je
zpravidla úzký impulz charakteristického tvaru známý pod označením QRS komplex.
V moderních přístrojích se signál EKG vzorkuje, aby pak mohl být vyjádřen posloupností čísel. Standardní rychlosti vzorkování jsou 250 vzorků (samples) za sekundu a
500 vzorků za sekundu (Sa/s).
K vlastnímu signálu EKG se připojují různé rušivé složky. Patří k nim například napětí
s kmitočtem 50 Hz naindukované ze síťových rozvodů kapacitními vazbami a magnetickou
indukcí. Další rušivé signály, které jsou součástí snímaného napětí, jsou vyvolány svalovými stahy. Přítomnost rušivých signálů může být nepříjemná, protože užitečná složka
signálu má rozkmit jen asi 1 mV.
Příklad 3. (Signál EEG). Signály EEG (Encephalogram Signal) jsou snímány z několika
míst povrchu hlavy. Jedná se o součtová napětí vyvolaná činností milionů neuronů v
mozku. Typický rozkmit napětí se pohybuje v rozmezí od 2 do 100 mV. Výkon signálů
je převážně rozložen v kmitočtovém pásmu od 0,5 Hz do 100 Hz. Signály EEG umožňují
zjišťovat epilepsii, poruchy spánku aj.
Příklad 4. (Řečový signál). Řečový signál je akustickým signálem. Má celou řadu specifických vlastností a nese rozličné informace. Především má nějaký obecný věcný obsah,
sdělení, které by bylo možné vyjádřit písmem. Z řečového signálu jsme zpravidla schopni
rozpoznat, zda mluví muž, žena nebo dítě, jakým jazykem mluvčí mluví, jakou má náladu
a pod. Také jsme schopni na základě hlasového projevu rozpoznat nám známou osobu,
což je využíváno v bezpečnostních systémech.
Matematika 2
101
Při přenosu řečí na velkou vzdálenost můžeme klást různé nároky na kvalitu přenosu
podle toho, jaké informace chceme z přijatého signálu získat. Jakost řečového signálu
je dána především kmitočtovým pásmem propustnosti sdělovacího systému. V praxi se
ustálila telefonní kvalita (telephone speech) s pásmem 300 Hz až 3 400 Hz, v USA 200 Hz
až 3 200 Hz, rozhlasová kvalita (wideband speech) s pásmem 50 Hz až 7 kHz a konečně
CD kvalita (wideband audio) s pásmem 10 Hz až 20kHz stereo.
Časový průběh napětí získaného z mikrofonu odpovídající části hlásky ”s” je znázorněn
v horní polovině obr. 1-2, v jeho dolní polovině je nakreslen časový průběh hlásky ”i”.
Časový průběh vyjadřující hlásku ”s” je výrazně nepravidelný, zatímco signál hlásky ”i”
je skoro periodický.
Ukazuje se, že při řešení řady úloh v elektrotechnice lze pominout náhodnost v chování signálu. Proto často skutečné, v podstatě náhodné, stochastické signály nahrazujeme
pravidelnými signály s jednoznačně definovanými hodnotami v jejich definičním oboru.
Někam mezi náhodné signály a pravidelné signály můžeme zařadit tzv. chaotické signály.
Příklad 5. (Datový signál). V počítačových sítích, v moderních rozhlasových a televizních
systémech, v systémech mobilních telefonů, v soustavách dálkového měření a ovládání jsou
přenášeny z jednoho místa na druhé sdělovacími soustavami signálové prvky vyjadřující,
přímo nebo zprostředkovaně, nuly a jedničky. Příklad signálových prvků datového signálu
je nakreslen na obr. 1-4. Jedná se o signál nazývaný NRZ (nonreturn-to-zero) dvojí polarity [42]. Nula je vyjadřována záporným impulzem šířky T a výšky D, jednička je vždy
vyjádřena kladným impulzem šířky T a výšky D. Při přenosu jsou nejčastěji signálové
prvky řazeny jeden za druhým, takže se přenáší 1/T signálových prvků za sekundu (obr.
1-5). Počet signálových prvků přenášených za sekundu se nazývá modulační rychlost.
Počet dvojkových číslic přenášených za sekundu se nazývá přenosová rychlost. V našem
případě obě veličiny nabývají stejných číselných hodnot.
Signál má obvykle v místě příjmu malý výkon. Je přinejmenším lineárně zkreslen.
To se projevuje změnou tvaru signálových prvků. Přitom nám nejvíce vadí zvětšení doby
trvání signálových prvků. Signálové prvky po sob+ jdoucí se překrývají a vzájemně se ruší.
Navíc se ve sdělovacím systému zpravidla k užitečnému signálu přidružují rozličné signály
rušivé. Hledání algoritmů pro správné vyhodnocení přijatého signálu spolu s hledáním
vhodných tvarů vysílaných signálových prvků a jejich efektivních kombinací představuje
příležitost pro uplatnění mnoha odborníků na číslicové zpracování signálu.
Je vhodné připomenout, že při řešení některých úloh náhodný charakter signálu pominout nelze.
Obecnějším termínem, než pojem signál, je termín proces — nezaměňujte prosím s
náhodným procesem. Procesem je každý fyzikální, společenský, biologický nebo jiný jev
či děj, probíhající v určitém prostředí, zpravidla relativně uzavřeném. Proces může být
více či méně dokonale popsán několika signály.
Příklad 6. Příkladem procesu v uvažovaném slova smyslu může být činnost nebo chování
motoru při rozjezdu automobilu. Tento proces může být popsán celou řadou signálů, např.
závislostí otáček na čase, závislostí kroutícího momentu na čase, závislostí teploty chladicí
kapaliny na čase, závislostí úhlu otevření škrticí klapky na čase, atd. V automobilu Felicia
s řidicí jednotkou Siemens je uvedený proces sledování osmi čidly.
102
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
Abychom mohli úspěšně řešit technické problémy, nutně potřebujeme skutečné signály
matematicky popsat, vyjádřit. Vytváříme proto matematické modely signálů.
Signály můžeme členit podle různých hledisek. Uvedeme několik z nich a současně
vymezíme typy signálů, které nás budou v dalších kapitolách zajímat.
A. Členění podle počtu nezávisle proměnných.
1) Jednorozměrné signály (někdy označované krátce 1D signály); příkladem může
být průběh napětí u(t), s jedinou nezávisle proměnnou t (časem).
2) Dvourozměrné signály (2D signály); např. průběh úrovně šedi (šedotónového)
obrazu p(x, y), kde jsou nezávisle proměnnými prostorové souřadnice x a y.
3) Vícerozměrné signály (např. 3D objekty).
Dále se omezíme pouze na jednorozměrné signály, které jsou funkcemi času, resp. časovými
posloupnostmi.
B. Nezávisle proměnná může být spojitá (souvislá) nebo diskretní. Je-li nezávisle proměnnou čas, můžeme signály dělit na:
1) signály se spojitým časem (nazývané též jako signály se souvislým časem nebo
zjednodušeně spojité signály), které jsou (po částech) spojité funkce spojitě proměnného času; spojité signály nabývající reálných hodnot bývají nazývány jako
analogové.
2) signály s diskretním časem (zjednodušeně diskretní signály), které jsou uspořádanými posloupnostmi hodnot; tyto jsou např. výsledkem rovnoměrného vzorkování
spojitého signálu v okamžicích tn = nT , kde n je celé číslo a T vzorkovací perioda;
takové signály budeme označovat jako posloupnosti s(nT ), nebo zjednodušeně jako
s(n), popř. sn . Zvláštním případem diskretních signálů jsou číslicové signály, které
jsou diskretizovány nejen v čase, ale i v úrovni — jejich vzorky jsou vyjádřeny s
omezenou přesností, vymezenou obvykle počtem bitů, které máme k dispozici pro
jejich reprezentaci.
C. Členění podle matematických modelů signálů.
1) Deterministické signály (někdy označované jako regulární signály nebo také determinované signály) jsou signály, které jsou reprezentovány konkrétními (známými)
analytickými funkcemi nebo posloupnostmi. Díky tomu umíme určit jejich hodnotu
v kterémkoliv, tedy i budoucím čase. V realitě se s (idealizovanými) čistě deterministickými signály prakticky nesetkáme, ale velmi důležité je jejich uplatnění při
analýze vlastností systémů.
2) Náhodné procesy (zjednodušeně náhodné nebo stochastické signály) jsou na rozdíl
od deterministických signálů nepředvídatelné. K jejich popisu slouží stochastické
modely. I zde existují idealizované modely, např. bílý šum, se kterými se v praxi v
čisté podobě nesetkáme, ale můžeme je využít např. při návrhu některých speciálních
systémů.
Matematika 2
103
V této publikaci se zaměříme na spojité a diskretní deterministické signály, důležité při
analýze lineárních spojitých a číslicových systémů. U stochastických signálů se omezíme
pouze na úvod do teorie diskretních náhodných procesů.
Poznamenejme ještě, že signály s(t), pro které platí s(t) 6= 0 pro libovolné t < 0,
nazýváme nekauzálními. Naopak signály, pro které platí s(t) = 0 pro libovolné t < 0
jsou kauzální.
7.2
Signály se spojitým časem
Signály se spojitým časem nazýváme také spojitými (jednorozměrnými) signály nebo signály se souvislým časem obvykle představují (po částech) spojité reálné nebo komplexní
funkce u = f (x) jedné reálné proměnné, u je nejčastěji čas probíhající časovou množinu
(časovou osu), což je interval ht0 , ∞) ⊂ R nebo jeho vhodný podinterval ht0 , t1 i ⊂ ht0 , ∞).
Zde R – jakožto i dříve – označuje množinu všech reálných čísel, kterou můžeme také
označit jako interval (−∞, ∞). Připomeňme, že intervalem reálných čísel se rozumí každá
alespoň dvouprvková lineárně uspořádaná množina I ⊂ R s touto vlastností: Jestliže
x, y ∈ I, x < y a z ∈ R je číslo s vlastností x < z < y, pak z ∈ I.
Obecněji lze spojitým (jednorozměrným) signálem nazývat funkci u = f (x), kde x je
prostorová vzdálenost nebo jiná veličina. Dále, počet nezávisle proměnných není principiálně omezen; pak hovoříme o dvojrozměrných nebo vícerozměrných signálech (např. obraz
je jasový signál závislý na dvou prostorových souřadnicích). Signály spojité v uvedeném
smyslu se také označují jako analogové, neboť bývají reprezentovány průběhy fyzikálních
analogových veličin.
7.3
Periodické signály, harmonické signály a jejich
spektra
V technické praxi se často setkáváme se signály, jejichž průběh se periodicky opakuje.
Příkladem takového signálu může být datový signál vyjádřený periodickou posloupností
čísel 0, 1, tj. ku příkladu posloupností 01010101 . . . . Také signál vyjádřený posloupností
0011001100110011 . . . atd. je signálem periodickým, ale s dvojnásobnou periodou.
Funkce y = s(t) je periodická, existuje-li kladné číslo Tp takové, že pro všechna reálná
čísla t platí:
s(t + Ts ) = s(t) .
Nejmenší hodnota Ts s výše uvedenou vlastností se nazývá základní perioda.
Při řešení některých fyzikálních problémů, ve kterých se vyskytují periodické děje, je
výhodné vyjádřit příslušné funkce pomocí nekonečných Fourierových (trigonometrických)
řad. Jako příklady uveďme elektrické, akustické či mechanické kmity nebo teorii pružnosti.
Periodická funkce modelující spojitý signál s periodou Ts , s(t) = s(t + mTs ), m celé,
která splňuje Dirichletovy podmínky (funkce musí být absolutně integrovatelná, musí mít
v periodě konečný počet nespojitostí a konečný počet extrémů – lze říci, že každý „rozumnýÿ signál uvedené podmínky splňuje), může být reprezentována součtem komplex-
104
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
ních harmonických funkcí o kmitočtech kΩ (když Ω = 2π/Ts je základní úhlový kmitočet
signálu a k je celé číslo),
∞
X
s(t) =
ck ejkΩt ,
(2.1)
k=−∞
kde ck jsou komplexní koeficienty Fourierovy řady, které lze vypočítat jako
Z
1 Ts
s(t)e−jkΩt dt .
ck =
Ts 0
(2.2)
Důkaz platnosti obou vzorců je jednoduchý. Dosaďme do (2.2) za s(t) z (2.1) a získáme
Z Ts
Z h X
∞
∞
i
1
1 X
1
jkΩt −jmΩt
ej(k−m)Ωt dt
= cm Ts .
ck e
e
dt =
ck
cm =
Ts
Ts k=−∞
Ts
k=m
0
k=−∞
Koeficienty Fourierovy řady ck = |ck | · ej·arg(ck ) lze považovat za komplexní amplitudy
komplexních harmonických signálů ejkΩt , které tvoří analyzovaný periodický signál. Situace se na pohled zjednoduší pro reálný signál s(t), kdy musí být koeficienty Fourierovy
řady v komplexně sdružených párech ck = c∗−k . Vztah (2.1) lze pak přepsat do podoby
s(t) = c0 +
∞ h
X
i
|ck |e−j arg c+k e−jkΩt + |ck |ej arg ck ejkΩt =
k=1
∞
X
= c0 + 2
(2.3)
|ck | cos(kΩt + arg ck ) ,
k=1
tedy vyjádřit signál jako lineární kombinaci stejnosměrné složky c0 a reálných harmonických signálů o amplitudách 2|ck | a počátečních fázích arg(ck ).
Tzv. dvoustranná spektra jsou velmi užitečná. Jedná se reprezentaci spojitého periodického signálu s(t) lineární kombinací komplexních (vzájemně nezávislých) harmonických
signálů. Využitím vztahu (2.2) je zřejmě spektrální analýza spojitého periodického signálu; komplexní koeficienty Fourierovy řady představují diskrétní spektrum. Interpretace
koeficientu ck je při spektrální analýze reálného signálu jednoduchá: jeho modul |ck | je
polovinou amplitudy a argument arg ck fázovým posunutím (počáteční fází) k-té reálné
harmonické složky, která je v analyzovaném signálu obsažena; k-tou harmonickou složkou
míníme harmonický signál o frekvenci kΩ, Ω je základní úhlová frekvence signálu.
Příklad 2.1. Realizujme harmonickou analýzu periodického obdélníkového signálu zobrazeného v horní části obr. 2.1. Výška obdélníků je A, šířka Ti , perioda signálu Ts , základní
úhlová frekvence Ω = 2π/Ts . Dosazením do (2.2) získáme stejnosměrnou složku
Z
1 Ts /2
A Tj /2
Ti
c0 =
A dt = [t]−T
=A
i /2
Ts −Ts /2
Ts
Ts
a obecně k-tou složku
"
#Ti /2
2π
Z
T
1 Ts /2 −jk T2π t
A e−jk Ts t
Ti sin kπ Tsi
s dt =
ck =
Ae
=A
.
Ts −Ts /2
Ts −jk 2π
Ts kπ TTsi
Ts
−Ti /2
Matematika 2
105
Na obr. 2.1 je Ti = 0, 1s a Ts = 0, 2s. Jednotlivé spektrální čáry jsou od sebe vzdáleny
o 1/Ts = 5Hz, každá druhá (tj. pro sudé k) je nulová. Koncové body jsou funkčními
hodnotami funkce sin(x)/x (její modul je naznačen čárkovanou kresbou) s průchody nulou
v násobcích kmitočtu 1/Ti = 10Hz. Spektrum uvedeného signálu, který se symetrický
kolem t = 0, je reálné. Pro sin(x)/x > 0 je ck = |ck | a pro sin(x)/x < 0 je ck = −|ck | =
|ck |e±iπ – ve druhém případě je zřejmě arg ck = π nebo −π.
Zdůrazněme nejdůležitější vlastnosti spekter periodických signálů.
Spektrum spojitého periodického signálu je vždy diskretní (čarové).
Spektrum reálného signálu obsahuje kromě stejnosměrné složky c0 komplexní harmonické složky v komplexně sdružených párech: |ck | = |c−k |, arg ck = − arg c−k . Je-li
signál sudý (symetrický kolem nuly), je jeho spektrum reálné.
Vypočteme integrál
Z
b
I(x) =
exp(±jxy) dy .
(3 − 3)
−b
Pro x = 0 je
I(0) = 2b .
Pro případ x 6= 0 dostáváme
h exp(±jxy) ib
exp(jxb) − exp(−jxb)
=
=
I(x) =
±jx
jx
−b
2 exp(jxb) − exp(−jxb)
sin bx
−
= 2b
.
x
2j
bx
Dílčí výsledky (3-4) a (3-5) lze společně zapsat vztahem
Z b
exp(±jxy) dy = 2b sin c(bx) .
(3 − 4)
(3-5)
(3 − 6)
−b
Tím je odvození vzorce skončeno.
Nyní již přikročíme k výpočtu spektra periodického sledu obdélníkových impulzů.
Analyzovaný signál je nakreslen na obr. 3-2. Záměrně byl zvolen tak, aby představoval
sudou funkci. Ze vztahu (2-19) lze vyvodit, že v tomto případě koeficienty ck budou ryze
reálné. Výsledek výpočtu to potvrdí. Impulzy mají šířku ϑ = 1, výšku D = 10 a opakují
se s periodou T1 = 3. Koeficienty ck Fourierovy řady (2-16) vypočteme pomocí vztahu
(2-19):
Z T1 /2
Z ϑ
2
1
1
ck =
D exp(−jkω1 t) dt =
s(t) exp(−jkω1 t) dt =
T1 −T1 /2
T1 − ϑ2
Z ϑ
D 2
=
exp(−jkω1 t) dt .
(3-7)
T1 − ϑ2
Pro výpočet integrálu využijeme dříve odvozený vztah (3-6), kde bude t = y, b = ϑ/2 a
x = kω1 . Díky tomu můžeme pro koeficient ck Fourierovy řady psát:
ϑ
ϑ
D ϑ
ϑ
ck = 2 sin c kω1 = D sin c kω1 .
(3 − 8)
T1 2
2
T1
2
106
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
Spektrum signálu z obr. 3-2 je nakresleno na obr. 3-3. Vzhledem k tomu, že koeficienty
ck by obecně mohly být komplexní, je spektrum rozděleno na modulové a argumentové.
Pro načrtnutí spektra stačí spočítat úhlový kmitočet ω1 základní harmonické složky,
úhlový kmitočet ωa určující kmitočtovou souřadnici prvního průchodu funkce sin c(·) nulou
a hodnotu výrazu Dϑ/T1 . Úhlový kmitočet ωa vypočteme z rovnice
ωa =
2π
.
ϑ
(3 − 9)
V našem případě je ω1 = 2π/3, ωa = 2π a Dϑ/T1 = 3, 3. Pro úhlový kmitočet ω = ωa
je funkce sin c(·) ve vztahu (3-8) rovna nule. Pokud je úhlový kmitočet ωa celistvým násobkem úhlového kmitočtu ω1 , není ve spektru obsažena harmonická složka s úhlovým
kmitočtem rovným tomuto celistvému násobku. V našem případě, kdy T1 = 3ϑ, neobsahuje signál 3. harmonickou složku. Neobsahuje také 6., 9. a 12. harmonickou složku a
vůbec všechny harmonické složky s úhlovými kmitočty rovnými celistvému násobku úhlového kmitočtu 3ω1 . Amplitudy harmonických složek jsou úměrné dvojnásobku délek
úseček vyjadřujících moduly koeficientů ck — obr. 3-3a. Absolutní hodnota stejnosměrné
složky je úměrná délce úsečky na kmitočtu ω = 0, tedy ne jejímu dvojnásobku! Znaménko od nuly různé stejnosměrné složky je určeno hodnotou argumentu koeficientu c0 .
V našem případě je arg(c0 ) = 0, stejnosměrná složka je tedy kladná. Pokud by byl argument koeficientu c0 roven π nebo −π, byla by stejnosměrná složka záporná. Počáteční
fáze jednotlivých harmonických složek jsou dány příslušnými hodnotami argumentů ck
vynesenými na obr. 3-3b.
Poučky o spektrech mohou usnadnit výpočet koeficientů Fourierovy řady. Nám však
jde spíše o to zjistit, jak se změny časového průběhu signálu projeví ve spektru signálu.
Poučky zde uvedeme bez odvození, které ostatně není příliš obtížné. U všech signálů
budeme předpokládat, že jsou periodické s periodou T1 a že modelují signály s konečnou
střední hodnotou výkonu.
Spektrum součtu signálů
Nechť je signál s(t) tvořen součtem signálů sa (t) a sb (t):
s(t) = sa (t) + sb (t) .
(3 − 10)
Koeficienty Fourierovy řady signálů s(t) označíme ck , koeficienty signálu sa (t) označíme
cak a koeficienty signálu sb (t) označíme cbk . Pak pro všechna k ∈ Z platí:
ck = cak + cbk .
(3 − 11)
Spektrum signálu násobeného konstantou
Nechť jsou koeficienty Fourierovy řady signálu s(t) označeny ck a nechť a je libovolná
konstanta. Pak platí, že koeficienty Fourierovy řady signálu as(t) jsou dány hodnotami
výraz’ ack .
Spektrum signálu posunutého v čase Pro posunutý signál zavedeme označení
sτ (t) = s(t − τ ) ,
(3 − 12)
Matematika 2
107
τ je reálná konstanta.
Nyní se budeme zabývat harmonickým signálem.
Harmonický signál je zvláštním případem periodického signálu, pro který platí
s(t) = s(t + iTs ), ,
kde Ts je perioda signálu, i . . . celé.
Spojitý harmonický signál lze vyjádřit pomocí této spojité funkce:
1
s(t) = As cos(ωs t + ϕs ) = As cos(2πfs t + ϕs ) = As cos 2π (t + iTs ) + ϕs .
Ts
Je jednoznačně určen třemi parametry: amplitudou As , úhlovou frekvencí ωs [rad/s] a počáteční fází ϕs [rad]. Tento signál může být reprezentován ve frekvenční oblasti frekvenčním amplitudovým spektrem (spektrální čarou o velikosti As na frekvenci ωs ) a fázovým
frekvenčním spektrem (čarou o velikosti ϕs na frekvenci ωs ). Aditivní směs harmonických
signálů různých kmitočtů a počáteční fází pak může být poměrně přehledně reprezentována příslušnými spektrálními čarami. Jedná se o reprezentaci harmonických signálů
tzv. jednostrannými frekvenčními spektry. Běžná je však reprezentace frekvenčními spektry dvoustrannými. Důvodem je „nepříjemnáÿ goniometrická funkce, se kterou se „špatně
počítáÿ, protože se při analýze signálů i systémů objevuje uvnitř integrálu nebo sumy.
Z hlediska analýzy je vhodnější reprezentace harmonického signálu (po aplikaci Eulerova vzorce)
s(t) = As
As j(ωs t+ϕs ) As −j(ωs t+ϕs )
ej(ωs t+ϕs ) + e−j(ωs t+ϕs )
=
e
+
e
,
2
2
2
odkud vyplývá následující popis ve frekvenční oblasti: frekvenční modulové spektrum
v podobě dvojice spektrálních čar o velikosti As /2 na frekvencích ωs a −ωs a frekvenční
argumentové spektrum v podobě čar ϕs na frekvenci ωs a −ϕs na frekvenci −ωs .
Ukázka dvoustranného spektra je na obr. 1.1. Reprezentaci harmonického signálu dvojicí
komplexních (komplexně sdružených) signálů o kmitočtech ωs a −ωs je nutno chápat
abstraktně, jako matematický model.
Spektrum harmonického signálu
s(t) = a cos(ωs t + ϕs ) =
A −jωs jωs t A jωs −jωs t
e
e
+ e e
2
2
je součtem spekter jeho komplexních složek, protože Fourierova transformace je lineární.
7.4
Aperiodické signály, spektrum signálu
Naznačíme možnost zobecnění Fourierových řad pro neperiodické signály. Předpokládejme, že funkce u = x(t) představuje časově omezený signál, pro který platí x(t) = 0
pro každou hodnotu t ∈
/ (−T1 , T1 ), tedy t < −T1 a T1 < t. Vytvořme z uvedeného signálu
signál periodický s periodou Λ rozšířením xΛ (t + nΛ) = x(t), Λ > 2T1 . Potom
x(t) = lim xΛ (t) .
Λ→∞
108
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
Periodický signál xΛ (t) můžeme vyjádřit pomocí Fourierovy řady s(t) =
∞
X
ck ejkΩt jako
k=−∞
xΛ (t) =
∞
X
ck ejnΩt ,
n=−∞
kde
1
ck =
Λ
Λ
2
Z
x(t)e−jnΩt dt ,
Ω=
−Λ
2
2π
, n celé.
Λ
Λ Λ
, můžeme upravit meze předcházejícího integrálu
Protože x(t) ≡ 0 vně intervalu − ,
2 2
a psát
Z
1 ∞
ck =
x(t)e−jnΩt dt .
Λ −∞
Nyní definujeme Fourierovu transformaci
Z ∞
X(ω) =
x(t)e−jωt dt ,
(2.6)
−∞
takže pro ω = nΩ dostaneme
Z
∞
X(nΩ) =
x(t)e−jnΩt dt a ck =
−∞
1
X(nΩ) .
Λ
Pak můžeme upravit výše uvedenou Fourierovu řadu do tvaru
∞
∞
X
1
1 X
jnΩt
X(nΩ)e
=
ΩX(nΩ)ejnΩt .
xΛ (t) =
Λ
2π n=−∞
n=−∞
Předpokládejme Λ → ∞, odtud nΩ → ω (ω je spojitě proměnná frekvence) a Ω → dω
(frekvenční krok Ω přejde na dω). Předchozí suma vede v tomto limitním případě na
integrál, a protože pro Λ → ∞ je xΛ (t) → x(t), můžeme konečně napsat finální vzorec
pro zpětnou Fourierovu transformaci
Z
1 ∞
x(t) =
X(ω)ejωt dω .
(2.7)
Λ −∞
Fourierovu transformaci S(ω) signálu s(t) budeme dále stručně označovat jako
S(ω) = F{s(t)} .
Fourierovu transformaci lze použít ke zkoumání spektrálních vlastností neperiodických
signálů, ale i signálů periodických (a to spojitých i diskretních). Výsledkem Fourierovy
transformace je spektrum (spíše ale spektrální hustota, viz níže) jako funkce spojitého
kmitočtu.
Matematika 2
109
Příklad 2.2. Spočítejme spektrum S(ω) jednorázového obdélníkového signálu s(t) zobrazeného v horní části obr. 2.2. Výška obdélníku je A, šířka Ti . Dosazením do (2.6) získáme
Ti /2
"
e−jωt
s(ω) =
Ae−jωt dt = A
−jω
−Ti /2
Z
=
−A jω
#t=Ti /2
=
t=ti /2
ωTi
−A −j ωTi
e 2 − ej 2 =
jω
sin ωT2 i
ωTi − 2j sin
= ATi
2.
2
ωTi
Spektrum je reálné, protože se jedná o transformaci signálu symetrického kolem nuly
(sudého). Modul spektra je zobrazen v dolní části obr. 2.2. Podobně jako u Příkladu 2.1
je argumentové spektrum arg S(ω) = 0 pro sin(x)/x > 0 a arg S(ω) = π nebo −π pro
sin(x)/x < 0 (viz též Příklad 2.1).
Na rozdíl od koeficientů Fourierovy řady reprezentujících spektrum periodického signálu (viz obr. 2.1 k Příkladu 2.1), nepředstavuje v Příkladu 2.2 hodnota S(0) = ATi
stejnosměrnou složku, stejně jako S(ω1 ) nepředstavuje hodnotu amplitudy komplexní
harmonické složky (o úhlové frekvenci ω1 ), která je v signálu obsažena. Proto je výstižnější označení funkce S(ω) jako spektrální hustota (vzpomeňme např. na interpretaci
hustoty pravděpodobnosti). Je-li analyzovaným neperiodickým signálem elektrické napětí
proměnné v čase u(t), je rozměrem modulu spektrální hustoty [V s], popř. [V /Hz]. Při
frekvenční reprezentaci periodického u(t) je rozměrem |ck | [V ].
Spektrum Diracova impulsu je s ohledem na filtrační vlastnost Diracova impulzu
(1.4)
Z ∞
F{δ(ω)} =
δ(ω)e−jωt dω = 1 .
(2.8)
−∞
Ze spektra vyplývá zajímavost Diracova impulsu z hlediska vlastností lineárních systémů:
v Diracově impulsu jsou totiž zastoupeny rovnoměrně všechny harmonické složky s nulovým fázovým posunem. S termínem souhlasím. Odezva lineárního systému na Diracův
impuls se nazývá impulsní charakteristika systému. Jestliže spektrum vstupu, kterým
je jednotkový impuls, je konstanta, pak spektrum výstupu nás bude informovat o frekvenčních vlastnostech systému — jeho spektrem je frekvenční charakteristika lineárního
systému, která nás informuje, s jakou korekcí amplitudy a fáze „propustilÿ systém tu
kterou (ve vstupu obsaženou) harmonickou složku na výstup.
Spektrum stejnosměrného signálu (konstanty) s(t) = A, pro t ∈ (−∞, ∞), zřejmě
nebude obsahovat frekvenční složky o kmitočtech ω 6= 0. Jeho přímý výpočet je ovšem
problematický, neboť taková funkce s(t) není absolutně integrovatelná. Zkusme jít na
řešení z druhé strany, přes zpětnou transformaci Diracova impulsu
Z ∞
1
1
−1
δ(ω)ejωt dω =
.
F {δ(ω)} =
2π −∞
2π
Odtud zřejmě
n1o
F
= δ(ω)
2π
110
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
a
n
1o
= 2πAδ(ω) .
F{A} = F A2π
2π
Spektrem stejnosměrného signálu s(t) = A je Diracův impuls s mohutností 2πA.
(2.9)
Jak již bylo uvedeno, spektrum harmonického signálu
s(t) = A cos(ωs t + ϕs ) =
A −jϕs jωs t A jϕs −jωs t
e
e
+ e e
2
2
je součtem spekter jeho komplexních složek, protože je Fourierova transformace lineární
(neboť vyhovuje principu superpozice). Také při výpočtu Fourierova obrazu komplexní
složky harmonického signálu si pomůžeme zpětnou transformací Diracova implusu, ale
posunutého,
Z ∞
1
1 −jωs t
−1
F {δ(ω − ωs )} =
δ(ω − ωs )ejωt dω =
e
2π −∞
2π
⇒ F{e−jωs t } = 2πδ(ω − ωs ) ,
podobně
Z ∞
1
1 jωs t
F {δ(ω + ωs )} =
δ(ω + ωs )ejωt dω =
e
2π −∞
2π
⇒ F{ejωs t } = 2πδ(ω + ωs ) .
−1
Výsledné spektrum harmonického signálu je
A
A
S(ω) = F{A cos(ωs t + ϕs )} = 2π δ(ω − ωs )e−jϕs + 2π δ(ω + ωs )ejϕs .
2
2
(2.10)
Modulové spektrum je v podobě dvou symetrických Diracových impulsů na kmitočtech
ωs a −ωs o mohutnostech πA, argumentové spektrum tvoří antisymetrické spektrální čáry
ϕs na ωs a −ϕs na −ωs .
Vlastnosti Fourierovy transformace
Spektrum aperiodického signálu je spojité. Dokonce i Fourierův obraz periodického signálu můžeme považovat za spojitý v tom smyslu, že s jednotlivými komplexními
spektrálními čarami (koeficienty Fourierovy řady) koresponduje sled spojitých Diracových
impulsů s komplexními vahami podle (2.9).
Spektrum reálného signálu. Modul spektra reálného signálu je vždy symetrický kolem
nuly, argumentové spektrum je antisymetrické (liché). Je-li navíc signál sudý (symetrický
kolem nuly), je jeho spektrum reálné.
Fourierova transformace je lineární. Bez důkazu (který je zřejmý a spočívá v ověření
platnosti principu superpozice) uveďme, že platí
Asa (t) + Bsb (t) ↔ F{Asa (t) + Bsb (t)} = ASa (ω) + BSb (ω) .
Spektrum signálu se změněným časovým měřítkem. Zamysleme se ještě krátce
nad spektrem obdélníkového impulsu v Příkladu 2.2, resp. na obr. 2.2. Ze spektra S(ω)
Matematika 2
111
vyplývá, že jeho první průchod nulou je při ωTi /2 = π, tj. na úhlové frekvenci ω = 2π/Ti .
Čím širší bude impuls, tím nižší bude frekvence, na které bude průchod spektra nulou a
vyšší maximum (ATi ) spektrální funkce a naopak. Vliv změny časového měřítka lze krátce
vyjádřit jako
ω
F
F 1
s(t) ↔ S(ω) ⇒ s(mt) ↔ S
(2.11)
m m
(kde m je kladná konstanta), tzn. že roztažením časového měřítka („roztažením signáluÿ
dojde ke stlačení frekvenčního měřítka („stlačení spektraÿ) a naopak.
Spektrum posunutého signálu. Předpokládejme pár s(t) ↔ S(ω) a nechť sτ (t) =
s(t − τ ) ↔ Sτ (ω). posunutí se projeví (stejně jako u Fourierových řad, důkaz je obdobný)
zřejmě pouze na argumentovém spektru. Stručně můžeme psát
F−jωτ
F
s(t) ↔ S(ω) ⇒ s(t − τ ) e
S(ω) .
(21.12)
Konvoluční vlastnost Fourierovy transformace. Fourierova transformace konvoluce
signálů s1 (t) a s2 (t) je
Z
∞
hZ
∞
i
s1 (τ )s2 (t − τ ) dτ e−jωτ dt =
−∞
Z−∞
hZ
i
∞
−jωt
=
s1 (τ )
∞s2 (t − τ )e
dt dτ =
−∞
−∞
Z ∞
hZ
i
−jω(t−τ )
s1 (τ )
∞s2 (t − τ )e
dt e−jωτ dτ =
=
−∞
Z ∞ −∞
= S2 (ω)
s1 (τ )e−jωτ dτ = S1 (ω)S2 (ω) ,
F{s1 (t) ∗ s2 (t)} =
−∞
krátce
F
s1 (t) ∗ s2 (t) ↔ S1 (ω)S2 (ω) .
(2.13)
Konvoluční vlastnost, kterou můžeme slovně interpretovat tak, že konvoluci signálů (v
časové oblasti) odpovídá (ve frekvenční oblasti) součin jejich spekter, je velmi důležitá
pro analýzu lineárních systémů. Jestliže je jedním ze signálů impulsní charakteristika lineárního systému (tj. odezva systému na Diracův impuls), jehož spektrem je frekvenční
charakteristika systému, pak konvoluce vstupního signálu s impulsní charakteristikou koresponduje se součinem spektra vstupu s frekvenční charakteristikou systému.
Fourierova transformace součinu signálů je zajímavá tím, že je duální operací k
(2.13),
F 1
S1 (ω) ∗ S2 (ω .
(2.14)
s1 (t)s2 (t) ↔
2π
112
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
Důkaz.
Z ∞ hZ ∞
i
1
S1 (ξ)S2 (ω − ξ) dξ ejωt dω =
F {S − 1(ω) ∗ S2 (ω)} =
2π −∞ −∞
Z ∞
hZ ∞
i
1
jωt
S1 (ξ)
S2 (ω − ξ)e dω dξ =
=
2π −∞
−∞
Z ∞
hZ ∞
i
1
j(ω−ξ)t
=
S1 (ξ)
S2 (ω − ξ)e
dω ejξt dξ =
2π −∞
−∞
Z ∞
S1 (ξ)e−jξt dξ = s1 (t)s2 (t) .
= s2 (t)
−1
−∞
Na závěr tohoto paragrafu uvedeme ještě Laplaceovy obrazy některých signálů. Připoměňme, že počítáme jednostrannou Laplaceovu transformaci, tzv. že předpokládáme
kauzální signály.
Obraz Diracova impulsu je
Z ∞
δ(t)e−pt dt = 1 .
(2.20)
L {δ(t)} =
0
Obraz jednotkového skoku
L {l(t)} =
Z
∞
le−pt dt =
h e−pt it=∞
0
p
t=0
=
1
.
p
2.21
Obraz harmonického signálu spočítáme díky linearitě transformace jako součet obrazů
jeho komplexních složek,
Z ∞
1
1
jωi t
e−(p−jωi )t dt =
L {e } =
[e−(p−jωi )t ]t=∞
,
(2.22a)
t=0 =
p − jωi
p − jωi
0
Z ∞
1
jωi t
L {e } =
e−(p+jωi )t dt =
,
(2.22b)
p + jωi
0
1
1 p
F 1
cos(ωi t) ↔
+
= 2
.
(2.22c)
2 p − jωi p + jωi
p + ωi2
Poznamenejme, že při ωi = 0 přejde kterýkoliv z obrazů (2.22a, b, c) na obraz jednotkového skoku 2.21, který je vlastně „kauzálníÿ stejnosměrnou složkou.
Obraz derivace signálu. Integrací
po částech,
při v = e−pt a u = s(t), s použitím
Z
Z
(uv)0 = u0 v + uv 0 a schématu uv 0 = uv − u0 v dostaneme
Z
0
∞
it=∞
ds(t) −pt h
e = s(t)e−pt
−
dt
t=0
Z
∞
−pe−pt s(t) dt
0
a odtud
ds(t) L
↔ pS(p) − s(0+ ) .
dt
(2.23)
Matematika 2
113
Pro transformaci diferenciální rovnice popisující spojitý systém budeme potřebovat i obraz
n-té derivace signálu,
X
ds(n) (t) L n
↔ p S(p) −
npn−i s(i−1) (0+ ) .
dt
i=1
(2.24)
Pro lepší pochopení sumu rozepišme
ds(n) (t) L n
↔ p S(p) − s(n−1)(0+ ) − ps(n − 2)(0+ ) − p2 s(n−3) (0+ ) − · · · − pn−1 s(0+ ) .
dt
Důkaz lze provést úplnou indukcí. Pro n = 1 jsme důkaz uvedli, platí-li uvedený vzorec
pro obecné n > 1, musí platit i pro n + 1. Nechť
L {g(t)} = L s(n) (t) ⇒ L {g 0 (t)} = L s(n+1) (t) , g(0+ ) = s(n) (0+ ) .
Potom
n
X
(n+1)
(n+1)
L s
=p
S(p) −
pn+1−i s(i−1) (0+ ) − s(n) (0+ ) =
= p(n+1) S(p) −
i=1
n+1
X
p(n+1)−i s(i−1) (0+ ) .
i=1
Z možností využití Laplaceovy transformace uveďme heslovitě následující:
• obecně: pro analýzu a popis spojitých systémů — Laplaceova transformace umožňuje
převedení diferenciální rovnice na rovnici algebraickou, se kterou se snáze pracuje;
• pro odvození přenosové funkce H(p) lineárního systému z diferenciální rovnice nebo
jako Laplaceovy transformace jeho impulsové charakteristiky, H(p) = L {h(t)};
• pro odvození kmitočtové charakteristiky H(ω) lineárního systému z přenosové
funkce H(p) dosazením p = jω;
• díky konvoluční vlastnosti lze Laplaceovu transformaci použít pro výpočet odezvy
y(t) lineárního spojitého systému na vstupní signál x(t), y(t) = L −1 {H(p)X(p)},
kde H(p) = L {h(t)} a X(p) = L {x(t)}.
7.5
Diskretní signály.
Diskretní signál je uspořádaná posloupnost hodnot fi = f (i), která je funkcí celočíselného indexu i. Z teoretického hlediska je lhostejné, jak posloupnost vznikla; nejčastěji jde
o sérii hodnot nějakých postupných měření nebo vzorků signálu se spojitým časem; pak
114
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
index odpovídá nějakým způsobem konkrétním hodnotám času a lze užít názvu signál s
diskretním časem.
Poznámka o vzorkování: Velmi často jde v případě diskretního signálu o hodnoty nějaké
funkce f (t) spojitě proměnné v čase, kterou vzorkujeme v časových okamžicích ti , i =
0, 1, . . . , n . . . , přičemž nejčastěji je vzorkování rovnoměrné, tedy s vzorkovací periodou
T , takže fn = f (tn ) = f (nT ). V tom případě hovoříme o vzorkovacím kmitočtu fv nebo fs
resp. o odpovídajícím úhlovém vzorkovacím kmitočtu ωv , ωs . Je často užitečné vztahovat
skutečný úhlový kmitočet ω složek signálu ke vzorkovacímu kmitočtu; příslušný bezměrný
podíl v rozsahu h0, 2πi se pak označuje jako normovaný kmitočet.
Číslicový signál je diskretní signál, jehož hodnoty jsou vyjádřeny pomocí čísel z nějaké
konečné číselné množiny (např. z množiny čísel −32767 · · · + 32767 při šestnáctibitovém
binárním vyjádření). Poznamenejme, že diskretizace nejen co do času, ale také co do
hodnot je podstatnou vlastností číslicových signálů, která v některých situacích významně
ovlivňuje výsledky zpracování.
Poznámka o přesnosti vyjádření vzorků: Je zřejmé, že číslicový signál může vyjádřit vzorky
spojitého signálu obecně jen přibližně; odchylky mezi přesnými hodnotami vzorků a (nejbližšími) hodnotami, vyjádřitelnými čísly z dané množiny, tvoří posloupnost, nazývanou
kvantovací šum. V současné době lze díky rozvoji číslicové techniky zpravidla již použít
vyjádření čísel s tak vysokou přesností, aby kvantovací šum byl v dané aplikaci zanedbatelný; proto se problémy týkající se kvantovacího šumu nebudeme v tomto úvodním kursu
zabývat. Hodnoty diskretního signálu mohou ovšem být reprezentovány i jinak než čísly,
např. šířkou nebo výškou impulsů elektrického napětí nebo velikostí elektrického náboje.
V tom případě je (odhlédneme-li od kvantového charakteru elektřiny) množina hodnot
spojitá, přesnost vzorků je však omezena jinými vlivy (např. termickým šumem) a za
dnešního stavu techniky je zpravidla nižší než u číslicového vyjádření.
Diskretní zpracování signálů lze charakterizovat jako přepočet vstupní posloupnosti
hodnot na posloupnosti výstupní. Soustavy, které takový výpočet realizují, jsou dynamické
diskretní systémy; matematicky jsou popsány diferenčními rovnicemi, jejichž analýzou lze
obdržet informace o vlastnostech soustavy vzhledem ke zpracování signálů. Výpočet může
být realizován analogově (např. obvody se spínanými kapacitory) nebo (dnes převážně)
číslicově pomocí vhodně programovaného počítače.
Pokud zpracováváme diskretně spojitý signál x(t) se záměrem získat opět spojitý výstupní signál y(t), je prvým článkem zpracování vzorkovač, který v zadaných časových
okamžicích tn získává vzorky vstupu xn , tvořící vstupní posloupnost diskretního systému.
Na základě diskretní posloupnosti y(n), kterou poskytuje diskretní systém, je pak nutno
vytvořit spojitou funkci y(t) pomocí rekonstrukčního interpolátoru (viz obr. 5-1, v němž je
diskretní systém ohraničen čárkovaným rámečkem). Jak už bylo uvedeno, diskretní systém
může být realizován také číslicově; má-li akceptovat vstup tvořený vzorky analogového signálu, resp. poskytovat obdobný výstup, musí vlastnímu číslicovému systému předcházet
analogově-číslicový (-digitální) převodník a následovat převodník číslicově-analogový.
Vlastní číslicový systém je počítač, který, pokud jde o zpracování časových posloupností, musí pracovat v režimu tzv. reálného času a mít takovou výkonnost, aby v období
mezi dvěma vzorky zvládl celý algoritmus výpočtu jednoho výstupního vzorku. Může být
realizován pomocí univerzálního počítače, řízeného vhodným programem, nebo speciali-
Matematika 2
115
zovanými počítačovými strukturami (např. signálovými procesory), optimalizovanými pro
typy operací, které při zpracování signálů převažují.
Příklad 5.1. Diskretní harmonický signál může být vyjádřen jako obecná posloupnost
(n + kN )
n
+ ϕs ,
s(n) = As cos(ωN s n + ϕs ) = As cos 2π + ϕs = As cos 2π
N
N
kde: k je celé, N je počet vzorků v periodě, ωN s [rad] je relativní (či normovaná) úhlová
frekvence,která může být v případě časové posloupnosti vzorků signálu vzdálených o vzorkovací periodu T = 1/fvy vyjádřena jako ωN s = 2πfs T = 2πfs /fvz . Časová posloupnost
tvořící diskretní harmonický signál o kmitočtu fs [Hz] (resp. ωs [rad/s]) je
(fs ) + kfvz
fs
+ ϕs = As cos 2πn
+ ϕs .
s(nT ) = As cos(ωs nT + ϕs ) = As cos 2πn
fvz
fvz
Představme si, že je posloupnost s(nT ) získána diskretizací spojitého harmonického
signálu s(t) o kmitočtu fs při použití vzorkovací frekvence fvz = 1/T , když T je vzdálenost
mezi jednotlivými vzorky signálu. Z posledního výrazu na pravé straně je zřejmé je zřejmé,
že posloupnost s(nT ) bude stejná pro kmitočty původního spojitého signálu fs + kfvz
pro libovolné celé k. Co z toho vyplývá? Shodné posloupnosti mají samozřejmě shodná
spektra, spektrum diskretního signálu musí být tedy periodické s periodou fvz . (Podrobně
se teorií vzorkování budeme zabývat později.)
Ukázka části periodického spektra diskretního harmonického signálu je na obr. 1.2.
Všimněme si ještě spektra jedné ze dvou komplexně sdružených složek reálného diskretního harmonického signálu,
ej(2
f nT +ϕ)
= cos(2πf nT + ϕ) + j sin(2πf nT + ϕ) ,
jejíž reálná a imaginární část jsou zobrazeny ve dvou horních kresbách na obr. 1.3. V dolní
polovině obr. 1.3 je zobrazeno komplexní frekvenční spektrum, resp. jeho modulová a argumentová část. Obdobně bychom mohli zobrazit i spektrum složky komplexně sdružené.
Sloučením obou spekter dostaneme výsledek na obr. 1.2.
Dále se budeme krátce věnovat vzorkování (sampling) spojitého signálu. Vzorkování
slouží k vyjádření spojitého signálu f (t) jeho diskretními vzorky fn = f (tn ) pro určité
hodnoty tn nezávisle proměnné t. Zpravidla jsou tyto vzorky ekvidistantní, tj. tn = nT ,
kde T je vhodná reálná konstanta, označovaná jako perioda vzorkování, takže
fn = f (nT ) .
Ukážeme, že diskretní reprezentace, tvořená teoreticky nekonečnou posloupností {fn }
může za jistých předpokladů nést úplnou informaci o spojitém signálu a zjistíme, jaké
jsou tyto předpoklady, které následně umožní přesně rekonstruovat spojitý signál z jeho
vzorků. Nejprve zopakujeme definici následující užitečného signálu.
Diracova distribuce: Velmi užitečným signálem pro teoretické úvahy je Diracova distribuce
(označovaná také jako jednotkový impuls)
Z ∞
δ(t) → ∞ pro t = 0, δ(t) = 0 pro t 6= 0, přičemž
δ(t) dt = 1 .
−∞
116
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
jedná se zřejmě o signál se spojitou proměnnou, nikoli však v našem smyslu spojitý.
Můžeme jej však interpretovat jako limitní případ spojitého signálu d(t),
d(t) = h pro t ∈ h0, 1/hi ,
d(t) = 0 pro t ∈
/ h0, 1/hi ,
(který podmínku jednotkového integrálu splňuje), pro h → ∞. Interpretace Diracova
impulsu jako limitního případu uvedené funkce jej umožňuje chápat jako „kvazispojitýÿ
signál a přesně s ním pracovat v dalších vztazích, např. definovat jako limitu jeho Fourierovu transformaci, která v obvyklém smyslu bezprostředně definována není.
Vlastnosti Diracovy distribuce jsou:
1. Posunutí impulsu: δ(x − ξ) je nenulová právě pro x = ξ, kde ξ je libovolné reálné
číslo.
Z∞
2. Filtrační vlastnost:
f (t)δ(t − τ ) dt = f (τ ).
−∞
3. Spektrum jednotkového impulsu (vzhledem k filtrační vlastnosti) je
Z ∞
Λ(ω) =
δ(t − τ )e−jωt dt = e−jωτ ,
−∞
4. specielně pro ξ = 0 je Λ(ω) = 1.
Z∞
5. Energie impulsu: Eδ =
δ 2 (t) dt = lim h2 ·
h→∞
1
= lim = ∞.
h h→∞
−∞
Poznamenejme ještě, že Diracův impuls může jako nezávisle proměnnou mít jakoukoli
fyzikální veličinu, zejména také frekvenci.
Pomocí Diracovy distribuce můžeme vyjádřit ideálně vzorkovaný signál jako kvazispojitý. Zaveďme vzorkovací
∞
X
v(t) =
δ(t − iT )
(5.1)
i=−∞
2π
(obr. 5-1a).
T
Pak můžeme vyjádřit vzorkovaný signál jako součin spojitého (analogového) signálu a
signálu vzorkovacího
s periodou vzorkování T a tedy úhlovým vzorkovacím kmitočtem ωv =
fv (t) = f (t) · v(t) =
∞
X
f (iT )δ(t − iT ) .
(5.2)
i=−∞
V tomto signálu je zřejmě obsažena veškerá informace o jeho vzorcích při daném
vzorkování a je v tomto smyslu ekvivalentní diskretnímu signálu {fn } = {f (nT )}. Na
druhé straně jde o signál kvazispojitý — závislý na spojitém čase, který lze interpretovat
Matematika 2
117
jako limitní případ impulsního výškově modulovaného signálu s konstantní šířkou impulsů,
která v limitě směřuje k nule, přičemž váhy impulsů zůstávají nezměněny. Tak je třeba
chápat obr. 5-1b, v němž šipky naznačují, že hodnoty jdou nade všechny meze a výška
šipek udává váhu příslušných impulsů, která je zřejmě rovna hodnotě vzorku.
Cílem vzorkování je ovšem získat takovou diskretní reprezentaci původního spojitého
signálu, aby ze vzorků bylo možno tento signál úplně obnovit. Ukážeme, že to je za jistých
předpokladů možné. Odvození těchto podmínek vyžaduje prozkoumat s využitím znalostí
o spektrech spojitých signálů, k jakým změnám dochází ve spektrální reprezentaci signálu
jeho vzorkováním. Zdůrazněme, že v následujících odstavcích budeme hovořit o spektrech
ve smyslu integrální Fourierovy transformace, zatímco následující oddíl 5.3 o spektrální
reprezentaci diskretních signálů je založen na diskretní verzi Fourierovy transformace.
Spektrum vzorkovaného signálu v kvazispojité reprezentaci (ve smyslu spojité Fourierovy transformace F(·)) vyjádříme pomocí spektra původního analogového signálu.
Využijeme přitom poznatků z teorie spojitého signálu, zejména konvolučního teorému
Z ∞
1
1
F (ω) ∗ V (ω) =
F (ω − u)V (u) du ,
(5.3)
Fv (ω) = F{f (t) · v(t)} =
2π
2π −∞
kde F (ω) a V (ω) jsou spektra spojitého signálu, resp. vzorkovacího signálu, např.
Z ∞
f (t)e−jωt dt .
(5.4)
F (ω) = F{f (t)} =
−∞
Spektrum V (ω) není možno určit přímo z definičního vztahu Fourierovy transformace,
neboť v(t) není absolutně integrabilní funkce a musíme proto použít postupů, kterými
je v teorii signálu umožněno vyjadřovat spektrum periodických funkcí. Konstatujeme
především, že vzorkovací funkce v(t) je periodická (s periodou T ), vzniklá opakováním
jednotkového impulsu umístěného v počátku. Lze ji proto vyjádřit Fourierovou řadou
v(t) =
∞
X
ck e
jk 2π
t
T
k=−∞
=
∞
X
jkωv t
ck e
,
k=−∞
1 2π 1
kde ck = Λ k
=
T
T
T
(5.5)
podle poučky o vztahu mezi koeficienty Fourierovy řady a spektrální hustotou původního
jednotlivého implusu. Spektrum (ve smyslu zobecněné integrální transformace) funkce,
vyjádřené Fourierovou řadou je dále dáno součtem vážených impulsů
nX
o
X
jkωv t
F
ck e
= 2π
ck δ(ω − kωv ) ,
k
k
(což lze snadno dokázat zpětnou transformací s využitím filtrační vlastnosti impulsu),
takže
∞
nX 1
o 2π X
jkωv t
V (ω) = F{v(t)} = F
e
=
δ(ω − kωv ) .
(5.6)
T
T
k
k=−∞
Je tedy spektrum vzorkovacího signálu tvořeno nekonečnou posloupností reálných impulsů
o váze 2π/T (Obr. 5-2).
118
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
Dosadíme-li (5.6) do vztahu (5.3), dostaneme po záměně pořadí integrace a součtu
Z
Z
X
1 ∞
1X ∞
Fv (ω) =
F (ω − u)
F (ω − u)δ(u − kωv ) du
δ(u − kωv ) du =
T −∞
T
−∞
k
k
a s využitím filtrační vlastnosti
∞
1 X
Fv (ω) =
F (ω − kωv ) .
T k=−∞
(5.7)
Obdrželi jsme čistý výsledek, že spektrum ideálně a ekvidistantně vzorkovaného signálu je tvořeno součtem nekonečného počtu replik spektra původního analogového signálu,
které jsou vzájemně posunuty o celistvé násobky úhlového vzorkovacího kmitočtu (Obr.
5-4). nemá-li dojít ke ztrátě informace, musí zřejmě každá jednotlivá replika nést úplnou
informaci o původním signálu, což je ovšem možné jen potud, nedojde-li k překrývání a
tím k narušení dílčích spekter. Odtud vyplývají podmínky rekonstruovatelnosti spojitého
signálu ze vzorků:
• analogový signál musí mít omezené spektrum, tj.
F (ω) = 0 vně intervalu h−ωmax , ωmax i ,
(5.8)
• vzorkovací kmitočet musí splňovat vztah
ωv > 2ωmax .
(5.9)
Prvá podmínka závisí na charakteru zpracovávaného signálu. Pokud signál vzniká v
setrvačné fyzikální soustavě jako některá z fyzikálních veličin (např. elektrické napětí),
nebo se takovou soustavou šíří, lze tedy očekávat, že složky vysokých kmitočtů jsou, počínaje od určité meze natolik malé, že prvou podmínku znatelně nenarušují. Není-li možno
takový předpoklad učinit, nebo je sice signál kmitočtově omezen, ale jeho mezní kmitočet
ωmax je natolik vysoký, že technické předpoklady neumožňují splnit druhou podmínku, je
nutno spektrum analogového signálu před vzorkováním omezit dolnofrekvenční propustí
(tzv. antialiasingovým filtrem). To se ovšem týká i případu, kdy se volí nižší vzorkovací
kmitočet vzhledem k tomu, že z hlediska zpracování signálu jsou jeho složky s vyššími
frekvencemi nezajímavé.
Druhá podmínka, tzv. vzorkovací theorém (nazývaná také podle autorů Nyquistův,
Kotělnikovův nebo Shannonův) určuje, jak vysokého vzorkovacího kmitočtu je pro daný
typ signálu třeba použít. V praxi je, s ohledem na nedokonalé možnosti rekonstrukce
signálu ze vzorků, zpravidla třeba splnit podmínku (5.8) se značnou rezervou.
Kapitola 8
Systémy
8.1
Zavedení pojmu a klasifikace
Slovo systém je jedním z nejčastěji používaných pojmů ve všech odvětvích vědy. Používá
se pro označení jevů abstraktních i konkrétních. Teorie systémů, která zaznamenala nebývalý rozvoj zejména v posledních padesáti léech, zkoumá objekty a jevy ve vzájemných
souvislostech ať vnitřních či vnějších. Pro tento kurz jsou zejména podstatné dynamické
vlastnosti systémů, čili jejich chování vzhledem k času. Podle toho se mění i vlastnosti
signálu, který Z uvedeného je zřejmé, že nelze od sebe odlišit systém a signál. Je jen možno
se zaměřit více na sledování vlastností toho či onoho. Různé typy systémů, o kterých zde
budeme mluvit, se vyskytují jak ve sdělovací technice, tak v automatizaci i v pohonářské
technice či enegŕgetice. Rozdíly jsou jistě v pásmu a rozsahu používaných frekvencí a v
tom, zda jde spíše o signály periodické či jednorázové, spojité či diskréní. Pochopit vzájemné souvislosti v celé jejich šíři je hlavním cílem této publikace a současně základním
znakem tzv. systémového přístupu či řešení.
Pojem systém je skutečně používán v nejrůznějších souvislostech a proto existuje také
celá řada různých definic. Uveďme některé z nich.
1.
2.
3.
4.
Systém je daná množina veličin uvažovaných na určité (dané) rozlišovací úrovni.
Systém je soubor variací daných veličin uvažovaných v čase.
Systém je daná množina stavů, spojených množinou přechodů mezi nimi.
Systém tvoří množina prvků a množina vazeb mezi prvky navzájem i s
okolím.
5. Systém je určitý časově neměnný vztah nmezi okamžitými a/nebo budoucími hodnotami daných veličin.
Zejména dvě posledně uvedené definice jsou s ohledem na náš zájem o dynamické
systémy důležité. Pro jasnější orientaci v celém spektru použití pojmu systém, bude účelné
se zmínit o hlavních skupinách, do kterých se systémy dělí. Omezíme-li se převážně na
technické systémy, jsou to zejména tato oddělení:
• Podle typu veličin, definovaných na systému
119
120
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
– fyzikální systémy, jejichž veličiny jsou měřitelné, nebo alespoň reálně existují
– abstraktní systémy.
• Podle počtu veličin systému
– ohraničené, na kterých je definován konečný počet veličin
– neohraničené s nekonečným počtem veličin.
• Vzhledem na vazby s okolím
– uzavřené, které nemají žádné spojení s okolím
– otevřené, které jsou s okolím nějakým způsobem spojeny.
• Podle typu definovaných veličin v čase
– spojité systémy, u kterých veličiny existují v každém okamžiku a mohou nabývat všech hodnot
– diskrétní (nespojité), přičemž nespojitost může být buď časová nebo amplitudová
– hybridní systémy, ve kterých se vyskytují veličiny obou typů.
• Podle typu signálů, působících na systém
– deterministické, kdy signály i hodnoty všech parametrů systému jsou jednoznačně určeny
— stochastické, u kterých buď parametry nebo signály jsou určeny jen s určitou
pravděpodobností.
• Podle přítomnosti setrvačnosti dělíme systémy na:
– proporcionální, u kterých výstupní veličiny reagují na současné vstupní signály
– dynamické, u nichž ve výstupním signálu je vazba na minulé vstupy či stavy
systému.
• Podle reakce na současné, minulé i budoucí signály
– systémy anticipativní, které reagují i na budoucí signály (zřejmě neralizovatelné systémy)
– neanticipativní, t.j. takové, které vyjadřují reakce na současné a minulé budící signály.
• Podle časové závislosti vlastností systému rozlilšujeme
– časově neměnné systémy (t-invariantní)
– systémy, jejichž struktura nebo parametry se s časem mění
Matematika 2
121
• Podle funkčních závislostí mezi veličinami dělíme systémy na
– lineární, mezi všemi veličinami systému platí lineární vztahy
– nelineární, kde rovnice, popisující vzájemné vztahy jednotlivých veličin jsou
nelineární.
Podrobněji se seznámíme s pojmem obecného časového systému v pojetí monografie
Mesaroviče–Takahary [ ]. Uvedeme nejprve zákaldní pojmy jako jsou globální stavy a
globální reakce systému.
Obecným systémem se nazývá relace na neprázdných abstraktních množinách, přesněji
— podmnožina S jejich kartézského součinu × Vk , tj. S ⊂ × Vk , kde K je neprázdná
k∈K
k∈K
množina indexů a Vk je neprázdná (abstraktní) množina pro každý index k ∈ K, která se
nazývá objektem systému. Je-li množina indexů K konečná, pak výše uvedenou inkluzi
lze zapsat ve tvaru
S ⊂ V1 × V2 × · · · × Vn .
Nechť dvouprvková soustava množin {Kx , Ky } je rozkladem inexové množiny K, což
znamená, že ∅ =
6 Kx ⊂ K, ∅ =
6 Ky ⊂ K, Kx ∩Ky = ∅ a Kx ∪Ky = K. Množina X = × Vk
k∈K
se pak nazývá vstupním objektem a množina Y = × Vk se nazývá výstupním objektem
k∈K
systému (X, Y, S), kde S ⊂ X × Y (tedy S je binární relace ze vstupního objektu do
výstupního objektu — nazývaná relací přechodu případně přenosu, tedy také tranzitní
relací). Systém (X, Y, S) se také nazývá systémem typu „vstup – výstupÿ. Poznamenejme,
že v případě, že S : X → Y je funkce tedy relace S ⊂ X × Y , která kromě vlastnosti
domS = X má také vlastnost [x, y1 ] ∈ S, [x, y2 ] ∈ S (x ∈ X, y1 , y2 ∈ Y ) implikuje
y1 = y2 , systém (X, Y, S) se nazývá funkcionální.
Následující definicí zavedeme pojem globální reakce systému.
Definice. Nechť (X, Y, S) je obecný systém „vstup – výstupÿ, C je libovolná neprázdná
množina a R : C × X → Y je funkce, pro kterou platí:
[x, y] ∈ S právě tehdy, když existuje prvek c ∈ C s vlastností R(c, x) = y.
Potom množina C se nazývá množinou nebo objektem globálních stavů daného systému
(prvky množiny C se nazývají globálními stavy systému) a funkce R se nazývá globální
reakcí systému (X < Y, S).
Příklad. Rychlost rozpadu radia v každém časovém okamžiku je úměrná jeho množství.
Odvoďme zákon rozpadu radia, jestliže jeho počáteční množství je M0 > 0 a jestliže je
známo, že po 1600 letech by zbyla jenom polovina tohoto množství.
popíšeme stručně řešení zformulovaného problému:
Nechť M (t) je množství radia v okamžiku t > 0; rychlost rozpadu tohoto prvku je
dM (t)
. Podle podmínky vyslovené v úloze platí
rovna derivaci
dt
dM (t)
= kM (t)
dt
122
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
kde k je součinitel úměrnosti a z charakteru úlohy vy-lývá (t) > 0. Výše uvedená difedM (t)
renciální rovnice je rovnicí se separovatelnými proměnnými, takže
= k dt, odkud
M (t)
ln M (t) = kt+ln c, c > 0, takže jednoparametrický systém funkcí M (t) = c ekt je obecným
řešením uvedené diferenciální rovnice. Z počátečních podmínek vyplývá
M0 = M (0) = c e0 = c
t
1
a dále M (1600) = M0 = M0 e1600k = 2− 1600 , takže
2
t
M (t) = M0 2− 1600 .
t
t Označíme-li nyní X = h0, ∞) ⊂ R, Y = M0 2− 1600 ; t ∈ X pak S = t, M0 2− 1600 ⊂
X × Y je přechodová relace vstup–výstup. Za množinu C globálních stavů lze považovat
soubor různých počátečních množství M0 uvažovaného radia. Globální reakce systému
(X, Y, S) (s výše uvedenými specifikacemi) je tvaru
t
R(M0 , t) = M0 2− 1600 .
Ukážeme, že ke každému obecnému systému (X, Y, S) přísluší globální relace R : C ×X →
Y , tedy, že ke každému obecnému systému (X, Y, S) existuje objekt C globálních stavů a
funkce R s výše uvedenou vlastností: oOznačme F množinu všech zobrazení množiny X
do množiny Y , tj.
F = Y X = {f ; f : X → Y } .
Označme G podmnožinu množiny F tvořenou těmi funkcemi f ∈ F jejichž grafy jsou
částí relace S, tedy f ⊆ S, což znamená, že pro každou dvojici prvků [x, y] ∈ X × Y
s vlastností y = f (x), platí [x, y] ∈ S. Nechť C je indexová množina funkcí tvořících
množinu G; G = {fc ; c ∈ C}. (Formálně lze za množinu C vzít ku příkladu množinu
G × {0}.) Definujme nyní funkci R : C × X → Y předpisem
R(c, x) = fc (x) ,
[c, x] ∈ C × X .
Nyní ukážeme, že platí
S = [x, y]; ∃c ∈ C : y = R(c, x) ,
neboť bude-li transitní relace S systému (X, Y, S) tvořena přesně dvojicemi [x, y] ∈ X ×Y
s právě uvedenou vlastností, bude funkce R globální reakcí systému (X, Y, S). Nechť tedy
S 0 = [x, y]; ∃c ∈ C : y = R(c, x)
a nechť [x, y] ∈ S 0 je libovolná dvojice prvků v relaci S 0 . Pak y = R(c, x) = fc (x) púro
vhodný prvek c ∈ C, odkud vyplývá, že [x, y] ∈ S, neboť fc ⊆ S. Tím jsme obdrželi
inkluzi S 0 ⊆ S. K ověření platnosti opačné inkluze uvažujme libovolnou dvojici [x, y] ∈ S
Jelikož dom S = X a x ∈ X je S 6= ∅. Vyberme některou funkci fc ∈ G a označme
fˆ = fc r {[x, fc (x)]} ∪ [x, y] .
Matematika 2
123
Platí fˆ ∈ F a fˆ ⊆ S. Proto existuje prvek c0 ∈ C s vlastností fˆ = fc , tedy [x, y] ∈ S 0 ,
takže S ⊆ S 0 . Tato inkluze s výše dokázanou opačnou inkluzí nám dává rovnost S = S 0 .
Právě provedenou úvahou jsme dokázali tuto větu:
Věta. Každý obecný systém S = (X, Y, S) má globální reakci R : C × X → Y .
Poznamenejme, že ve výše dokázané větě se na objekt globálních stavů C ani na globální
reakci R nekladou žádné doplňující podmínky. Kdybychom požadovali, aby funkce R
měla nějaké další speciální vlastnosti, může se stát, že funkci R nelze definovat na celém
kartézském součinu C × R, ale pouze na jisté podmnožině tohoto součinu — funkce R
se tedy stává funkcí parciální z C × X. Do podobné situace se dostáváme, když vstupní
objekt X, výstupní objekt Y a objekt C globálních stavů nějakou strukturou, např.
metrického nebo obecněji topologického prostoru, a po reakci R požadujeme určitý druh
kompatibility (slučitelnosti) s danými strukturami (např. spojitost, uzavřenost, spojitost
a další požadavky). Existence globální reakce je ekvivalentní s tzv. parametrizací systému
nebo tranzitní relace „vstup — výstupÿ, což si ve skutečnosti přiblížíme:
Nechť (X, Y, S) je obecný systém „vstup — výstupÿ, C je objekt globálních stavů
systému a R : C × X → Y globální reakce systému. Jestliže ke každému stavu c ∈ C
definujeme funkci fc : X → Y předpisem fc (x) = R(c, x), pak množina {fc ; c ∈ C} je
souborem funkcí s touto vlastností: Uspořádaná dvojjice [x, y] ∈ X × Y patří do relace S
(tj. [x, y] ∈ S) právě tehdy, když existuje stav
[ c ∈ C s vlastností y = fc (x). Tuto vlastnost
fc , kde symboly fc funkcí na pravé straně
lze vyjádřit ekvivalentní podmínkou S =
c∈C
rovnosti chápeme současně jako označení jejich grafů, tj. fc = [x, y]; y = fc (x) — z
důvodu zjednodušení příslušného zápisu. Vyjádření tranzitní relace S ⊂ X × Y ve tvaru
sjednocení grafů funkcí se nazývá funkcionální parametrizace relace S (nebo funkcionální
parametrizace systému (X < Y, S) a v případě obecné relace mezi abstraktními množinami existence funkcionální parametrizace pro každou trojici (X < Y < S), S ⊆ X × Y
(s neprázdnými uvažovanými objekty) vyjadřuje relační formu axiomu výběru.
I když v různých odvětvích se používá pojem systém v mnoha významech, dynamické
systémy, které nás v tomto kurzu budou především zajímat, jsou definovány dvěma oběcně
známými definicemi
1. definice dynamického systému (podle V. V .Němyckého):
Dynamický systém je grupa transformací R na separabilním metrickém prostoru R s
těmito vlastnostmi:
a) Rt je definováno pro libovolné t, −∞ < t < ∞
b) nechť obraz bodu p v prostoru R při transformaci Rt je dán rovnicí
Q = F (p, t) ,
pak F má vlastnost smíšené asociativity
F (p, t0 + t) = F F (p, t0 ), t
124
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
c) grupa Rt je spojitá tak, že pro všechna t0 a p0 a pro všechny posloupnosti {tn } a
{pn }, které konvergují k t0 a p0 , platí
lim F (pn , tn ) = F (p0 , t0 ) .
n→∞
Bod p ∈ R nazveme zastupujícím (representujícím) bodem stavu dynamického systému.
Pak Q = F (p, t) představuje stav systému v čase t, byl-li tento systém v čase t = t0 ve
stavu p.
Tato definice nezavádí žádný pojem vstupu a výstupu systému. Proto lze takto definovaný systém označit jako neorientovaný.
2. definice dynamického systému (R. E. Kalman)
Dynamický systém je matematická struktura, definovaná těmito axiomy:
1. Je dán topologický prostor S a množina T hodnot času, na nichž je definováno
chování systému; S je stavový prostor systému, T je uspořádaný topologický prostor,
který je podmnožinou reálných čísel.
2. Je dán topologický prostor Q funkcí času, definovaných na T , které jsou přípustnými
vstupy systému; říkáme, že Q je přípustný vstupní prostor systému.
3. Pro jakýkoliv počáteční čas t0 , t0 ∈ T , libovolný počáteční čas X0 , X0 ∈ S a
libovolný vstup U , U ∈ Q definovaný pro t ≥ t0 , jsou v čase t ≥ t0 stavy systému
určeny funkcí f definovanou na kartézském součinu Q × T × T × S s hodnotami v
S, tj.
f: Q×T ×T ×S →S
vyjádřené ve tvaru fu (t, t0 , X0 ) = Xt , t ≥ t0 . Funkci f nazýváme přechodovou
funkcí systému.
4. Pro lilbovolné prvky t0 , t1 , t2 množiny T , pro které platí t0 ≤ T1 ≤ t2 , libovolné X0 ,
kde X0 ∈ S a libovloný daný vstup U , U ∈ Q definované na průniku (t0 , t1 ) ∩ T ,
platí vztahy:
fu (t0 , t0 , X0 ) = X0 ,
fu (t2 , t0 , X0 ) = fu (t0 , t1 , fu (t1 , t0 , X0 )) .
5. Každý vstup systému je reálnou funkcí g definovanou na kartézském součinu T × S.
6. Funkce f a g jsou spojité na oborech, na nichž jsou definovány.
Tato druhá definice zavádí pojmy vstup a výstup, takže takto definovaný systém lze
označit jako orientovaný.
Obě definice zde uvádíme spíše pro ilustraci toho, jak obecně a s jakou úrovní abstrakce musí být pojem dynamický systém definován, aby mohl zahrnout co nejširší
oblast výskytu těchto systémů. Dodejme dále, že podle toho, zda množina časů T je množinou spojitých časů, či zda jde o množinu diskretních časových okamžiků, jde o systémy
spojité nebo diskretní. Více o tom bude řečeno v kapitole o diskretních či diskretizovaných
systémech.
Matematika 2
125
Ke klasifikaci systémů ještě uveďme, že podle části objektivní reality, kterou zkoumáme, můžeme rozlišovat nejrůznější typy systémů, např. ekonomické, ekologické, politické, biologické, fyzikální, atd. Cílem tohoto textu není „všeobjímajícíÿ obecná (abstraktní) teorie systémů, ale pouze vybrané kapitoly, které čtenáři umožní orientaci v
problematice analýzy (v menší míře i syntézy) některých technických (elektrických, fyzikálních) systémů. Uvedeme některá hlediska, podle kterých můžeme systémy třídit a
současně vybereme typy systémů, kterým se budeme podrobněji věnovat.
• Podle interakce systému s okolím rozlišujeme
a) uzavřené systémy, u kterých nedochází k interakci s okolím;
b) otevřenéy, u kterých k interakci s okolím dochází.
Nás budou dále zajímat otevřené systémy jednorozměrné, tj. s jednou vstupní a jednou
výstupní veličinou. Přitom se omezíme na případy vstupních a výstupních signálů, jejichž
nezávisle proměnnou je čas.
• Členění podle typu signálů v čase
a) Systémy se spojitým časem (nazývané také jako systémy se souvislým časem
nebo zjednodušeně spojité systémy) — jejich veličiny jsou signály se spojitým časem.
Veličinami analogových systémů jsou analogové signály.
b) Systémy s diskretním časem (zjednodušeně diskretní systémy) — jejich veličiny
jsou signály s diskretním časem. Zvláštním případem jsou číslicové systémy, jejichž
veličinami jsou číslicové signály.
c) Hybridní systémy — jejich některé veličiny jsou spojité, jiné diskretní.
V dalším textu nás budou zajímat spojité (analogové) systémy.
• Podle setvŕvačnosti (přítomnosti paměti) rozlišujeme:
a) systémy nesetrvačné (statické) jsou systémy bez paměti, tj. bez setrvačných
prvků — chovají se jako funkční měniče, jejich výstup v určitém okamžiku závisí
pouze na hodnotě vstupu v daném okamžiku;
b) systémy setrvačné (dynamické) jsou systémy s pamětí, obsahují setrvačné (paměťové) prvky. U takových systémů musíme počítat s přechodovými ději. Matematické
modely setrvačných systémů jsou diferenciální rovnice (pro spojité systémy) nebo
diferenciální rovnice (pro diskretní systémy).
• Podle časové stálosti vlastnosti systému rozlišujeme:
a) časově proměnné systémy (též nestacionární či variantní), jejichž vlastnosti nebo
struktura se s časem mění;
b) časově neměnné systémy (též stacionární či invariantní) se stálou strukturou a
vlastnostmi.
Matematickými modely setrvačných časově invariantních systémů jsou diferenciální
(nebo diferenční) rovnice, jejichž konstanty jsou časově neměnné.
• Členění systémů z hlediska kauzality:
126
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
a) kauzální systémy (neanticipativní, bez předvídání) reagují jen na přítomné a minulé podněty (hodnoty vstupu). Reálné fyzikální systémy samozřejmě zachovávají
princip kauzality, příčina nemůže přijít dříve než podnět;
b) nekauzální systémy (anticipativní, s předvídáním) reagují i na budoucí podněty.
Členění systémů z hlediska platnosti superpozice je toto:
a) Lineární systémy, pro které platí princip superpozice vyjádřený rovností
X
X
H
Ki si (t) =
Ki H si (t) ,
i
i
kde H je operátor realizovaný systémem a {si (t)} je množina signálů násobených
konstantami K − i. Uvedený vztah lze slovně stručně formulovat tak, že odezva
lineárního systému na součet příčin je rovna součtu odezev na jednotlivě samostatně
působící příčiny. Vzhledem k platnosti principu superpozice lze lineární systémy
poměrně snadno modelovat a analyzovat.
b) Nelineární systémy, což jsou všechny systémy, pro které princip superpozice neplatí.
Dodejme, že každý typ konkrétního nelineárního systému vyžaduje specifický přístup.
8.2
Matematický model systému se spojitým časem
8.3
Řešení vstupně-výstupní rovnice Laplaceovou
transformací
Vraťme se k článku RC na obr. 3.1 v Příkladu 3.2, který je popsán diferenciální rovnicí
(3.7),
duC (t)
+ uC (t) = u(t) .
RC =
dt
Po Laplaceově transformaci obdržíme
U
RC pUC (p) − uC (0) + UC (p) = ,
p
kde: uC (0) je počáteční stav (napětí na kapacitoru v čase t = 0), U je napětí stejnosměrného zdroje připojeného k článku v čase t = 0 — vstup je tedy v podobě jednotkového
skoku (s vahou U ), jehož Laplaceův obraz je U/p. Obraz výstupu, který je zřejmě
UC (p) =
může být interpretován jako:
1
RC
p+
1
RC
U
uC (0)
+
1 ,
p
p + RC
Matematika 2
127
obraz úplné odezvy = obraz vynucené odezvy + obraz přirozené odezvy.
Přenosová funkce systému je
1
RC
H(p) =
p+
1
RC
.
(3.14)
V kapitole o Laplaceově transformaci jsme odvozovali obraz komplexního harmonického
signálu. Uveďme, již bez odvození, obraz obecného exponencielního výrazu
L {Keat } =
K
.
p−a
(3.15)
Odvození vynucené odezvy. Abychom se vyhnuli výpočtům zpětných Laplaceových
transformací, využijeme znalosti obrazu exponenciální funkce (3.15). proto rozdělíme obraz vynucené odezvy na parciální zlomky
k2
k1
k1
+
=
p − p1 p = p2
p− −
1
RC
+
k2
.
p−0
Nyní vypočítejme konstanty k1 a k2 . Výpočet provedeme pro každý pól zvlášť tak, že
obraz vynucené odezvy vynásobíme příslušným kořenovým činidlem.
a) Pro p = p+ = −1/RC:
1
RC
p+
1
RC
U
1 k1
k2
p− −
=
(p − p1 ) +
(p − p1 )
= k1 ,
p
RC
p − p1
p − p2
p=p1
odtud
k1 =
1 U
1 = −U .
RC − RC
b) Pro p = p2 = 0:
1
RC
p+
1
RC
U
k1
k2
(p − 0) =
(p − p2 ) +
(p − p2 )p=p2 = k2
p
p − p1
p − p2
odtud
k2 =
1
RC
0+
1
RC
U =U.
Vynucená odezva je
(
uCvynuc (t) = L −1
−U
U
1 +
p
p + RC
)
1
1 = −U e− Rc t + U e0t = U 1 − e− RC t .
Jedná se o odezvu vynucenou skokovou změnou vstupního napětí z hodnoty 0 na U v čase
t = 0. Je-li u = 1, pak mluvíme o přechodné charakteristice systému.
Odvození přirozené odezvy je velmi snadné, protože je její obraz jednodušší,
(
)
1
u
(0)
C
uCpř (t) = L −1
= uC (0)e− RC t .
1
p + RC
128
8.4
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
Impulsní a frekvenční charakteristika
Impulsní charakteristika je odezva systému na vstupní signál tvaru Diracova impulsu
při nulových počátečních podmínkách. Budeme ji označovat g(t). Diracův impuls δ(t) je
nerealizovatelná . . . , definovaná následujícími vztahy:
Z ∞
δ(t) dt = 1 .
δ(t) = 0; pro t 6= 0;
−∞
Je to impuls o šířce h, výšce 1/h a h → 0 (Obr. 2.4). Laplaceův obraz tohoto impulsu
je roven 1. Přesná realizace takového impulsu je nemožná; můžeme však realizovat velmi
krátké impulsy, jejichž délka je vůči časovým konstantám systému zanedbatelná. Pak lze
takový impuls považovat za dostatečně přesnou aproximaci Diracova impulsu.
Počáteční a konečné hodnoty impulsní charakteristiky jsou v úzkém vztahu k některým
koeficientům a řádu diferenciální rovnice systému. Pro výpočet těchto hodnot použijeme
věty o konečné a počáteční hodnotě funkce při znalosti jejího obrazu. Nechť diferenciální
rovnice systému je ve tvaru (2-1), pak pro počáteční hodnotu impulsní charakteristiky
platí
∞ pro n = m
g(0+ ) = lim pF (p) =
p→∞
bn−1
pro m = n − 1
an
0 pro m < n − 1
Podobně pro konečnou hodnotu g(t) platí
0 při a0 6= 0
g(∞) lim pF (p) =
p→0
b0
při a0 = 0; a1 6= 0
a1
∞ při a0 = a1 = 0
Impulsní charakteristiku systému lze použít i k výpočtu odezvy systému na libovolný
vstupní signál. Pro obraz výstupní veličiny Y (p) platí
Y (p) = F (p) · U (p) ,
a protože
L−1 {F (p)} = g(t)
je výstupní veličina dána konvolutorním integrálem
Z t
y(t) =
g(t − τ ) u(τ ) dτ .
0
Pro systémy s dopravním zpožděním Td platí
g(t) = 0 pro 0 ≤ t ≤ Td .
Matematika 2
129
Příklad 2-6. Impulsní charakteristika systému je nakreslena na obr. 2-5. je to funkce
daná vztahem
t
g(t) = 3e− T .
Její obraz je
3T
,
Tp + +
což je současně přenos systému F (p) = G(p).
G(p) =
Frekvenční charakteristika je grafické vyjádření frekvenčního přenosu systému. Někdy
bývá též definována jako geometrické místo koncových bodů vektoru přenosu pro frekvence
−∞ < ω < ∞. Ve většině praktických příkladů vystačíme pouze s větví charakteristiky
pro kladné frekvence 0 < ω < ∞. vektor frekvenčního přenosu můžeme vyjádřit dvěma
způsoby:
a) F (jω) = Re[F (jω)] + jIm[F (ω)]; v tomto případě je obvyklé kreslit frekvenční
charakteristiku v komplexní rovině s osami, které vynášíme reálnou a imaginární část
přenosu. Frekvenční vlastnosti (tj. i dynamické vlastnosti) systému vyjadřuje křivka v
komplexní rovině, jejímž parametrem je kruhová frekvence ω.
b) F (jω) = |F (jω)|ejϕ(ω) ; vlastnosti systému nyní určují dvě funkce a jim odpovídají
též dvě křivky. První z nich je závislost absolutní hodnoty přenosu na frekvenci a druhá
vyjadřuje průběh fáze. pro práci a amplitudovými charakteristikami je vhodné zvolit logaritmické měřítko. Amplitudu pak vyjadřujeme v decibelech
|F (jω)|dB = 20 log |F (jω)|
Tento způsob je zvláště výhodný v těch případech, kdy přenos systému je dán součinem
jednodušších přenosových funkcí
F (jω) = F1 (jω) · F2 (jω) . . . Fn (jω) .
Pak platí
|F (jω)|ejω = |F1 (jω)| · |F2 (jω)| . . . |Fn (jω)|ej(ϕ1 +ϕ2 +···+ϕn ,
odkud
|F (jω)|dB = 20 log |F (jω)| = |F1 (jω)|dB + |F2 (jω)|dB + · · · + |Fn (jω)|dB
ϕ(ω) = ϕ1 (ω) + ϕ2 (ω) + · · · + ϕn (ω) .
Frekvenční charakteristiku lze nakreslit buď ze známého frekvenčního přenosu, nebo
pomocí hodnot, změřených na skutečném systému (viz obr. 2-3). Tento způsob, který se
u systémů s malými časovými konstantami ještě stále používá (zejména ve sdělovací a
telekomunikační technice), není pro systémy z oblasti technické kybernetiky příliš vhodný
a nahradily jej méně pracné postupy.
Uveďme konkrétní příklady.
Vraťme se k obrazu výstupu obecného systému (3.12), ve kterém jako vstupní signál
použijeme jednotkový impuls, jehož Laplaceova transformace je L{δ(t)} = 1. Obraz (vynucené) odezvy na jednotkový impuls bude zřejmě totožný s přenosovou funkcí. Z toho
vyplývá velmi důležitý závěr:
130
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
• přenosová funkce je Laplaceovou transformací impulsní charakteristiky.
Příklad 3.6. Navažme na Příklad 3.5 a vypočítejme vynucenou odezvu na jednotkový
impuls, tj. impulsní charakteristiku h(t) našeho jednoduchého „integračníhoÿ článku RC.
Z přenosové funkce (3.14) vyplývá, že
(
)
1
1 − 1 t
RC
e RC .
=
h(t) = L −1
1
RC
p + RC
Připomeňme souvislost mezi Laplaceovou transformaci (2.20) z kap. 1.3,
Z ∞
Z ∞
p=jω
−pt
H(p) = L {h(t)} =
h(t)e dt −−−−→ H(jω)F{h(t)} =
h(t)e−jωt dt .
−∞
0
Omezíme-li se pouze na reálné systémy, tj. kauzální systémy, jejichž impulsní charakteristika h(t) = 0 pro t < 0, a na systémy stabilní, jejichž póly pi musí splňovat podmínku
Re{pi } < 0 (ke stabilitě se dostaneme později), bude Fourierův integrál vždy konvertovat.
Pak můžeme vyslovit velmi důležité závěry:
• frekvenční charakteristiku získáme z přenosové funkce, dosadíme-li za
komplexní proměnnou v přenosové funkci výraz jω, kde ω je úhlová frekvence;
• frekvenční charakteristiku získáme Fourierovou transformací impulsní
charakteristiky
Příklad 3.7. Opět navažme na Příklad 3.5 a vypočítejme vynucenou odezvu yvynuc (t) =
UC vynuc (t) na vstupní komplexní harmonický signál s(t) = u(t) o kmitočtu ω, který začíná od t = 0. Vstupní signál můžeme interpretovat jako součin jednotkového impulsu s
ahrmonickým signálem. Zopakujme, že obraz takového vstupního signálu je podle 2.22a
X(p) = L {ejω0 t } =
1
,
p − jω0
obraz vynucené odezvy je
Yvynuc (p) = H(p)X(p) =
1
RC
p+
1
RC
1
k1
k2
=
1 +
p − jω0
p − jω0
p + RC
a odtud
k1 = Yvynuc (p) p −
1 −
RC k2 = Yvynuc (p)(p − jω0 )p=jω0 =
=
1
p=− RC
1
RC
1
− RC
− jω0
1
RC
1
RC
+ jω0
.
,
Matematika 2
131
Výsledna vynucená odezva je
1
yvynuc (t) = k1 e− RC t + k2 ejω0 t ,
kde první člen na pravé straně je přechodnou složkou, která odezní (pro t → ∞), druhý
člen představuje ustálený stav,
yvynuc (t)t=∞ =
8.5
1
RC
1
RC
+ jω0
.ejω0 t = H(p)p=jω0 ejω0 t .
Vazby mezi systémy — sériové, paralelní spojení
systémů, zpětná vazba
V technické praxi se setkáváme většinou se složitějšími systémy vyšších tříd. Jak při analýze tak při syntéze systémů se snažíme z jednodušších podsystémů, nejčastěji z typových
členů, které jsme poznali v minulé kapitole. Spojení mezi systémy je většinou trojího
typu: sériové (kaskádní), paralelní a antiparalelní — (zpětnovazební). Popis takto složeného systému, ať už vnější nebo vnotřní, vypočteme z dílčích popisů podle určitých
pravidel, platných pro jednotlivé typy spojení. Tato pravidla nazýváme algebrou blokových schémat. Pro použití algebry blokových schémat musí být spněny dvě podmínky:
— všechny členy systému jsou lineární. Pak platí komutativní zákon a pořadí jednotlivých členů v kaskádním spojení můžeme libovolně měnit
— předpokládáme, že signál se v jednotlivých členech šíří pouze jedním směrem, což
znamená, že připojení libovolného počtu členů na výstup uvažovaného článku nemění jeho
dynamické vlastnosti. V elektrických systémech to znamená, že vstupní impedance členu
následujícího ve směru šíření signálu musí být mnohem vyšší (nejméně o dva až tři řády)
než výstupní impedance předcházejícího článku (není-li tato podmínka splněna, je třeba
to vyjádřit zavedením příslušné zpětné vazby).
8.5.1
Sériové spojení
Předpokládejme, že dva systémy s přenosovými funkcemi f1 (p) a F2 (p) jsou zapojeny
v sékrii (kaskádně), jak ukazuje Obr. 4-1. Hledáme celkový přenos tohoto nového systému.
Podle Obr. 4-1 platí
F1 (p) =
X(p)
,
U (p)
F2 (p) =
Y (p)
,
X(p)
F (p) =
Y (p)
.
U (p)
Rozšířením přenosu F (p) a úpravou dostaneme následující rovnici
F (p) =
Y (p) X(p)
X(p) Y (p)
·
=
·
= F1 (p) · F2 (p)
U (p) X(p)
U (p) X(p)
(4 − 1)
Tento postup lze uplatnit na libovolný počet členů kaskádního spojení. Platí tedy
následující pravidlo:
132
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
celkový přenos systému, který je tvořen sériovým spojením k podsystémů
s dílčími přenosy Fi (p), je roven součinu těchto dílčích přenosů
F (p) =
k
Y
Fi (p) .
i=1
Jsou-li dynamické vlastnosti podsystémů s jedním vstupem a jedním výstupem popsány stavovými rovnicemi
X1 (t) = A1 X1 (t) + B1 u1 (t)
y1 (t) = C1 X1 (t) + d1 u1 (t)
X2 (t) = A2 X2 (t) + B2 u2 (t)
y2 (t) = C2 X2 (t) + d2 u2 (t)
a tyto systémy jsou spojeny kaskádně, musí platit
u2 (t) = y1 (t) ,
y(t) = y2 (t) ,
u(t) = u1 (t) .
Stavove rovnice výsledného systému získáme tak, že vytvoříme složený stavový vektor




x1 (t)


X(t) = 





x2 (t)
a dosadíme matice původních podsystémů do stavové rovnice








0
 B1 
 A1




X(t) = 
 · X(t) + 
 · u(t)








B2 C1 A2
d1 B2
y(t) = d2 C1 C2 · X(t) + d1 d2 u(t)
(4-2)
(4-3)
Stejným postupem lze odvodit tvar matic výsledného systému i pro spojení více než
dvou podsystémů.
8.5.2
Paralelní spojení
Paralení spojení dvou systémů je na Obr. 4-2. Vstup, případně vstupy, systémů jsou
totožné a výstupy se sčítají. Jednotlivé přenosy jsou definovány takto:
F1 (p) =
Y1 (p)
,
U (p)
F2 (p) =
Y2 (p)
,
U (p)
F (p) =
Y (p)
.
U (p)
Matematika 2
133
Protože pro výstup platí y = y1 + y2 , bude celkkový přenos
F (p) =
Y1 (p) + Y2 (p)
Y (p)
=
= F1 (p) + F2 (p) .
U (p)
U (p)
Protože tento postup lze opět rozšířit na libovolný počet podsystémů, zní obecné
pravidlo pro paralelní spojení takto:
celkový přenos k systémů spojených paralelně je dán součtem dílčích přenosů
k
X
F (p) =
Fi (p) .
(4 − 4)
i=1
Jsou-li podsystémy popsány stavovými rovnicemi
X1 (t) = A1 X1 (t) + B1 U1 (t)
Y1 (t) = C1 X1 (t) + D1 U1 (t)
X2 (t) = A2 X2 (t) + B2 U2 (t)
Y2 (t) = C2 X2 (t) + D2 U2 (t)
a jsou-li rozměry vstupů a rozměrů výstupů stejné, tzn. dim U1 = dim U2 a dim Y1 =
dim Y2 , můžeme opět vytvořit složený stavový vektor




X1 (t)


X(t) = 





X2 (t)
Po dosazení matic podsystémů dostaneme stavové rovnice výsledného systému


 


 
0 
A1
B1 


 
X(t) = 
 · X(t) +   · U (t)


 
 


0 A−2
B2
Y (t) = C1 C2 · X(t) + D1 + D2 · U (t)
(4-5)
(4-6)
Je zřejmé, že tvorba matic výsledného systému je u paralelního spojení jednoduchá.
8.5.3
Zpětnovazební (antiparalelní) spojení
Blokovéschéma takového spojení dvou subsystémů je naznačeno na Obr. 4-3. V přímé
větvi je zapojen subsystém s přenosem F1 (p) a ve zpětné vazbě, která může být buď
záporná (−) nebo kladná (+), je subsystém s přenosem F2 (p). V systémech z oblasti
134
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
technické kybernetiky je zpětná vazba obvykle záporná, a proto ji uvádíme na prvním
místě. Jednotlivé přenosy definují rovnice
F1 (p) =
Y (p)
,
X(p)
F2 (p) =
V (p)
,
Y (p)
F (p) =
Y (p)
U (p)
X =U −V
Vzájemným dosazením a úpravou dostaneme přenos celého systému
F (p) =
F1 (p)
Y (p)
=
.
U (p)
1(±)F1 (p)F2 (p)
[4 − 7]
Je-li v pbou větvích zapojeno více systémů, platí pro celkový přenos výpočetní algoritmus,
který formuluje následující schéma:
Jsou-li oba podsystémy vyjádřeny stavovými rovnicemi v obvyklém tvaru, musí platit
dim U1 (t) = dim U (t) = dim Y2 (t) ,
dim U2 (t) = dim Y1 (t) .
Pro výstupní vektor platí
Y (t) = Y1 (t) = C1 X1 (t) + D1 U1 (t) = C1 X1 (t) + D1 U (t)(±)C2 X2 (t) ± D2 Y (t)
odkud po úpravě dostaneme rovnici
−1 Z(t) = I(±)D1 D2
C1 X1 (t) + D1 C2 X2 (t) + D1 U (t) .
Zavedeme opět stavový vektor celého systému




X1 (t)


X(t) = 





X2 (t)
Matematika 2
135
pro který platí následující rovnice




X1 (t)


X(t) = 
=




X2 (t)




A − 1 + B1 D2 (I − D1 D2 )−1 C1 B1 C2 + B1 D2 (I − D1 D2 )−1 D1 C 


=
 X(t)+




−1
−1
B2 (I − D1 D2 )
A2 + B2 (I − D1 D2 ) D1 C2




B1 + B1 D2 (I − D1 D2 )−1 


+
 U (t)




−1
B2 (I − D1 D2 ) D1
(4-8)
Z této rovnice plyne další podmínka
det I(±)D1 D2 =
6 0
(4 − 9)
Jinak stav systému není jednoznačně určen na základě počátečních podmínek a vstupního
vektoru U (t).
Oba podsystémy lze vyjádřit též jejich přenosovými maticemi G1 (p) a G2 (p). Pro
přenos celého systému platí
−1
G(p) = I(±)G1 (p)G2 (p) G1 (p) .
I zde musí být splněna podmínka
det I(±)G1 (p)G(p) 6= 0
(4 − 10) .
Pokud tato podmínka není splněna, nelze vyjádřit přenosovou matici celého systému.
Podmínky (4-9) a (4-10) nejsou totožné v tom smyslu, že z podmínky (4-9) neplyne (410), naopak ale ano. Zpětnovazební systém tedy může mít přenosovou matici, aniž by
existoval jeho stavový popis. Takový systém je však nekauzální, což znamená, že výstup
není jednoznačně určen počátečním stavem a průběhem vstupu.
Příklad 4-1. Jednovstupový a jednovýstupový zpětnovazební systém je blokově nakreslen
na obr. 4-4. Platí
p
, G2 (p) = 1
G1 (p) =
p+1
a vzhledem ke kladné zpětné vazbě
det I − G1 (p)G2 (p) 6= 0 .
136
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
Pro přímé vazby podsystémů platí D1 = 1, d2 = 1, a proto
det[1 − d1 d2 ] = 0 .
Protože G1 (p) · G2 (p) 6= 1 existuje sice přenos celého systému
G(p) =
p
p+1
1−
p
p+1
= p,
ale systém není kauzální. Stavový diagram tohoto systému je na obr. 4-5. Popisuje jej
stavová rovnice
X(t) = −X(t) + X(t) + U (t) ,
ve které se zruší derivace stavové proměnné a stav systému tedy neexistuje.
Příklad 4-2 Ve zpětnovazebném zapojení se zápornou zpětnou vazbou jsou dva podsystémy


 −p + 4

 p+2
G1 (p) = 

 −6
p+3


−1 

p+2 


−p − 2 
p+3


1 0


G2 (p) = 





0 1
Protože zde platí det I + G1 (p)G2 (p) = 0 neexistuje přenosová matice celého systému.
8.6
Matematický model systému se spojitým časem
Mnohé pojmy teorie systémů lze definovat na základě koncepce obecného systému, přesto
v konkrétních aplikacích je zapotřebí uvažovat vstupní a výstupní objekty opatřené některou speciálnější strukturou např. strukturou vektorového prostoru. Následně pak přechodová relace systému by měla být kompatibilnější s těmito strukturovanými objekty.
Tak přicházíme k pojetí (abstraktního) úplného lineárního systému. Konkrétně, nechť C
je těleso komlexních čísel X = U , Y = V vektorové prostory nad C a S ⊆ U × V neprázdná binární relace mezi prostory U , V . Zde U × V označuje přímý součin vektorových
prostorů U , V , tedy opět množinu uspořádaných dvojic vektorů [~u, ~v ], [~u ∈ U ], ~v ∈ V na
níž je definována operace sčítání a násobení skaláry α ∈ C předpisem
[~u, ~v ] + [u~0 , v~0 ] = [~u + u~0 , ~v + v~0 ] ,
α[~u, ~v ] = [α~u, α~v ] ,
Matematika 2
137
pro každí dvě dvojice [~u, ~v ], [u~0 , v~0 ] ∈ U × V . Snadno se ověří, že množina U × V s
takto definovaným sčítáním a násobením skaláry splňuje axiomy vektorového prostoru
s nulovým vektorem [~ou , ~ov ] ∈ U × V , kde ~ou , ~ov jsou nulové vektory prostorů U , V (v
daném pořadí).
Nyní uvedeme definici lineárního systému: Definice. Nechť U , V jsou vektorové prostory nad tělesem komplexních čísel C a S ⊆ U × V neprázdná binární relace s těmito
vlastnostmi: 1◦ Pro každě dvojice vektorů [~u, ~v ∈ S], [~u0 , ~v 0 ] ∈ S platí [~u, ~v ] + [~u0 , ~v 0 ] =
[~u + ~u0 , ~v + ~v 0 ] ∈ S,
2◦ pro každou dvojici [~u, ~v ] ∈ S a každé komplexní číslo y ∈ C platí z[~u, ~v ] = [y~u, z~v ] ∈
S. Obecný systém (U, V, S) se nazývá úplný linearní systém.
Následující věta hraje fundamentální úlohu v teorii linearních systémů. Uvedeme ji bez
důkazu (důkaz je obsažen např. v monografii [ ], kap. II, § 1 a využívá některé speciální
matematické prostředky jako je Zornovo lemma).
Věta. Nechť U , V jsou vektorové prostory nad tělesem komplexních čísel C a S ⊆ U × V
je neprázdná relace. Systém (U, V, S) je linearní právě tehdy, když existuje globální reakce
R : C × U → V s těmito vlastnostmi:
1◦ Objekt C je vektorový prostor nad C,
2◦ existuje dvojice linearních zobrazení (tedy homomorfismů vektorových prostorů)
R1 : C → V , R2 : U → V takových, že pro každou dvojici [~c, ~u] ∈ C × U platí
R(~c, ~u) = R1 (~c) + R2 (~u) .
Poznamenejme, že globální reakce R : C × U → V z výše uvedené věty se obyvkle
nazývá linearní globální reakcí, prostor C se nazývá linearním objektem globálních stavů
a funkce R1 : C → V , R2 : U → V (pro které platí R(~c, ~u) = R1 (~c) + R2 (~u)) se nazývají
globální reakcí na stavy, globální reakcí na vstupy (v daném pořadí).
Příklady linearních systémů vytvářejí některé časové (diskrétní i kontinuální) systémy.
Za účelem definice obecného časového systému, jehož vstupní a výstupné objekty jsou
tvořeny vstupními a výstupními signály zavedeme pojem časové stupnice.
Připomeňme, že linearně uspořádanou množinou nebo-li řetězcem rozumíme neprázdnou množinu M , na níž je definována binární relace 5 (5 ⊆ M ×M ) s těmito vlastnostmi.
Relace 5 je reflexivní (x 5 x pro každý prvek x ∈ M ), antisymetrická (x, y ∈ M , x 5 y,
y 5 x implikuje x = y), transitivní (x, y, z ∈ M , x 5 y, y 5 z implikuje x 5 y) a
úplná (pro libovolnou dvojici prvků x, y ∈ M buďto x 5 y nebo y < x). Zde y < x
znamená y 5 x a y 6= x. Prvek x0 ∈ M se nazývá nejmenší prvek uspořádané množiny
(M, 5), jestliže platí x0 5 x pro každý prvek x ∈ M . Dále, intervalem I uspořádané množině — nebo v uspořádané množině (M, 5) se rozumí každá její, alespoň dvouprvková,
podmnožina I s touto vlastností:
Pro každou dvojici prvků x, y ∈ I, pro níž x < y a pro každý prvek z ∈ M takový,
že x 5 z 5 y, platí z ∈ I. Je zřejmé, že toto zavedení pojmu interval zobecňuje (a tedy
zahrnuje) všechny speciální případy intervalů v kurzu základů matematické analýzy v
I. semestru v předmětu BMAI. Nyní časovou množinou — nebo lépe — časovou stupnicí
T (v obecném pojetí) nazýváme každou linearně uspořádanou množinu s nejmenším prvkem t0 ∈ T . V uvažovaných případech tento pojem poněkud zúžíme a budeme za časovou
138
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
stupnici považovat interval T buďto v řetězci R+
0 všech nezáporných reálných čísel (kontinuální časová stupnice) s nejmenším prvkem t0 = 0 nebo v řetězci N0 všech nezáporných
celých čísel (diskrétní časová stupnice) s nejmenším prvkem t0 = 0 v (N0 , 5). Zde N0
označuje množinu všech přirozených čísel rozšířenou o číslo 0 — tuto množinu — rovněž
jako množinu reálných čísel uvažujeme s přirozeným uspořádáním čísel.
Nyní přistoupíme k definici obecného časového systému.
Definice. Nechť A, B jsou libovolné (neprázdné) množiny, T je časová stupnice a AT ,
B T jsou množinu všech zobrazení časové stupnice T do A a do B nazývané množinami
signálů. Nechť X ⊆ AT , Y ⊆ B T . Pak systém (X, Y, S), kde S ⊆ X × Y je transitní relace
se nazývá obecný časový systém s abecedou vstupů A, abecedou výstupů B. Množina X
se nazývá časovým objektem vstupních signálů x : T → A, množina Y se nazývá časovým
objektem výstupních signálů y : T → B.
Příklad. Přechodová relace vstup – výstup může být zadána diferenciální rovnicí vstup –
dy(t)
= u(t), kde t ∈ T = (−∞, ∞) a funkce u patří do množiny spojitých
výstup tvaru
dt
časových funkcí definovaných na intervalu T = (−∞, ∞). V tomto případě přechodová
relace vstup výstup rht0 , t1 i tvořená dvojicemi vstup – výstup, kde uvažované
funkce
jsou restrigovány na interval ht0 , t1 i je tvořena dvojicemi časových funkcí tvaru u(t), α +
Zt
u(τ ) dτ , t0 5 t 5 t1 , kde α je libovolná reálná konstanta. Konkrétními dvojicemi
t0
t2
mohou být dvojice [1, t], [1, 1 + t], [t, + 1], t0 5 t 5 t1 a další. Jestliže v uvedeném
2
příkladě rovnici vstup výstup zaměníme na rovnici
dy(t)
+ y(t) = u(t) ,
dt
pak dvojice vstup – výstup tvořící přechodovou relaci daného systému jsou tvaru
Z t
−(t−t0 )
u(t), αe
+
e−(t−τ ) u(τ ) dτ ,
(∗∗)
t0
t0 5 t 5 t1 , kde časová funkce u náleží do množiny časových funkcí, pro které integrál
Zt
e−(t−τ )u(τ ) dτ je definován pro všechny hodnoty proměnné t ∈ ht0 , t1 i a α je libovolné
t0
reálné číslo. Poznamenejme, že každému vstupu u(t), t ∈ ht0 , t1 i je přiřazena množina
výstupů y(t), t ∈ ht0 , t1 i, které jsou druhými složkami dvojic (**), tedy řešeními diferemnciální rovnice (*) s konstantou α, která má úlohu parametru.
Nyní přistoupíme k vnějšímu popisu.
Vnější popis používá pro vyjádření dynamických vlastností systémů vztahy mezi výstupními a vstupními veličinami. Systém zde chápeme jako tzv. černou skříňku, kterou
lze zkoumat pouze pomocí reakcí výstupů na vstupní signály. Pro tuto analýzu není podstatné, jaké děje probíhají uvnitř systému, a podstatná není ani fyzikální realizace systému. Tento přístup je proto výhodný z hlediska analogie mezi systémy z různých oblastí,
Matematika 2
139
neboť umožňuje sledovat chování zkoumaného systému na analogickém modelu, na kterém
lze vstupy i výstupy snadno měřit. Metody analýzy a syntézy systémů, založené na vnějším popisu, byly podrobně rozpracovány a hojně používány až do šedesátých let tohoto
století a jsou někdy označovány za klasické. Různé formy vnějšího popisu dynamických
vlastností systému spolu těsně souvisejí. V této kapitole popíšeme nejužívanější formy a
ukážeme též vazby mezi nimi. Vztah k vnitřnímu — stavovému — popisu probereme dále.
Vztah mezi vstupy a výstupy systému můžeme vyjádřit analyticky, pomocí časových
odezev na předem definované tvary vstupních signálů nebo frekvenčními vlastnostmi. Pro
jednoduchost budeme jednotlivé způsoby demonstrovat na systému s jedním vstupem a
jedním výstupem. Popis vícerozměrných systémů ukážeme později. Vstup systému označíme u(t) a výstup y(t). Dynamické vlastnosti lze popsat některým z následujících sedmi
způsobů:
1. diferenciální rovnicí,
2. operátorovým přenosem (obvykle v Laplaceově transformaci),
3. frekvenčním přenosem,
4. frekvenční charakteristikou,
5. impulsní charakteristikou (časová odezva na Diracův impuls),
6. přechodovou charakteristikou (odezva na jednotkový skok vstupu),
7. rozložením nul a pólů přenosu.
Uveďme příklad elektromechanického systému.
Příklad tohoto systému může být stejnosměrný motorek, např. takový, jaký se používá
v hračkách. Stator motorku je tvořen permanentním magnetem, v jehož magnetickém poli
se otáčí rotor. Rotor je tvořen vinutím o odporu R [Ω] (indukčnost vinutí prozatím zanedbejme), do kterého je proud i(t) přiváděn přes kartáče. Situace je znázorněna na obr.
1-5. Za vstup do systému budeme považovat napětí u(t) [V] a výstup budou otáčky hřídele ω(t) [rad/sec]. Označme J [k.m2 ] moment setrvačnosti rotoru a Mz [N.m] zatěžovací
moment na hřídeli motoru. Pohybem rotoru v magnetickém poli v něm vzniká indukované elektromotorické napětí, které je úměrné otáčkám motoru, tj. ue (t) = ke · ω(t), kde
konstanta ke [V.sec/rad] je dána konstrukcí motoru. Pro elektrickou část systému platí
tedy rovnice:
u(t) = R · i(t) + ke · ω(t) .
Motor na své hřídeli vyvozuje moment Mm [N.m], který je úměrný produ, který prochází rotorem, tj. Mm = km · i(t). Konstanta km [N.m/A] je opět dána konstrukcí motoru.
Na hřídeli dále působí moment setrvačných sil, který je úměrný zrychlení, tj. J · dω(t) a
dále moment zatěžovací Mz . Pro hřídel platí rovnováha momentů, tj.:
km · i(t) = J ·
dω
+ Mz .
dt
Budeme-li předpokládat, že motor není zatížen (Mz = 0) a že na počátku děje je rotor
v klidu (ω(0) = 0), potom dosazením za proud i(t) do této rovnice z rovnice předchozí
obdržíme diferenciální rovnici
J · R dω
·
+ ke · ωt = u(t)
km
dt
140
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
s počáteční podmínkou ω(0) = 0. Uvažovaný elektromechanický systém obsahuje jeden
akumulátor energie (kinetická energie rotoru) a počáteční podmínka definuje stav tohoto
akumulátoru na počátku děje. A mohli bychom najít celou řadu dalších příkladů z různých
fyzikálních oblastí.
V našich úvahách o elektromotoru jsme zanedbali indukčnost vinutí rotoru L [H].
Vezměme ji nyní v úvahu tak, jak ukazuje obr. 1-11. Pro elektrickou a mechanickou část
systému platí nyní rovnice
u(t) = R · i(t) + ke c · ω(t) + L ·
kM · i(t) = J ·
di(t)
dt
dω(t)
+ Mz
dt
Za předpokladu nulového zatěžovacího momentu a vyloučením proudu i(t) z těchto rovnic
obdržíme jednu lineární diferenciální rovnici 2. řádu s konstantními koeficienty
J · L d0 ω(t) J · R dω(t)
·
·
+
+ ke · ω(t) = u(t) ,
km
dt2
km
dt
s počátečními podmínkami ω(0) a ω (1) (0). První počáteční podmínka představuje počáteční otáčky, tj. počáteční kinetickou energii rotujících hmot. Druhá počáteční podmínka
určuje počáteční proud rotorovým vinutím, tj. počáteční magnetickou energii v indukčnosti vinutí rotoru, neboť z druhé diferenciální rovnice vyplývá (Mz = 0):
i(0) =
J
· ω (1) (0) .
km
Lze učinit následující závěry:
1. Uvedené příklady obsahují dva akumulátory energie a chování systému je popsáno
formálně stejnou diferenciální rovnicí tvaru:
dy(t)
d2 y(t)
a2 ·
+
a
·
+ a0 · y(t) = b0 · u(t) ,
1
dt2
dt
kde u(t) je vstup systému a y(t) je jeho výstup. Řád spojitého systému, tj. řád diferenciální rovnice je určen počtem akumulátorů energie v systému.
2. Počáteční podmínky příslušné k diferenciální rovnici definují počáteční stavy těchto
akumulátorů.
3. Výše uvedený způsob popisu chování spojitého dynamického systému, kdy je pro
pozorovatele přístupný pouze vstup a výstup systému se nazývá vnější popis systému.
Lineární, hladký, stacionární a spojitý systém se vstupem u(t) a výstupem y(t) popisuje lineární diferenciální rovnice s konstantními koeficienty
an y (n) (t) + an−1 y (n−1) (t) + · · · + a1 y(t) + a0 y(t) = bm u(m) (t) + · · · + b1 u(t) + b0 u(t) , (2 − 1)
kde ai , bi jsou reálné konstantní koefiecienty.
Matematika 2
141
Rovnici (2-1) můžeme napsat ve tvaru
n
X
i=0
ai y (i) (t) =
X
= 0m bj u(j) (t) .
(2 − 2)
j
V odstavci 3.4 ukážeme, že prakticky nelze realizovat takové systémy, jejichž výstupní
signál by byl přesně úměrný derivaci vstupního signálu. Totéž platí tím spíše pro vyšší
derivace. Proto v rovnicích (2-1) a (2-2) musí vždy platit
m ≤ n.
Chceme-li popisující diferenciální rovnici řešit na časovém intervalu t0 ≤ t ≤ t1 , musíme znát průběh vstupního signálu u(t) v tomto časovém intervalu a počáteční podmínky
y(0), y(0), . . . , y (n−1) (0). Plnou informaci o systému v každém okamžiku dává soubor n
hodnot. Číslo n udává řád (dimenzi) systému.
U některých praktických realizací systémů dochází k časovému posunutí signálu beze
změny jeho tvaru. Říkáme, že systém obsahuj dopravní zpoždění. V technologických
procesech se tento jev vyskytuje ta, kde jsou dopravníkové pásy, linky kontinuální výroby
(follie, plechy, dráty, vývalky). Dopravním zpožděním též aproximujeme šíření signálu
v rozlehlých soustavách s rozloženými parametry (např. dlouhá vedení, průtok media
dlouhým potrubím apod.). Posunutí na časové ose vyjadřuje vztah
y(t) = u(t − Td ) .
(2 − 3)
Pokud kromě posunutí dojde i ke změně tvaru procházejícího signálu, znamená to, že
systém obsahuje ještě další dynamické členy, a popisující diferenciální rovnice má pak
tvar
n
X
X
ai y (i) (t) =
bj u(j) (t − Td ) .
(2 − 4)
i=0
j=0
Řád systému určuje nejen číslo n, ale též přítomnost dynamického zpoždění. Jak bude
ukázáno dále, vlastnosti systému s dopravním zpožděním lze vyjádřit diferenciální rovnicí
o nekonečném počtu členů, čili nejde už o systém konečného řádu. Proto můžeme, jak
už bylo řečeno, nahrazovat dopravním zpožděním systémy s rozloženými parametry. V
případě systémů s popisující rovnicí ve tvaru (2-4) říkáme, že jde o systém n-tého řádu s
dopravním zpožděním.
Příklad 2-1. Do nádrže, jejíž plocha je S, přitéká q1 litrů kapaliny za 1s a odtéká q2 l.s−1 .
pro změnu výšky hladiny h platí rovnice
1
dh
= (q1 − q2 ) .
dt
S
Pokud jsou plocha S i odtok q2 nezávislé na výšce hladiny, a za vstup označíme rozdíl
u(t) = q1 − q2
142
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
a výstupem bude výška h, dostaneme jjiž standardní tvar diferenciální rovnice
a1 y(t) = u(t) ,
a1 = S .
Je však třeba mít na paměti, že předpoklad nezávislosti odtoku na výšce hladiny platí
(alespoň přibližně) jen pokud hladina neklesne na nulu. Pak už výše uvedená popisující
rovnice neplatí. Pokud bychom chtěli tuto skutečnost zachytit, dostaneme nelineární systém. Předpokladem konstantního odtoku jsme provedli linearizaci systému a při řešení
nesmíme zapomenout na omezující podmínku její platnosti.
Příklad 2-2. stejnosměrné dynamo s cizím buzením, jehož vstupem je napětí budicího
vinutí a výstupem napětí na kotvě, je schematicky znázorněno na obr. 2-1. Předpokládáme, že otáčky dynama jsou konstantní, hysteréze magnetického obvodu je zanedbatelná
a závislost magnetického toku na proudu v budicím vinutí je lineární. Pak platí rovnice
u2 (t) = k1 · n0 · Φ(t)
Φ(t) = k2 · i1
di1 (t)
Lb
u1 (t) = Rb · i1 (t) +
dt
Úpravou získáme rovnici
du2 (t)
+ u2 (t) = K · u1 (t)
dt
1
Lb
= a1 , a0 = 1 , K = k1 · n0 · k2 · = b0
T =
Rb
R
T
Forma popisu dynamických vlastností lineárních systémů je používána nejčastěji. Operátorový přenos je definován takto:
Operátorový přenos je dán poměrem obrazu výstupní veličiny k obrazu veličiny bve
stejné transformaci, za předpokladu nulových počátečních podmínek.
V případě spojitých systémů je používána Laplaceova transformace.
Systém, popsaný dfierenciální rovnicí (2-1) má přenos ve tvaru racionální funkce lomené
Y (p)
bm pm + bm−1 pm−1 + · · · + b1 p + b0
F (p) =
=
(2 − 5)
U (p)
an pn + an−1 pn−1 + · · · + a1 p + a0
kde p je Laplaceův operátor. Z ucvedené podmínky fyzikální realizovatelnosti plyne, že
stupeň polynomu v čitateli musí být nižší, nebo nejvýše roven stupni polynomu ve jmenovateli přenosu F (p). Oba polynomy lze vyjádřit ve tvaru součinu ěkořenových činitelů
A(p) = an (p − p1 )(p − p2 ) . . . (p − pn )
B(p) = bm (p − n1 )(p − n2 ) . . . (p − nm )
Obecně komplexní čísla pi , i = 1 . . . n nazýváme póly přenosu, neboť splňují rovnici
A(pi ) = 0. Rovněž obecně komplexní čísla nj , j = 1 . . . m jsou nuly přenosu, pro které
platí B(nj ) = 0. Pomocí těchto tvarů lze přenos psát ve formě podílu kořenových činitelů
F (p) =
bm (p − n1 )(p − n2 ) . . . (p − nm )
.
an (p − p1 )(p − p2 ) . . . (p − pn )
(2 − 6)
Matematika 2
143
Pokud jsou kořeny polynomů reálné, můžeme použít značení časových konstant, které se
rovnají záporně vzatým převráceným hodnotám pólů a nul. Časové konstanty jmenovatele
označíme
1
Ti = − ,
i = 1...n
pi
a časové konstanty čitatele
τi = −
1
,
nj
j = 1...m.
Přenos pak má tvar
F (p) =
b0 (τ1 p + 1)(τ2 p + 1) + · · · + (τm p + 1)
a0 (T1 p + 1)(T2 p + 1) + · · · + (Tn p + 1)
(2 − 7) .
Jsou-li některé póly či nuly komplexní, nelze odpovídající členy vyjádřir časovými konstantami a je nutné zavést do rovnice (2-7) dvojčleny. Obecný tvar přenosu pak je
F (p) =
b0 (τ1 p + 1)(τ2 p + 1) . . . (τk2 p2 + 2τk bk p + 1) . . .
.
a0 (T1 p + 1)(T2 p + 1) . . . (Tr2 p2 + 2Tr ar p + 1) . . .
Význam koeficientů bk , ar vysvitne z rozboru základních dynamických členů v kapitole
3.
Jestliže se v systému vyskytuje dopravní zpoždění, získáme přenos použitím věty o
posunutí v originále. Platí: jestliže funkce f (t) má obtaz F (t), pak pro obraz funkce
f1 (t) = f (t − Td ) platí
F1 (p) = L{f1 (t)} = L{f (t)}e−Td p = F (p)e−Td p
opět za předpokladu nulových počátečních podmínek. Přenos systému, popsaného rovniicí
(2-4), bude:
B(p) −Td p
e
.
F (p) =
A(p)
Hlavní význam přenosových funkcí spočívá ve zjednodušení výpočtu odezvy systému
na vstupní signál, jehož obraz je U (p). Z definice přenosu vyplývá, že pro obraz výstupní
veličiny platí
Y (p) = F (p) · U (p)
a proto
y(t) = L−1 {F (p) · U (p)} .
Pomocí transformace jsme tak převedli obtížný výpočet konvolutorního integrále na
operaci násobení dvou racionálních funkcí lomených a nalezení originálu ke vzniklé funkci.
Z definice přenosu také plyne, že tento postup je správný pouze při nulových počátečních
podmínkách v systému. Pokud tomu tak není, platí pro obraz výstupní veličiny rovnice
Y (p) = F (p) · U (p) + Y0 (p)
144
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
kde Y0 (p) je část výstupu, závislá na počátečních podmínkách. S použitím věty o obrazu
derivace
i−1
X
(i)
(i)
L{f (t)} = p F (p) −
pj f (i−j−1) (0+ ) ,
j=0
dostaneme pro Y0 (p) vztah
Y0 (p) =
M0 (p)
.
A(p)
Polynom A(p) je totožný s polynomem ve jmenovateli přenosu F (p) a pro polynom M0 (p)
platí:
M0 (p) = an y(0) − bn u(0) pn−1 + an y(0) − bn u(0) + an−1 y(0) − bn−1 u(0) · pn−2 + . . .
+ an y (n−2) (0) + · · · + a2 y(0) − bn u(n−2) (0) − · · · − b2 u(0) · p
+ an y (n−1) (0) + · · · + a1 y(0) − bn u(n−1) (0) − · · · − b1 y(0)
Příklad 2-3. Na obr. 2-3 je nakresleno schéma ideálního operačního zesilovače s kapacitní
zpětnou vazbou. Jde-li o ideální zesilovač, je jeho vstupní odpor nekonečný, a proto proud
i3 = 0. Vzhledem k nekonečně velkému zesílení zesilovače je napětí vstupu nulové. Pak
platí
U1 (p)
,
R
U2 (p)
I2 (p) = 1 = U2 (p) · pC ,
I1 (p) = −
pC
I2 = I1 (p) .
Dosazením a úpravou získáme přenos (vstupem je napětí u1 , výstupem u2 ):
F (p) =
1
U2 (p)
=−
.
U1 (p)
pRC
Příklad 2-4. Vypočteme přenos pasívního nezatíženého obvodu podle obr. 1-7. S použitím symbolických impedancí vypočteme
h
1 i−1
,
I1 (p) = U1 (p) · R + Lp +
pC
U2 (p) = R · I1 (p) ,
Odtud
F (p) =
U2 (p)
R
=
U1 (p)
(R + Lp +
1
)
pC
=
LCp2
RCp
.
+ RCp + 1
i2 = 0 .
Matematika 2
8.7
145
Stabilita spojitých systémů
Stabilita je jedním z nejdůležitějších pojmů v teorii dynamických systémů. V oblasti lineárních systémů je otázka stability poměrně snadno řešitelná, naproti tomu u nelineárních
systémů představuje složitý komplex problémů. Již samotná definice stabilního a nestabilního systému je závislá na druhu popisu, který je v systému použit. Jednodušší je rozbor
stability u vnějšího popisu, a proto jím začneme.
8.7.1
Hodnocení stability systému podle vnějšího projevu
Stabilita lineárního systému, hodnocená podle vnějšího projevu systému (na základě
vnějšího popisu) bývá definována dvojím způsobem. Obě definice vyjadřují v podstatě
totéž, používají k tomu však rozdílné vstupní signály.
Definice 1. Lineární systém je stabilní tehdy, jestliže po skončení vstupního (budicího)
signálu a po skončení přechodného děje se výstup vrátí na původní hodnotu, kterou měl
před začátkem působení vstupu.
Definice 2. Lineární systém je stabilní tehdy, jestliže na omezený vstupní signál odpoví
rovněž omezeným výstupem.
Poněkud dokonalejší je první definice, neboť umožňuje dále rozlišit systémy, které
nesplňují podmínky stability. Není-li systém ve smyslu této definice stabilní, mohou nastat
dva případy:
– výstup systému se neustálí na žádné konstantní hodnotě, nýbrž jeho amplituda buď
monotónně, nebo periodicky narůstá nade všechny meze. Takový systém je nestabilní;
– po skončení budicího signálu a doznění přechodného děje zaujme výstup systému
novou ustálenou hodnotu, různou od původní. Tyto systémy se nazývají neutrální a běžně
jsou počítány mezi nestabilní. Někdy se označují též jako systémy na mezi stability, ke
kterým dále patří systémy, jejichž výstup kmitá harmonickými kmity s konstantní amplitudou. Podrobnější třídění nabízí stavová teorie.
Z uvedeného je zřejmé, že stabilita, definovaná tímto způsobem, je vnitřní vlastností
systému, nezávislou na budicím signálu (platí pouze u lineárních systémů). Proto k vyšetření stability systému můžeme pro jednoduchost využít Diracův impuls. Průběh výstupní
veličiny je roven impulsní odezvě
y(t) = g(t) = L−1 {F (p)} .
Nechť přenos systému s jedním vstupem a jedním výstupem je
F (p) =
bm pm + bm−1 pm−1 + · · · + b1 p + b0
.
an pn + an−1 pn−1 + · · · + a1 p + a0
Známe-li póly přenosu, můžeme jej napsat ve tvaru
F (p) =
K2
Kn
K1
+
+ ··· +
.
p − p1 p − p
p − pn
(6.1)
146
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
Pro výstupní veličinu pak platí
y(t) = K1 ep1 t + K2 ep2 t + · · · + Kn epn t .
(6.2)
Výstup systému musí podle definice splňovat podmínku
lim y(t) = 0 ,
t→∞
která bude splněna jedině tehdy, jestliže tutéž podmínku budou splňovat všechny členy
na pravé straně rovnice (6.2). To nastane tehdy, jsou-li reálné části všech pólů přenosu pi
(i = 1 . . . n) záporné. Platí proto následující věta.
Věta 1. Lineární spojitý systém je stabilní tehdy, jestliže všechny póly přenosu leží v levé
polorovině roviny p.
Důkaz věty vyplývá z předcházející úvahy.
Stabilitu lineárního spojitého systému jednoznačně určují póly přenosu, čili kořeny
polynomu jmenovatele. Tento polynom se proto nazývá charakteristický polynom a rovnice
A(p) = 0 ,
kterou póly pi splňují, charakteristická rovnice.
Určení polohy pólů nečiní potíže u systémů prvního i druhého řádu. U systémů vyšších
řádů to ovšem znamená řešit algebraickou rovnici nejméně třetího řádu. Bez výpočtu však
lze o stabilitě rozhodnout v těchto případech:
1) Je-li polynom A(p) nejvýše druhého stupně a jsou-li všechny koeficienty charakteristického polynomu stejného znaménka, je systém stabilní. Platí totiž:
a2 p2 + a1 p + a0 = (p − p1 )(p − p2 )
odkud srovnáním koeficientů u stejných mocnin p plyne
a2 = 1 ,
a1 = −(p1 + p2 ) ,
a0 = p1 p2 .
2) Jestliže alespoň jeden z koeficientů charakteristického polynomu (bez ohledu na stupeň polynomu) má opačné znaménko než ostatní nebo je roven nule, systém je nestabilní.
Toto tvrzení má z hlediska stability systému charakter podmínky nutné, nikoliv však postačující. Jestliže tedy všechny koeficienty charakteristického polynomu jsou nenulové a
mají stejné znaménko a systém je vyššího než druhého řádu, nelze bez dalšího výpočtu
tvrdit, že systém je stabilní. K tomu je třeba buď polohu všech kořenů vypočítat, nebo
použít některé z kriterií stability.
Kriteria stability jsou početní nebo grafické algoritmy, které umožňují rozhodnout o
stabilitě systému bez výpočtu kořenů charakteristického polynomu. V podstatě jde pouze
o to zjistit, zda všechny tyto kořeny leží v levé polovině roviny p, aniž bychom přesněji
znali jejich polohu. Nejprve ukážeme dvě algebraická kriteria. Algebraická se nazývají
proto, že pracují pouze s koeficienty charakteristické rovnice.
Hurwitzovo kriterium. Předpokládejme, že charakteristický polynom má tvar
A(p) = an pn + an−1 pn−1 + · · · + a1 p + a0 .
(6.3)
Matematika 2
147
Z koeficientů ai vytvoříme tzv. Hurwitzovu matici




0
0
0
. . .
an−1 an








an−3 an−2 an−1 an

0
.
.
.



H=




a

a
a
a
a
.
.
.
 n−5 n−4 n−3 n−2 n−1







 ..
..
..
..
..
.. 
.
.
.
.
.
.
Systém n-tého řádu je stabilní, jestliže všechny subdeterminanty D−i, i = 1, 2, . . . (n−
1), vytvořené čárkovaně naznačeným způsobem, jsou nenulové a mají stejná znaménka.
dodejme, že tutéž podmínku lze aplikovat na transponovanou Hurwitzovu matici, která
vznikne záměnou řádků za sloupce. Tak pro stabilní systém třetího řádu musí platit:
sign a2 = sign(a2 a1 − a3 a0 ) ,
neboť
D1 = a2 ,
D2 = a2 a1 − a3 a0 .
Pro systém 4. řádu má Hurwitzova matice tvar


a a 0 

 3 4







H4 = a a a 

 1 2 3






0 a0 a1
Potřebné subdeterminanty jsou
D 1 = a3 ,
D2 = a3 a2 − a4 a1 ,
D3 = a1 a2 a3 − a0 a23 − a21 a4 .
Příklad 6.1. Přenos systému je
F (p) =
5p2 + 4p + 0.5
.
50p4 + 65p3 + 21p2 + 5p + 0.5
Vypočteme subdeterminanty D1 až D3
D1 = 65 ,
D2 = 65.21 − 5.50 = 1155 ,
D3 = 5.21.65 − 0, 5.652 − 25.50 = 3462, 5 .
148
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
Jelikož všechny subdeterminanty jsou kladné, systém je stabilní.
Jednou z výhod Hurwitzova kriteria je snadná možnost určení rozmezí vybraných
parametrů, pro které je systém stabilní.
Příklad 6.2. Charakteristický polynom je ve tvaru
A(p) = 5p3 + p2 + k2 p + k1 .
Hurwitzovy determinanty jsou
D1 = 1 ,
D2 = k2 − 5k1 .
Pro stabilitu systému musí být splněny dvě podmínky:
k1 > 0 ,
k2 > 5k1 .
Tyto podmínky definují v rovině k1 , k2 stabilní oblast systému (viz obr. 5-1)
Příklad 6.3. Přenos systému je
F (p) =
p2
2p + 1
.
− 4p + 1
Protože jeden z koeficientů jmenovatele je záporný, systém je nestabilní. Úkolem je zjistit,
zda zavedením záporné zpětné vazby se zesílením k lze systém stabilizovat.
Blokové schéma systému se zpětnou vazbou je na obr. 5-2. Podle pravidel blokové
algebry platí pro přenos takto upraveného systému
F1 (p) =
2p + 1
F0 (p)
= 2
.
1 + F0 (p) · k
p + (2k − 4)p + (1 + k)
Protože jde o systém 2. řádu, stačí rozhodnout podle znaménka koeficientů charakteristického polynomu, a tedy systém bude stabilní pro k > 2.
Routh-Schurovo kriterium
Nevýhodou Hurwitzova kriteria pro systémy vyššího než 4. řádu je nutnost vyčíslovat
determinanty vyššího řádu. I když moderní výpočetní technika tuto nevýhodu značně
zmenšuje, jde vždy o časově dosti náročné operace. Tuto nevýhodu nemá další algebraické
kriterium. Jeho algoritmus v podstatě snižuje řád popisující diferenciální rovnice, a tedy i
charakteristické rovnice. Postup testu stability Routh-Schurovým kriteriem je následující:
1) Koeficienty charakteristického polynomu A(p) napíšeme do řádku. Každý druhý
koeficient — počítáme buď zleva nebo zprava — podtrhneme. Volba směru je libovolná,
jakmile však určitý směr zvolíme, musíme v něm pokračovat až do konce testu stability.
2) Všechny podtržené koeficienty násobíme podílem dvou nejvyšších koeficientů
an /an−1 a výsledky sepíšeme do dalšího řádku vždy o jedno místo vlevo (případně vpravo
– podle zvoleného směru).
3) Druhý řádek odečteme od prvního a získáme tak nový redukovaný řádek, který má
o jeden koeficient méně než výchozí řádek. Celý postup nyní opakujeme tak dlouho, až
dojdeme k řádku se třemi koeficienty, který odpovídá polynomu druhého řádu.
Matematika 2
149
4) Jestliže všechny koeficienty v redukovaných řádcích mají stejné znaménko, je analyzovaný systém stabilní. Z této podmínky plyne, že jakmile se v průběhu testu objeví u
některého koeficientu opačné znaménko (případně jestliže je nulový), můžeme test ukončit.
Následující schéma ilustruje popsaný algoritmus:
an−2
an an−1
an−3
...
an
an−1
−a0
−an−3
0 an−1
a0 α 1 =
an
an−1
an
. . . a1 − a0
a0 α 2 = . . .
an−1
an
an−1
an
an−2 − an−3
an−1
−an
a1
Příklad 6.4. Řešte Routh-Schurovým kriteriem stabilitu systému podle příkladu 6.1.
Charakteristický polynom je
A(p) = 50p4 + 65p3 + 21p2 + 5p + 0.5
50
21
65
5
0.5 α1 =
50
= 0.7692
65
5
0.5 α2 =
65
= 3.8
17.15
−50
−3.85
65
17.15
−65
−1.9
17.15
3.1 0.5
Všechny koeficienty v obou redukovaných řádcích jsou kladné, takže systém je stabilní.
Význam volby směru provádění testu vysvitne z následujícího příkladu
Příklad 6.5. Charakteristický polynom je
A(p) = p5 + 6p4 + 11p3 + 15p2 = 8p + 8 .
Nejprve provedeme test se směrem redukce zleva
1
6
15
−1
6
8.5
α1 =
1
6
6.67 8
α2 =
6
8.5
6.67 8
α3 =
8.5
10.29
8
−
6
15
−6
0
8
8
15 −
6
0
11
−4.71
8.5
10.29
−8.5
0
−6.61
10.29
0.06 8
150
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
Systém je zřejmě stabilní. Při redukci zprava bude mít test tento tvar:
8
=1 1
6
11
15
8
8
8
@
@
@
@
R
@
R
@
R
−1
−11
−8
8
5
α2 = = 2 1
11
4
8
0
4
@
@
R
@
R
@
α1 =
−10
α3 = 4
1
5
@
R
@
1
4
0
@
R
@
−4
1
−8
1
−4
1
Při redukci zprava je v tomto případě test početně jednodušší. použití výpočetní techniky
ovšem tyto rozdíly stírá. Při “ručním” výpočtu spíše jde o možnost kontroly, zda jsme při
počítání neudělali chybu. Změna směru redukce je ekvivalentní záměně pořadí, v jakém
vypisujeme koeficienty polynomu do prvého řádku, zda začínáme od nejvyšší nebo nejnižší
mocniny p.
8.7.2
Stabilita ve smyslu Ljapunova
Obecnou představu pojmu stability jako schopnosti zachovávat daný stav je možno
rozšířit na stabilitu stavu a stabilitu pohybu jako řešení diferenciální rovnice systému. Z
celé řady různě formulovaných definic stability uvedeme pouze definici tzv. ljapunovské
stability a definici asymptotické stability.
Předpokládejme, že spojitý systém je popsán stavovou rovnicí
X(t) = f (X, t)
(6 − 4)
kde f je obecně nelineární funkce. Řešení této rovnice při počátečním stavu X1 (0) označíme X1 (t) a řešení pro málo odlišné počáteční podmínky X2 (0)
X2 (0) = X1 (0) + ∆
označíme X2 (t). Pro stabilitu systému je podstatné, jak velký je rozdíl obou řešení,
jestliže počáteční podmínky se liší o málo. Fyzikálně lze tuto situaci vysvětlit např. takto:
roztočíme-li dětskou hračku “vlčka” na desce stolu, bude vykonávat krouživé pohyby kolem výchozího bodu„ což lze označit za stabilní stav, roztočíme-li jej blízko okraje desky,
může se při pohybu dostat na hranu a spadne. To odpovídá nestabilnímu stavu. Označme
rozdíl obou řešení rovnice (6-4) Xd (t)
Xd (t) = X2 (t) − X1 (t) .
Matematika 2
151
Obě řešení splňují rovnici (6-4) a lze tedy psát
Xd (t) = X2 (t) − X1 (t) = f (X(0) + ∆, t) − f (X(0), t) .
(6 − 5)
Rozdíl funkcí na pravé straně rovnice (6-5) označíme g(X, t) a hledáme řešení soustavy
diferenciálních rovnic (6-5)
Xd (t) = g(X, t) .
Definice stability podle Ljapunova: řešení soustavy (6-5) je ljapunovsky stabilní tehdy,
jestliže platí:
Ke každému ε > 0 existuje α = α(t, X0 , ε) > 0 takové, že pro všechny X0 vyhovující
nerovnostem kX0 k < α platí
kXd (t)k < ε .
Tato definice říká, že ke každému počátečnímu stavu z okolí α ustáleného stavu existuje
ε okolí tohoto bodu, ze kterého se stav systému v celém průběhu řešení nevzdálí. Pojem
ustálení stavu systému na původní hodnotě, který byl vyžadován u definice stability podle
vnějšího projevu systému, je zde zaměněn méně přísným požadavkem vzniku “malých”
pohybů kolem rovnovážného stavu. Všechny tyto úvahy nabývají reálný význam v nelineárních systémech, neboť u lineárních systémů se prakticky nelze setkat s případem
systému s omezenými oscilacemi nebo jinými výchylkami kolem rovnovážného stavu.
V definici ljapunovské stability není vyžadována konvergence řešení do rovnovážného
stavu s narůstajícím časem. Tuto konvergenci vyžaduje teprve definice asymptotické stability. Definice asymptotické stability je blízká definici stability podle výstupu, nejsou však
zcela totožné.
Analýza stability Ljapunovými metodami se používá prakticky pouze v nelineárních
systémech a v tomto předmětu se omezíme pouze na konstatování, že pro posouzení je
rozhodující, zda energie obsažená v systému se s rostoucím časem zmenšuje nebo zvětšuje.
Analýzu konkrétních systémů pak provádíme srovnáním s vybranou funkcí konstantní
energie.
Dosud jsme se zabývali otázkou stability stavu. Ze stability stavu nemusí bezpodmínečně vyplývat i stabilita výstupu, neboť všechny složky stavového vektoru nemusí být
vázány na výstup. Je-li spojitý systém, popsaný stavovými rovnicemi, lineární, můžeme
bez problémů použít pro analýzu stability stejnou definici jako u vnějšího popisu, pouze
místo výstupu bude sledovat vektor stavu. To znamená, že testu podrobíme matici přechodových funkcí Φ(t). V souladu s definicemi v kapitole 6.1 musí všechny prvky matice
Φ(t) splňovat podmínku
lim fij (t) = 0 ,
t→∞
i, j, = 1, dots, n .
Obdobně jako u operátorového přenosu i zde mluvíme o charakteristickém polynomu,
jehož kořeny musí u stabilního systému ležet v levé polovině roviny p. Protože pro obraz
matice přechodu platí
Φ(p) = (pI − A)−1 =
1
· adj(pI − A) ,
det(pI − A)
152
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
je charakteristický polynom roven determinantu matice pI − A. Charakteristická rovnice
je
det(pI − A) = 0 .
Kořeny charakteristické rovnice jsou tedy totožné s vlastními čísly matice vnitřních zpětných vazeb A. Pro výpočet stability u systémů vyšších řádů použijeme opět algebraická
kriteria stability.
Příklad 6.6. Systém popisují matice


−1 1 0




A =  0 −2 0 ,




2
0 1


0 3




B = 2 0 ,




0 0


1 0 0
C=
,
0 0 1
D = 0.
Charakteristický polynom je
det |Ip − A| = (p + 1)(p + 2)(p − 1) .
Systém je nestabilní, neboť jeden kořen, p3 = 1, je v pravé polovině roviny p. Tento
systém má dva vstupy a dva výstupy. Stabilitu bychom mohli analyzovat též rozborem
jednotlivých přenosů. Matice přenosů bude



F11 (p) F12 (p)
−1
F (p) = 
 = C(pI − A) · B =
F21 (p) F22 (p)


1
1 0 0
=

×
(p + 1)(p + 2)(p − 1)
0 0 1


(p − 1)
0
(p + 1)(p − 1)
 0 3 






×


=
0
(p + 1)(p − 1)
0

 2 0 



2(p + 2)
+2
(p + 1)(p + 2)
0 0

 
2
2(p
−
1)
3(p
+
2)(p
−
1)

1

 
(p + 1)(p + 2)
=

=
4
(p + 1)(p + 2)(p − 1)
4
6(p + 2)
(p + 2)(p + 1)(p − 1)

3

(p + 1)


6
(p + 1)(p − 1)
Výsledek rozboru stability je pochopitelně tentýž, výpočet je však nesrovnatelně delší.
Příklad 6.7. Stavový diagram systému 4. řádu je na obr. 6-3. Určete stabilitu systému.
Matematika 2
153
Matice A je


1
0
0 
 0




A= 0
0
1
0 




−1.3 −0.42 −0.1 −0.01
a charakteristická rovnice
det |Ip − A| = p4 + 1.3p3 + 0.42p2 + 0.1p + 0.01 .
Sestavíme Hurwitzovy determinanty
D1 = 1.3 ,
1.3 1 D2 = = 0.45 ,
0.1 0.42
1.3 1
0
D3 = 0.1 0.42 1.3 = 0.0277 .
0 0.01 0.1
Systém je stabilní (jde o stejný systém jako v Příkladu 6.1).
Z rozboru stability ve stavovém prostoru vyplývá, že stabilitu dynamického systému
jednoznačně určuje matice vnitřních zpětných vazeb A. To souhlasí s obecně známou skutečností, že ke vzniku nestability je nutná přítomnost zpětné vazby (jedná se o nestabilitu
stavu, nikoli řešení).
154
Fakulta elektrotechniky a komunikačních technologií VUT v Brně
Literatura
[1] Angot, André: Užitá matematika pro elektrotechnické inženýry, Nakladatelství technické literatury, Praha 1971.
[2] Aramanovič, I.G., Lunc, G. L., El’sgol’c, L. E.: Funkcie komplexnej premennej, Operátorový počet, Teória stability., Alfa Bratislava, SNTL Praha 1973.
[3] Balátě, Jaroslav: Automatické řízení, 2. přeprac. vydání. BEN, Technická litera-tura,
Praha 2004. ISBN 80-7300-148-9.
[4] Davis, Brian: Integral Transform and Their Applications, Texts in Applied Mathematics 41. Springer - New York, Berlin, Heidelberg, Barcelona, Hong Kong, London,
Milan, Paris, Singapure, Tokyo 2002. ISBN 0-387-95314-0.
[5] Davis, A. Wayne: A Mathematical Tudory of Systém Engineering – The Elements.,
John Wiley and Sons, Inc. New York, London, Sydney 1967.
[6] Graf, Urs: Applied Laplace Transforms and z-Transforms for Scientists and Engineers
(A Computational Approach using a Mathematica Package), Birk-häuser Verlag, Basel,
Boston, Berlin 2004. ISBN 3-7643-2427-9.
[7] Jan, Jiří: Číslicová filtrace, analýza a restaurace signálů, VUT v Brně, Nakla-datelství
Vutium 2002. ISBN 80-214-1558-4.
[8] Jan Jiří, Kozumplík Jiří: Systémy, procesy a signály – studijní texty pro obor výpočetní technika a informatika, VUT v Brně, Nakladatelství Vutium 2000. ISBN 80214-1593-2.
[9] Jeffrey Alan: Advanced Engineering Mathematics. Hartcourt Academic Press, San
Diego, San Francisco, New York, Boston, London, Toronto, Sydney, Tokyo.2002. ISBN
0-12-382592-X
[10] Melkes, František, Řezáč, Martin: Matematika 2, 1 vyd. Brno: FEKT VUT multimediální text, 2002. .
[11] Mesarovi, Mihajlo, D., Takahara, Y. : General Systems Theory: a Mathemati-cal
Foundations. Academic Press London, 1975
[12] Pírko, Zdeněk, Veit, Jan: Laplaceova transformace., SNTL Praha, Alfa Bratis-lava
1970.
[13] Smékal, Zdeněk, Sysel, Petr: Signálové procesory. Nakladatelství Sdělovací technika,
Praha 2006. ISBN 80-86645-08-8.
[14] Šebesta, Vladimír: Systémy, procesy a signály I. VUT v Brně, Nakladatelství Vutium
2001. ISBN 80-214-1925-3 .
[15] Vavřín, Petr, Jura, Pavel: Systémy, procesy a signály. VUT v Brně, Naklada-telství
Vutium 1999. ISBN 80-214-1291-7

Podobné dokumenty

Matematika 2 (Biomedicínská technika a bioinformatika)

Matematika 2 (Biomedicínská technika a bioinformatika) Definice 1.7. Nechť n, m, k ∈ N a X ⊆ Rn , Y ⊆ Rm , Z1 , Z2 ⊆ Rk jsou množiny takové, že Z2 ⊆ Z1 . Dále nechť F : Z1 → Y a G : X → Z2 . Potom zobrazení F ◦ G : X → Y přiřazující každému bodu x ∈ X ...

Více

Polovodiče – základní pojmy, vlastnosti. Přechody, diody, jejich

Polovodiče – základní pojmy, vlastnosti. Přechody, diody, jejich Jedná se o komplexní funkci komplexní proměnné p. To znamená, že vstupem je komplexní číslo a výstupem je také komplexní číslo. Zaměříme-li se v komplexní rovině vstupního parametru p pouze na obla...

Více

otevřít

otevřít dalších spermií. Vzniká diploidní zygota. Oplodnění (fertilizace) a další vývoj prvních několik dní probíhá ve vejcovodu. Rýhování vajíčka: První miotické dělení (rýhování) zygoty vede ke vzniku bl...

Více

Elektronika4-1

Elektronika4-1 velké zákmitové napětí nezničilo tranzistor, bývá zkratováno diodou D se sériovým rezistorem R . Velká amplitudy parazitních kmitů by mohla způsobit i otevření tranzistoru, vznikly by zkreslené sin...

Více

snímek EFB

snímek EFB Ph.D. Thesis, Prague 2003. [7] Fexa, P.: Určení nejistot měření při testování dynamických vlastností A/Č systémů. Diplomová práce, ČVUT FEL, katdra měření, Praha 2008.

Více

Pozn´amky k pˇredmˇetu PZS

Pozn´amky k pˇredmˇetu PZS Pro slabě stacionárnı́ posloupnost x[n] definujeme tzv. PSD (Power Spectral Density) funkci Kxx (θ) pomocı́ autokovariančnı́ funkce Cxx [τ ] jako

Více

Deterministické a náhodné signály

Deterministické a náhodné signály optické signály. Pro uchování informace se používají CD a DVD nosiče, paměti USB RAM apod. Skutečné signály jsou vždy náhodné. Pro popis dějů, které probíhají v reálných systémech, je nutné vytvoři...

Více