Co je to aliasing

Transkript

Co je to aliasing
Zvuk včetně komprese
Digitálně = lépe!
Je to ale pravda?
X36PZA ­ Periferní zařízení M. Šnorek
Obsah přednášky
• Digitalizace spojitého signálu.
– Aliasing,
– kvantizační chyba.
• Praktická realizace digitálního zvukového
řetězce.
• Komprese zvuku.
– Aplikace psychoakustické komprese MPEG Audio.
– Digitální telefonie pro „IT people“.
X36PZA ­ Periferní zařízení M. Šnorek
Digitalizace spojitého signálu
X36PZA ­ Periferní zařízení M. Šnorek
Fáze digitalizace spojitých
signálů:
Spojitý v čase i amplitudě
Diskrétní v čase i amplitudě
Diskrétní v čase, spojitý v amplitudě
Otázka: může být i spojitý v čase a diskrétní v amplitudě?
Nakreslete!
X36PZA ­ Periferní zařízení M. Šnorek
Navzorkovaný spojitý signál
X36PZA ­ Periferní zařízení M. Šnorek
Digitálně znamená s chybou!
• Diskretizace/digitalizace způsobí
– změny ve frekvenční oblasti, tzv. aliasing,
– změny v amplitudě, tzv. kvantizační
chybu.
X36PZA ­ Periferní zařízení M. Šnorek
Co je to aliasing (změny ve
frekvencích) I?
D iskretizace
Frekvenční spektrum
analogového signálu
Správné vzorkování
X36PZA ­ Periferní zařízení M. Šnorek
Co je to aliasing (změny ve frekvencích)
II?
D iskretizace
Frekvenční spektrum
analogového signálu
Nesprávné vzorkování
X36PZA ­ Periferní zařízení M. Šnorek
Aliasing se projeví takto
X36PZA ­ Periferní zařízení M. Šnorek
Shannonův vzorkovací teorém
• Signál, jehož spektrum je soustředěno pouze v pásmu kmitočtů <0, fmax> , lze aproximovat řadou funkcí (Fourier).
• Koeficienty řady jsou vzorky signálu rovnoměrně odebírané s kmitočtem vzorkování, který je větší než dvojnásobek maximálního kmitočtu v signálu obsaženém.
• Viz též Nyquist (1928) a Kotelnikov.
X36PZA ­ Periferní zařízení M. Šnorek
Digitálně znamená s chybou!
• Vzorkování způsobí
– změny ve frekvenční oblasti, tzv. aliasing,
– změny v amplitudě, tzv. kvantizační
chybu.
X36PZA ­ Periferní zařízení M. Šnorek
Změny v amplitudě
X36PZA ­ Periferní zařízení M. Šnorek
Kvantizační chyba
X36PZA ­ Periferní zařízení M. Šnorek
Kvantizační chyba
X36PZA ­ Periferní zařízení M. Šnorek
Praktická realizace
digitálního zvukového
řetězce
X36PZA ­ Periferní zařízení M. Šnorek
Co je to zvuk?
• Periodické vlnění prostředí, kterým se
šíří.
• Představují ho spojité změny
akustického tlaku, které přijímáme
• uchem a zpracováváme
• sluchovým ústrojím.
X36PZA ­ Periferní zařízení M. Šnorek
Blokové schéma zvukového
řetězce
Uvidíte později, že většina technologie je digitální!
X36PZA ­ Periferní zařízení M. Šnorek
A/D převodníky - srovnání
X36PZA ­ Periferní zařízení M. Šnorek
A/D převodník
delta)
(sigma-
X36PZA ­ Periferní zařízení M. Šnorek
Sigma-delta koncepce
• Ideální technologie pro VLSI obvody zpracovávající
spojité i diskrétní signály (Mixed signals).
• Posouvají kvantizační šum pomocí
modulátoru do
vyššího frekvenčního pásma,
• realizují převzorkování,
• digitálně filtrují signál decimátorem.
• Umožňují realizaci převodníků s velkým rozlišením.
X36PZA ­ Periferní zařízení M. Šnorek
Jak funguje
modulátor?
X36PZA ­ Periferní zařízení M. Šnorek
1-bitový výstup
modulátoru
X36PZA ­ Periferní zařízení M. Šnorek
Decimátor
• Zpracovává (oslabuje) příliš kategorické
jednobitové reakce sigma-delta modulátoru
na vstupní signál tím, že je „průměruje“,
• čítá po delší časový interval.
• Slouží tedy jako zádrž pro vysoké frekvence
změn výstupu (je tedy vlastně digitálním
dolnopropustným filtrem).
X36PZA ­ Periferní zařízení M. Šnorek
Zaujalo vás to?
• Podrobněji se tomuto tématu věnujeme
v předmětu
• Analogové a číslicové systémy.
X36PZA ­ Periferní zařízení M. Šnorek
Komprese zvuku
X36PZA ­ Periferní zařízení M. Šnorek
Komprese dat
• Objasňovat proč komprimovat by bylo
mlácením prázdné slámy. Každý přece ví, že
…
– 1 s zvuku v CD kvalitě představuje
– 44,1k vzorků po 2x 16 bitech (stereo), tedy
– 176 400 B, tedy více než 172 kB.
• Typy komprese
– ztrátová,
– bezeztrátová.
X36PZA ­ Periferní zařízení M. Šnorek
Psychoakustický (PA)
princip
• Psychoakustický princip se
– opírá o studium vlastností lidského ucha,
– snaží se vytvořit nejdokonalejší model sluchu a
– s tímto poznáním určuje, co bude vlastně
neslyšitelné.
• Pak nevadí, když se příslušná data kompresí
ztratí.
• Autorství: Fraunhoferův Institut, SRN.
X36PZA ­ Periferní zařízení M. Šnorek
Průměrné lidské ucho
Frekvenční rozsah 20 Hz - 20 kHz,
• dynamický rozsah
(ticho - hluk) cca 96
dB.
• Důležitá poznámka:
• víte, že slyšíme
frekvenčně?
X36PZA ­ Periferní zařízení M. Šnorek
Zásady PA komprese
• Frekvenční závislost sluchu, neboli
frekvenční maskování (frequency
masking) a
• časové maskování (temporal
masking).
X36PZA ­ Periferní zařízení M. Šnorek
Frekvenční závislost
sluchu
X36PZA ­ Periferní zařízení M. Šnorek
Obrázek ukazuje ještě
něco důležitějšího!
• Práh slyšitelnosti není frekvenčně nezávislý,
– absolutně nejnižší hodnotu akustického tlaku
ucho rozpozná na frekvenci cca 4 kHz,
• schopnost slyšet závisí na úrovni hlasitosti
– a to dokonce nejen globálně,
– ale i lokálně (viz dále).
• Slyšitelnost se měří v jednotkách sone
(hlasitost 40-ti dB tónu o frekvenci 1 kHz).
X36PZA ­ Periferní zařízení M. Šnorek
Frekvenční maskování
X36PZA ­ Periferní zařízení M. Šnorek
Důsledky frekvenčního
maskování
• Maskování - jeden zvuk je přehlušen jiným,
silnějším.
• Maskování je silnější, jsou-li zvuky na
blízkých frekvencích.
• Práh slyšitelnosti se mění podle toho, co je
právě slyšet.
• Mluvíme o aktuální maskovací šabloně.
X36PZA ­ Periferní zařízení M. Šnorek
Časové maskování
X36PZA ­ Periferní zařízení M. Šnorek
Důsledky časového
maskování
• Ucho má jistou setrvačnost. Důsledkem je,
že po hlasitém zvuku chvíli neslyšíme.
• Zprvu poněkud překvapivý je jev opačný ...
• „Přehlušené“ je ucho déle, než „zahlušené“.
X36PZA ­ Periferní zařízení M. Šnorek
Aplikace psychoakustické
komprese MPEG Audio
X36PZA ­ Periferní zařízení M. Šnorek
Rozdíly podrobněji
• Layer 1
– pouze frekvenční maskování.
• Layer 2
– pracuje se se třemi framy vzorků najednou
(předch., souč., násled.) - 1152 vzorků. Použito i
časové maskování. Koncovka .mp2.
• Layer 3
– nejlepší, redukce vazeb mezi stereokanály,
kompresní poměr 1:6. Koncovka .mp3.
X36PZA ­ Periferní zařízení M. Šnorek
Důležitá poznámka:
• Kodér není standardem specifikován úplně,
• zato dekodér je definován pevně.
• Tato otevřená forma umožňuje budoucí
vylepšení, aniž by bylo nutné měnit
standard.
• Obměňovat je tak možné
– psychoakustický model, popř.
– algoritmus bitové alokace.
X36PZA ­ Periferní zařízení M. Šnorek
Layer 1/2 - princip
kódování
X36PZA ­ Periferní zařízení M. Šnorek
Postup při
kódování
(Layer 1/2)
X36PZA ­ Periferní zařízení M. Šnorek
Layer 1 - dekodér
X36PZA ­ Periferní zařízení M. Šnorek
Kodér Layer 3 (MP3)
Viz dále
X36PZA ­ Periferní zařízení M. Šnorek
Zjemnění frekvenční
filtrace
32 ­>576 subpásem
X36PZA ­ Periferní zařízení M. Šnorek
Layer 3 - dekodér
X36PZA ­ Periferní zařízení M. Šnorek
Princip a funkce oken
Hanningovo okno
X36PZA ­ Periferní zařízení M. Šnorek
Digitální telefonie pro „IT people“
X36PZA ­ Periferní zařízení M. Šnorek
Vývoj standardu GSM
• 1982 sdružení CEPT,výzkumná skupina
Groupe Special M obile,
• Realizace panevropského komunikačního systému na celulární (buňkové) bázi v pásmu 900 MHz.
• Požadavek:
– nízká cena, masivní výroba, miniaturní zařízení,
– kvalitní přenos řeči,
– otevřenost budoucím standardům ISDN,
– podpora rozšířených služeb (SMS).
X36PZA ­ Periferní zařízení M. Šnorek
Celulární (buňková) síť
Frekvence používané v jedné buňce nepoužívá žádná ze sousedních buněk.
BS neboli Base Station ­ základnová stanice
X36PZA ­ Periferní zařízení M. Šnorek
Časový multiplex v GSM
kanál
0 1 2 3 4 5 6 7 0 1 2 3 ... sloty
Poznámka:
Jeden hovor se přenáší kanálem stále ve stejném slotu.
X36PZA ­ Periferní zařízení M. Šnorek
Multirámec, rámec, slot
120 ms trvá multirámec (24 datových rámců)
0 ... 12 ... 25
4,615 ms
řídicí rámec nevyužito
0 1 2 3 4 5 6 7 TDMA rámec (8 slotů)
0,577 ms
3 57 datových bitů 1 26 režijních bitů 1 57 datových bitů 3 8,25
slot
X36PZA ­ Periferní zařízení M. Šnorek
Kolik bitů představuje jeden
hovor?
• V rámci slotu 2 x 57 užitečných bitů,
• v jednom multirámci je tomuto hovoru přidělen
čas 24x, tedy 2 x 57 x 24 = 2736 b.
• Multirámec trvá 120 ms, tedy 2 736 b/120 ms,
což je 22 800 b/s neboli 22,8 kbps.
• Připočítáme-li k tomu ještě režii sítě, která
představuje 11 kbps, představuje jeden hovor
zátěž
33,8 kbps.
X36PZA ­ Periferní zařízení M. Šnorek
Kolik z nich je ale
„hlasových“?
•
•
•
•
Začínáme s 33,8 kbps.
Režie na fungování sítě GSM je cca 11 kbps,
režie na vedení hovoru je cca 9,8 kbps a tedy
na vlastní hovorové bity zbývá jen 13 kbps!
• Jak je GSM využívá? Viz dále.
X36PZA ­ Periferní zařízení M. Šnorek
Řečový signál v čase
4
3
x 10
detail
2
1
0
-1
-2
-3
0
1
2
3
4
5
6
7
8
9
X36PZA ­ Periferní zařízení M. Šnorek
Východiska realizace
• Nepostupuje se, jako v digitalizaci pevných
linek metodou kódování tvaru vlny.
• Ta vyžaduje příliš vysoký přenosový výkon
(64 kbps).
• V GSM musíme vystačit s 13 kbps (RPELTP), nebo
• dokonce jen s 4,8 kbps (CELP).
• Jak je to vůbec možné?
X36PZA ­ Periferní zařízení M. Šnorek
Vložka: digitalizace tvaru
vlny
• Pouze interval mezi dvěma
vzorkováními (125 ms)
máme k dispozici k vyslání
8-mi bitového kódu
digitalizované hodnoty.
• Přenosová kapacita
digitální telefonní linky je
tedy
– 8000 vzorků/s * 8 bitů
= 64 kb/s.
X36PZA ­ Periferní zařízení M. Šnorek
Komprese řeči - Standardy
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
64 kbps µ-law/A-law PCM(CCTT G.711)
64 kbps 7kHz Subband/ADPCM(CCITT G.722)
32 kbps ADPCM(CCITT G.721)
16 kbps Low Delay CELP(CCITT G.728)
13.2 kbps RPE-LTP(GSM 06.10)
13 kbps ACELP(GSM 06.60)
13 kbps QCELP(US CDMA Cellular)
8 kbps QCELP(US CDMA Cellular)
8 kbps VSELP(US TDMA Cellular)
8 kbps CS-ACELP(ITU G.729)
6.7 kbps VSELP(Japan Digital Cellular)
6.4 kbps IMBE(Immarsat Voice Coding Standard)
5.3 & 6.4 kbps True Speech Coder(ITU G.723)
4.8 kbps CELP(Fed. Standard 1016-STU-3)
2.4 kbps LPC(Fed. Standard 1015 LPC-10E)
X36PZA ­ Periferní zařízení M. Šnorek
Návod na účinnější kompresi
• Použijeme stejnou myšlenku, podle které pracují
nejrůznější počítačové akcelerátory:
• kanálem nepřenášíme „bitmapu“ hovoru, ale
• jeho „vektorový“ popis.
• K tomu účelu ale potřebujeme do dekodéru (i
kodéru) vestavět syntezátor řeči založený na
modelu generování signálu hlasovým traktem.
• Tomu se říká kódování zdroje!
X36PZA ­ Periferní zařízení M. Šnorek
Anatomie a funkční komponenty
hlasového ústrojí
Acoustic Filter
X36PZA ­ Periferní zařízení M. Šnorek
Znělé a neznělé hlásky
Znělé hlásky – (n, e …) kvaziperiodický průběh signálu.
Neznělé hlásky – (š, č …) průběh signálu podobný šumu.
X36PZA ­ Periferní zařízení M. Šnorek
Generování znělých a
neznělých hlásek
X36PZA ­ Periferní zařízení M. Šnorek
Model lidského hlasového
ústrojí
X36PZA ­ Periferní zařízení M. Šnorek
Zásady kodéru založeného na
LPC
• Je založen na modelu buzení + filtr (model
hlasového traktu),
• uspokojivě generuje pouze řeč (např. hudbu
neumí),
• pro znělé hlásky je buzen periodickými
impulsy,
• neznělé hlásky budí generátor bílého šumu.
X36PZA ­ Periferní zařízení M. Šnorek
Realizace modelu
• Hlasivky
– dolní propusť 2. řádu s
lomovou frekvencí kolem
100 Hz.
• Hlasový trakt
– kaskáda rezonátorů
(odpovídajících
jednotlivým formantům).
• Vyzařování zvuku
– horní propusť 1. řádu.
X36PZA ­ Periferní zařízení M. Šnorek
Komprese řeči prakticky
• Zpracování a předzpracování dat po 20ms blocích
(160 vzorků po 13b)
– odstranění stejnosměrné složky,
– zvýraznění méně silných vyšších frekvenčních složek
signálu (preemfáze),
– rozdělení do 4 bloků po 40 vzorcích pro RPE analýzu
a LTP analýzu.
• LPC (koeficienty lineární predikce – krátkodobá
predikce) – 8 koeficientů, model hlasového ústrojí –
36 bitů.
X36PZA ­ Periferní zařízení M. Šnorek
Komprese hlasu - schéma
X36PZA ­ Periferní zařízení M. Šnorek
Podrobněji?
• Nová média.
X36PZA ­ Periferní zařízení M. Šnorek

Podobné dokumenty

Lingvistika mysli a těla

Lingvistika mysli a těla patří k potravě, nepřátelům, jedincům vlastního druhu, k možným partnerům. Jak, to záleží na jejich smyslovém aparátu, resp. na tom, co umožňuje jejich nervová soustava. Každý živý tvor kategorizuj...

Více

Časopis pro svobodný život

Časopis pro svobodný život Chci upozornit na to, že troubení v  biblické symbolice není něco, co „troubí“ staletí před zvláštní událostí, nýbrž stojí bezprostředně před událostí, na kterou má upozornit. Proto také věřím, že ...

Více

Otáčkoměr s A/D převodníkem (1635)

Otáčkoměr s A/D převodníkem (1635) začíná generování impulsu na výstupu komparátoru US4A. Dioda D4 umožňuje vybití spouštěcího kondenzátoru C6 při sestupné hraně impulsu na kolektoru T1. Generování impulsu na výstupe US4A trvá, poku...

Více

JPEG2000 – Aneb nemyslete si, že vás mine!

JPEG2000 – Aneb nemyslete si, že vás mine! 4 JPEG (čteno “džeipeg”). Výslovnost vychází z anglické výslovnosti. Původním názvem typu souboru je JFIF (JPEG File Interchange Format). Ustálená zkratka JPEG pro tento typ souboru je zkratka názv...

Více